Numerización

La tarea de numerización se utiliza para convertir datos nominales en numéricos, el método que utiliza la herramienta para numerizar es denominada creación de variables Dummy, esta técnica consiste en representar los datos en 1 y 0, para esto toma un atributo nominal y por cada valor posible que este tenga se crea un nueva variable del tipo "nombre _atributo = Valor _Atributo" entonces, si el nuevo atributo creado tiene ese valor en los datos originales se le asigna un 1 de lo contrario se le asigna 0.

Ejemplo:

Si se tiene un atributo nominal llamado estrato, con posibles valores {bajo,medio,alto} y sus datos de la siguiente manera:

[bajo,alto,bajo,medio,bajo,alto,medio,bajo,bajo,medio,alto]

entonces la representación en variables dummy seria la siguiente:

Variables dummy:

estrato=bajo
estrato=medio
estrato=alto

Los datos quedan representados de la siguiente forma:

estrato=bajo
[1,0,1,0,1,0,0,1,1,0,0]

estrato=medio
[0,0,0,1,0,0,1,0,0,1,0]

estrato=alto
[0,1,0,0,0,1,0,0,0,0,1]