Transponer de columnas a filas en Alteryx

Muchos ficheros de datos disponibles en internet están estructurados en múltiples columnas. No obstante, si llevas ya un tiempo trabajando con Tableau, sabrás que en muchas ocasiones es preferible trabajar con menos columnas y más filas por la forma en la que Tableau agrega los datos.

Un buen ejemplo de webs con datos en esta forma son el INE o Eurostat. Donde es muy habitual encontrarnos con archivos que podemos descargar con esta estructura:

Pero como comentaba, muchas veces no es la forma idónea de trabajar con Tableau. Probablemente no queremos tener los distintos grupos de edad en distintas columnas, y preferimos tener una única columna con el número de habitantes y otra columna con el grupo de edad. Además por la forma en la que Tableau agrega los datos, posiblemente ni siquiera necesitemos la columna de Total. Esto podríamos hacerlo en Tableau fácilmente con la función “Pivot” (pivotar). Pero veamos como podemos hacerlo de forma muy sencilla en Alteryx.

Preparación inicial

Tras descargar el fichero en formato Excel, vemos que necesitamos cierta preparación inicial ya que las primeras filas no contienen datos que necesitamos:

Así que primero utilizará la herramienta Sample como en su día expliqué para filtrar las primeras filas con la ventaja habitual de Alteryx, que es la de no modificar nuestro fichero inicial. A continuación utilizaré también la herramienta Dynamic Rename para tomar la primera fila de datos restante como la cabecera de las columnas. Con estas dos herramientas ya tendríamos nuestro fichero de datos listo para el siguiente paso.

Por último utilizaremos la herramienta select para no incluir de aquí en adelante la columna del Total. Ya que para calcularlo no tendremos luego que agregar nuestra medida de población en Tableau.

Transpose

¿Cuál es a nuestro objetivo? Que en lugar de tener una columna para cada grupo de edad, podamos tener una sola columna en la que se indique el grupo de edad concreto, y otra columna con el valor de la población. Es decir, que nuestro fichero tenga solo 3 columnas: Región, Grupo de Edad y Población. Esa es precisamente la función de Transpose: Cambiar la orientación de los datos de vertical a horizontal.

La herramienta Transpose tiene 2 aspecto a configurar. Uno el de “Key Fields” en el cual marcamos los campos o columnas que queramos mantener con la misma orientación. El segundo “Data Fields” donde marcamos las columnas que queremos pivotar. Es decir aquellas que queremos cambiar la orientación. Lo que Alteryx hará será multiplicar el número de filas de nuestra base de datos por el número de columnas que tengamos, reduciendo el número de columnas. En nuestro caso, para cada valor de la variable GEO/AGE tendremos no una fila, sino seis, una para grupo de edad (recordad que hemos filtrado la columna con el Total).

Esa es toda la configuración necesaria en la herramienta. Y este es el resultado una vez ejecutamos el workflow:

Ahora tenemos tan solo 3 columnas en nuestro fichero de datos. Y como vemos en el workflow, hemos pasado de 1.884 filas iniciales a 11.304 filas. 6 veces más ya que teníamos 6 columnas que hemos cambiado la orientación (cada columna de edad salvo el Total) con una única variable a mantener con su orientación original (la región).

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *