Gráficos de línea con inicio en base cero

Al analizar series temporales nos podemos encontrar con ciertas dificultades si el rango temporal es muy diferente y queremos hacer comparaciones entre dos elementos. Un caso muy habitual de este tipo es analizar la evolución de un fenómeno desde su inicio (o desde el inicio desde que disponemos datos). Este es el problema que me encontré para realizar la siguiente visualización: comparar la evolución del número de víctimas mortales de ETA a lo largo de su historia y la evolución de victimas mortales por violencia de género desde que se disponen de datos (haz click en la imagen para abrir la visualización).

Problema inicial

La Fundación Víctimas del Terrorismo ofrece en su página web un listado completo de las personas que han muerto a manos de bandas terroristas en España. En el caso de la banda ETA, ofrece un listado completo de personas muertas a manos de ETA: la primera en junio de 1968 y la última en marzo de 2010. En total 823 personas.

Por otro lado, la Delegación del Gobierno para la Violencia de Género ofrece también en su página web datos de personas muertas a manos de su pareja o ex pareja desde enero de 2003 a diciembre de 2016.

La serie temporal de ambas series de datos es muy distinta. Contamos con más de 40 años de datos en el caso de ETA y con tan sólo 14 años en el caso de la violencia de género ¿Cómo podemos hacernos una idea de cómo han evolucionado ambos fenómenos?

Primeros pasos

Lo primero es unir ambos ficheros de datos en un archivo excel con el mes y el año en el que ocurre un asesinato, el número de víctimas y el tipo de víctima (de ETA o de la violencia de género). A continuación, si arrastramos el mes de nuestro campo de fecha a columnas como un campo continuo, la suma de víctimas a filas y el tipo de víctima a color, obtendríamos algo así:

Nada demasiado útil. Aunque si se observa un mayor número de víctimas mortales de ETA a finales de los 70 y principios de los 80 y junio de 1987 como el mes con más víctimas de toda la serie histórica. Podríamos también utilizar el total acumulado (running total) en lugar de la suma haciendo click derecho en la suma de víctimas y utilizando los cálculos rápidos de tabla (quick table calculations).

El acumulado nos da información más interesante. Se confirma lo que intuíamos antes: un reducido numero de víctimas por parte de ETA hasta mediados de los 70, aumentando luego con más intensidad y una reducción a partir sobre todo del año 2000. También vemos que en total, el número de víctimas por violencia de género es mayor al final del periodo para el que disponemos datos. Aún así, resulta complicado responder a algunas preguntas que podrían ser interesantes. Por ejemplo: ¿cómo han evolucionado el número de víctimas desde el primer mes del que disponemos datos en cada serie?

La función INDEX

INDEX es una de las funciones disponibles en Tableau que creará un índice en base a la partición o la variable que seleccionemos. De este modo, podremos tener un índice de los meses que comience de nuevo para cada uno de los tipos de víctima.

En primer lugar arrastramos los meses desde columnas a la sección de detalle.

A continuación, hacemos doble click en columnas y escribiremos INDEX() para utilizar la función index en columnas.

Vemos que en el índice todo tiene valor 1, ya que tenemos que especificar como queremos que se calcule nuestro índice. Para ello basta con hacer click derecho en el índice y seleccionar “Compute Using” y seleccionar nuestra variable de fecha.

Ahora nuestro índice setá funcionando como queremos. Tenemos datos de víctimas de ETA desde mediados de 1968 hasta mediados de 2010. Algo más de 40 años, que multiplicado por 12 meses al año son unos 500 meses. Mientras que en el caso de las víctimas por violencia de género tenemos 14 años de datos, 168 meses de datos. Vemos que por tanto ahora tenemos valores comenzando en el valor índice 1 (el primer mes para el que contamos datos para cada tipo de víctima) hasta el último valor del índice de cada tipo de víctima: 502 en el caso de ETA y 168 en el caso de la violencia de género.

No obstante nuestro total acumulado no está funcionando. Tenemos que, tal como hemos hecho con el índice, indicar cómo queremos que se calcule el total acumulado. Que al igual que el índice queremos que se calcule en base a nuestra fecha.

Últimos ajustes

Ahora ya tenemos nuestra visualización.

Tan solo tenemos que cambiar el tipo de marca de automático a líneas, y listo. Podemos hacer nuestra comparación con el mismo punto de inicio para ambas series temporales.

Ahora podemos ver más fácilmente que en 100 meses hubo casi 600 víctimas de la violencia de género. Mientras que en sus primeros 100 meses hubo menos de 100 víctimas de ETA. Y que en los 14 años de datos de violencia de género, el número de víctimas ha sido mayor que en los 40 años de historia de ETA. Así como que el periodo entre los meses 125 y 150 desde el primer asesinato de ETA, la pendiente deel número de muertos es similar a la pendiente de víctimas de violencia de género en los últimos 14 años.

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *