Novedades en Tableau 10 (I): Análisis cluster (clustering)

Tal vez sea una de las novedades que la comunidad de Tableau esperaba con más ganas después de que se anunciara en una de las últimas conferencias: la posibilidad de realizar un análisis cluster de forma nativa en Tableau sin necesidad de utilizar ninguna aplicación de terceros. Pero ¿en qué consiste un análisis cluster? básicamente se trata de un método de estadística multivariante que clasifica un conjunto de elementos (datos) en un número reducido de grupos (clusters) de forma que los elementos que pertenezcan a un mismo grupo sean muy similares entre sí y diferentes de los elementos de otro grupo. El método utilizado por Tableau para realizar el análisis cluster es el de k-medias (k-means), validando el número de clusters por medio del índice …

La visualización como elemento esencial tras el análisis de datos: 11 libros recomendados

Ayer vi un tweet de Gemma Muñoz haciendo referencia a este post suyo con sus libros recomendados sobre analítica y datos. Varios de ellos ya los conocía al menos de oídas y otros han sido un interesante descubrimiento ya que tienen bastante buena pinta. Especialmente porque no es fácil encontrar buenos libros sobre análisis predictivo y análisis de datos. Por mi experiencia, la mayoría o son muy generales sin aportar demasiado valor (enfocados a lectores que quieren saber “de que va esto”) o son tan específicos que tratan sobre cómo utilizar una versión concreta de un software específico (sin tratar de explicar la lógica detrás de un tipo concreto de análisis: por qué, para qué, etc.). De hecho tengo pensando comprar en los próximos dias varios …

Ya está aquí Tableau 10

    Ayer por fin Tableau lanzó Tableau 10. Posiblemente una de las versiones más esperadas de Tableau y con algunas novedades más que interesantes, entre las que se encuentran: Filtros aplicables a distintas bases de datos (para mi la gran novedad, que facilitará mucho el trabajo en el día a día evitando tener que realizar la misma función a través de parámetros, con las limitaciones que esto conllevaba). Análisis cluster incluido de forma nativa. Buscador de elementos (básicamente se trata de una casilla de búsqueda donde podremos buscar elementos en una visualización. Especialmente útil cuando queremos resaltar un elemento concreto en diagramas de dispersión o visualizaciones con un número elevado de datos) Personalización de territorios en mapas. Posibilidad de utilizar grupos en cálculos personalizados. …

Cómo usar en Tableau datos de latitud y longitud para mapear datos

Una de las funciones que más sorprenden y llaman la atención cuando se empieza a utilizar Tableau es la capacidad de visualizar datos geolocalizados a través de mapas. En muchas ocasiones, Tableau reconoce automáticamente datos numéricos de latitud y longitud automáticamente siendo increiblemente sencillo crear un mapa con nuestros datos. No obstante, Tableau no siempre reconoce automáticamente una variable como latitud o longitud si no tiene el formato adecuado (numérico) y está etiquetado de forma correcta (latitud y longitud), pero podemos modificar rápidamente las preferencias de dichos campos para que Tableau los utilice como datos que debe tratar como datos geográficos. De la web de datos abiertos de la Comunidad de Madrid he descargado un fichero con datos de aparcamientos públicos en el municipio de …

Cómo leer múltiples archivos a la vez con Alteryx

El primer paso cuando queremos trabajar con una base de datos en Alteryx es siempre utilizar la herramienta Input para leer nuestra base de datos. A través de dicha herramienta elegimos el archivo con el que queramos trabajar y podemos entonces comenzar a preparar o analizar nuestro fichero. Pero, ¿qué ocurre si no tenemos varios archivos con la misma estrucutra en una carpeta o incluso en varias subcarpetas? Imaginemos por ejemplo que queremos leer a la vez una serie de archivos y no uno solo, como se por ejemplo en la siguiente imagen, ya que nuestros datos están separados en distintos ficheros, y no integrados en uno solo. La primera opción sería utilizar tantas herramientas Input como archivos queramos leer y a continuación utilizar la herramienta Union para …

Comparar una categoria con el total usando FIXED LOD

Una de las novedades más útiles de las últimas versiones de Tableau, en concreto en al versión 9.0, fue la introducción de las expresiones de nivel de detalle (LOD por sus siglas en inglés). De forma resumida se trata de un tipo de expresiones que permiten realizar cálculos agregados en un nivel de detalle distinto al que tenemos en nuestra visualización. Escribiré más sobre LOD y ejemplos de como y para que utilizar este tipo de expresiones en futuros posts, pero para empezar veamos un ejemplo lo más sencillo posible, Imaginemos que queremos visualizar el porcentaje de ventas por categoría de producto en una región concreta, y a la vez comparar dicho porcentaje con el porcentaje por categoría del total, de forma que podamos ver …

Preparar y visualizar datos de encuestas con Tableau y Alteryx

Tras 9 años trabajando en institutos de investigación de mercados, una de las primeras ideas que me vino a la cabeza cuando descubrí Tableau fue sus posibilidades a la hora de visualizar datos de encuestas. Es cierto que por la forma que tiene Tableau de tratar los datos, la estructura de los ficheros de encuestas con los que habitualmente se trabaja no es la más idónea. Los ficheros de encuestas normalmente cuentan con un registro (una fila) para cada encuestado y una dimensión (columna) para cada una de las variables o preguntas del cuestionario. Es decir, se trabaja con ficheros que habitualmente tienen muchas columnas, mientras que en Tableau es más conveniente tener ficheros con un gran número de registros (filas) y menor número columnas. …

El proceso tras una Viz

Pocos temas son tan amplios como el que ha elegido Tableau para su primer concurso Iron Viz de este año: la comida. Precisamente por esa inmensa amplitud cuando vi por primera vez el post anunciando el concurso pensé “no va a ser nada fácil”. Y efectivamente no lo ha sido, ya que podríamos hablar de la producción, el transporte, consumo, precio, disponibilidad, hábitos… a la escala global o local y de forma general o para productos concretos. Por eso para este post que acompaña a mi visualización para participar en el concurso quería no sólo hablar de la visualización en si, si no de todo el proceso de creación de la visualización y especialmente en los cuatro principales retos del mismo: la elección del tema …