En la entrada anterior sobre Tableau os comentaba las características principales del mismo. En esta ocasión vamos a realizar nuestros primeros pasos con esta herramienta, en concreto trabajaremos con Tableau Desktop. Recordad que podéis hacer uso de una versión de prueba si accedéis a este enlace (disponible para Windows y Mac). Antes de manejarnos por la herramienta voy a presentaros algunos conceptos básicos que nos van a ser de utilidad para comprender mejor el funcionamiento de Tableau. ¡Comencemos!
Para empezar, voy a dedicarle, nuevamente, unas líneas al lenguaje de consulta VizQL, considerado uno de los componentes más potentes de este software. Y es que a través de este lenguaje podemos generar consultas SQL sin necesidad de escribirlas, todo ello utilizando su interfaz gráfica. Es más, podremos definir tamaños, formas, colores y localizaciones espaciales, entre otros, para nuestras gráficas. En definitiva, no será necesario conocer o entender SQL para hacer uso de la misma. No obstante, para aquellos usuarios expertos que necesitaran conocer estas acciones, para por ejemplo mejorar la estructura de la base de datos o su indexación, deciros que es posible consultar los logs de Tableau para averiguarlo.
Como os comentaba en la entrada de introducción, Tableau se encarga de transformar VizQL en consultas optimizadas para que puedan ser ejecutadas de forma nativa por el motor de datos de origen. Importante saber también que realizará consultas sobre las fuentes de datos cuando detecte cambios que impliquen refrescar la visualización. En el resto de casos utiliza los resultados agregados que ha ido almacenando en una caché local, para agilizar la respuesta.
Por otra parte me gustaría destacar los tipos de conexiones a datos que se proporciona la herramienta: extract connection y live connection. ¿En qué se diferencian? Es muy sencillo. Cuando especificamos una conexión de tipo live, Tableau realiza las consultas se realizan directamente contra la fuente de datos (nuestra base de datos) o hace uso de la caché local si fuera posible. Por otro lado, cuando hablamos de una conexión de tipo extract, lo que estamos indicando es que queremos trabajar con un extracto (rango) de datos pertenecientes a la fuente, que es almacenado en un fichero TDE (Tableau Data Extract). Además, con esta opción podremos aplicar filtros para limitar el conjunto de datos a usar. También podemos verlos como copias sobre las que trabajar cuando no se pueda acceder al servidor de la base de datos. ¿Y cómo generamos ese fichero TDE? Puede crearse a través del propio Tableau – haciendo uso de su API – o programáticamente empleando lenguajes como Python o C/C++.
Sabiendo esto, paso a iniciaros en el manejo de la herramienta. La primera pantalla que nos sale al iniciar Tableau (imagen de la izquierda) nos permite realizar la conexión a los datos. Tras esto (en la ventana de la derecha), podremos elegir la tabla (o tablas) con la que trabajar, arrastrándola al área de trabajo correspondiente. La información relativa a la misma nos será mostrada en esa misma ventana, lo que son sus atributos y las distintas tuplas que contiene. Si os fijáis, en la parte superior derecha de esta ventana tenemos los dos tipos de conexión a los datos: live (en vivo) y extract (extraer). Si escogemos esta última opción podremos indicar el rango con la opción de filtros que aparece más a la izquierda.
Desde esta ventana podremos también cambiar nombres de atributos, dividir los campos en función del contenido o modificar sus tipos, entre otras operaciones. Cada atributo tiene asociado un menú desplegable con las diferentes opciones. Una vez hemos acabado aquí, hacemos click en la Hoja 1 (remarcada en naranja en la parte baja de la imagen de la derecha) para manipular los datos y empezar a crear nuestros análisis.
Esta es la interfaz con la que realmente vamos a trabajar. Los puntos marcados nos indican lo siguiente:
- Este menú nos ayuda a utilizar una gran variedad de funcionalidades.
- Barra de herramientas con las funciones más comunes.
- Zona de trabajo con dos pestañas para un acceso rápido y sencillo a datos y analíticas.
- Zona donde se pueden arrastrar o eliminar campos de las tablas que están organizados en la zona del punto 3.
- Zona canvas donde Tableau genera la visualización basada en los campos utilizados en el área del punto 4.
- Accesos para creación rápida de nuevas hojas, dashboards e historias.
- Barra de estados que nos da información de la vista actual.
Como podéis ver, en la zona 3 están los atributos de la tabla clasificados en medidas (en verde) y dimensiones (azul). ¿Qué representan las medidas y dimensiones en Tableau? Las medidas son valores agregados, es decir, que vamos a poder sumar, contar, obtener la media, el máximo, mínimo, etc. Por su parte, las dimensiones nos van a servir para indicar el nivel de detalle a la hora de aplicar las medidas. Es decir, utilizando el ejemplo anterior, tenemos como medida el presupuesto de ventas (budget sales). Si escogemos la dimensión mercado (market) lo que estamos haciendo es mostrar el presupuesto de ventas por mercado. Evidentemente, utilizaremos tantas medidas y dimensiones como creamos necesarias para realizar nuestro análisis. A continuación os muestro un ejemplo.
En la zona 4 veis que tenemos una sección denotada como «marcas». Se tratan de filtros y opciones que podemos aplicar sobre los datos de nuestra visualización. Para utilizarlos basta con arrastrar hasta la opción escogida (color, tamaño, etiquetas, etc.) el atributo que se considere oportuno. Por ejemplo, si arrastramos la dimensión país (country) a la marca de color inmediatamente nuestra gráfica se actualiza para mostrar los datos clasificados, y coloreados, por países.
Y con esto podremos empezar a trabajar con Tableau. Ahora que hemos ampliado conocimientos, experimentar con la herramienta. En el siguiente artículo de Tableau hablaremos de conceptos como dashboards e historias y veremos cómo utilizar esta herramienta con Google Analytics.