Hola, me llamo Miguel y aquí les traigo este nuevo artículo.
Índice
¿Cómo puede ser útil Tableau con y sin programación?
Tabla de contenido
- Introducción
- Rápido y sencillo
- SQL, R, Python y MATLAB
- Algoritmo de k-medias
- Multifuncional
- Resumen
- Referencias
Introducción
Tableau [2] se está volviendo cada vez más útil para los científicos de datos, ya que incorpora funciones más afinadas. Si no está familiarizado con Tableau, es esencialmente una herramienta que es ampliamente utilizada por varios tipos diferentes de personas en sus respectivas carreras. Puede visualizar datos y compartirlos con otros para que pueda ver cómo es beneficioso no solo para un científico de datos, sino también para un gerente de producto, un desarrollador de SQL, un analista de datos, un analista de inteligencia empresarial y muchos más; la lista continúa y en. Pero, la verdadera pregunta es, ¿Qué hace que esta herramienta sea específicamente útil para los científicos de datos? A continuación, discutiré algunos beneficios generales que los científicos de datos pueden obtener, pero también algunas herramientas de ciencia de datos más contorneadas y los beneficios de utilizar Tableau.
Rápido y sencillo
Como beneficio más amplio, Tableau puede ser bastante rápido y fácil de usar. Si tiene un archivo CSV listo, puede crear un panel en minutos. Este tablero incluirá varias hojas de diferentes visualizaciones, ya sea un mapa, gráfico o tabla (etc.). Básicamente, puede arrastrar y soltar campos en su hoja y seleccionar una visualización; realmente es tan simple como eso. Ahora hablemos de cómo podemos incorporar algunos lenguajes de programación.
SQL, R, Python y MATLAB
Puede elegir un archivo CSV estático o una conexión en vivo a través de una base de datos SQL donde actualiza la misma consulta para actualizar sus datos y sus respectivas hojas, paneles e historias conectadas a ella.
Como científico de datos, se familiarizará con SQL o lenguaje de consulta estructurado. Para desarrollar su conjunto de datos para su modelo de ciencia de datos, necesitará realizar consultas desde una base de datos usando SQL (lo más probable). Tableau facilita la conexión a su base de datos SQL actual para que pueda realizar la consulta dentro de Tableau y luego desarrollar informes desde allí. Para la ciencia de datos, esta función puede ser útil cuando necesita hacer lo siguiente:
- visualizar análisis de datos exploratorios
- visualizar las métricas del modelo
Integraciones
Integración R
Puede importar paquetes R así como sus bibliotecas asociadas. Más potente, también puede importar sus modelos de datos guardados en Tableau.
Python
También conocido como TabPy, esta integración de Tableau permite a los usuarios utilizar un marco que puede ejecutar código Python de forma remota. Algunos de los usos principales son para limpieza de datos y algoritmos predictivos (y el uso de campos calculados). Aquí hay un enlace útil para TabPy [3]:
MATLAB
Para implementar modelos de MATLAB, puede utilizar esta integración. Incluye el uso en conocimientos predictivos, así como en el procesamiento previo de datos.
Por supuesto, todas estas integraciones y lenguajes se pueden utilizar para el análisis de datos como parte de su proceso de ciencia de datos. Además, los resultados que desarrolle a partir de sus modelos predictivos se pueden mostrar en Tableau.
Algoritmo de k-medias
Puede usar algoritmos de aprendizaje automático de Tableau. Este algoritmo de agrupación también se conoce como k-medias. La idea es encontrar patrones en sus datos agrupando datos similares a partir de sus características. También desea asegurarse de que esos mismos grupos sean diferentes de otros grupos. Los términos técnicos para esta agrupación incluyen suma de cuadrados dentro del grupo (WGSS) y suma de cuadrados entre grupos (BGSS). Todo lo que tiene que hacer en Tableau es cargar sus datos, luego elegir sus columnas y filas, mientras aísla las variables con las que desea construir su agrupación. Puede crear automáticamente clústeres basados en métricas o puede forzar manualmente la cantidad de clústeres.
Dado que Tableau se centra en la visualización, sus clústeres estarán bien etiquetados, serán interactivos y coloreados para facilitar la visualización y la comprensión.
El beneficio de utilizar este popular algoritmo en Tableau es que lo realiza con bastante rapidez y no requiere ningún código de su parte.
Aquí hay un vínculo que describe la agrupación en clústeres en Tableau con más detalle. [4]:
Multifuncional
Quizás el beneficio más importante de Tableau para científicos de datos es que puede usar la herramienta para su función principal: compartir datos visualmente. Como científico de datos, puede encontrar diferentes tipos de personas en diferentes tipos de departamentos dentro de su empresa. Es su trabajo poder explicar su complejo algoritmo de aprendizaje automático y sus respectivos resultados a los demás. Una de las mejores formas de hacerlo es visualizarlo. Puede usar cualquiera de los gráficos para describir los resultados de su modelo, ya sea que haya realizado mejoras en la empresa, qué grupos de sus datos se desempeñaron mejor, etc. Hay innumerables casos de uso de Tableau en la ciencia de datos. Estas son algunas de las ventajas de Tableau en la ciencia de datos.
- Mucha gente usa Tableau, por lo que compartir visualizaciones será fácil
- muchas empresas, por lo que es bueno saber en general
- puede convertir su modelo complejo en un visual de fácil lectura
Resumen
Como puede ver, Tableau ofrece varios beneficios principales para muchas funciones diferentes, pero también para los científicos de datos. Ya sea que desee simplemente arrastrar y soltar sus datos para crear análisis de datos exploratorios simples o crear un modelo desde cero dentro de Tableau, sirve como una herramienta integral para todo el proceso de ciencia de datos.
En resumen, aquí están los beneficios presentados y resumidos:
Quick and SimpleSQL, R, Python, and MATLABk-means AlgorithmCross-functional
¡Gracias por leer! Lo aprecio. No dude en comentar a continuación y escribir sobre su experiencia con Tableau como cualquier usuario o como científico de datos.
Referencias
[1] TABLEAU SOFTWARE, LLC, UNA EMPRESA DE SALESFORCE, TabPy, (2003-2020)
[2] TABLEAU SOFTWARE, LLC, UNA EMPRESA DE SALESFORCE, Encontrar clústeres en datos, (2003-2020)
Añadir comentario