Ciencia de datos

Ejecución de consultas adaptables de Apache Spark 3.0

Hola, soy Luis y hoy les traigo otro artículo. Hoy, Spark SQL es uno de los componentes más valiosos de Apache Spark. Impulsa tanto las consultas SQL como la API de DataFrame. En su esencia, el Optimizador de catalizador, que aprovecha las funciones avanzadas de Scala para crear un optimizador de consultas extensible y extremadamente potente. En [...]

Leer más

Python: encontrar el índice de un elemento en una lista

Hola, me llamo Luis y esta vez les traigo este artículo. Si trabaja como desarrollador de Python, analista de datos o científico de datos para cualquier organización, entonces es muy importante que sepa cómo jugar con Listas y obtener la información solicitada, como índices o elementos coincidentes. In Python, Lists store an ordered collection of [...]

Leer más

Análisis de datos exploratorios usando PandasGUI

Hola, me llamo Miguel y en esta ocasión les traigo otro tutorial. GUI para analizar el marco de datos de Pandas El análisis exploratorio de datos es la parte más crucial, para empezar, siempre que trabajemos con un conjunto de datos. Nos permite analizar los datos y explorar los hallazgos iniciales a partir de datos como cuántas filas y columnas [...]

Leer más

De Google Calendar a audio con Python

Hola, les saluda Luis y esta vez les traigo este nuevo tutorial. Productividad de audio Escuchamos música, escuchamos podcasts, videos de YouTube, incluso pájaros cantando. Escuchar es una gran parte de nuestras vidas y, sin embargo, las herramientas para utilizar este sentido como mecanismo para aumentar nuestra productividad parecen ser escasas [...]

Leer más

La guía definitiva para ordenar en Python

Muy buenas, me llamo Miguel y hoy les traigo otro post. Cómo ordenar listas, tuplas, cadenas y diccionarios en Python En este tutorial, veremos cómo ordenar iterables, como listas, tuplas, cadenas y diccionarios, según diferentes criterios. Ordenar una lista Hay dos formas de ordenar una lista. Podemos usar el método sort() o la función sorted() [...]

Leer más

Construyendo un gráfico de red a partir de datos de Twitter

Hola, me llamo Miguel y hoy les traigo otro artículo. Escribir aplicaciones Java para recopilar datos de Twitter y visualizarlos en un gráfico En este artículo, crearemos un proyecto de ciencia de datos. Recopilamos datos de Twitter porque tiene una enorme cantidad de datos y nos permite obtenerlos. Preferimos Java porque es un lenguaje compilado [...]

Leer más

¿Cómo empezar con ciencia de datos / aprendizaje automático?

Muy buenas, soy Luis y para hoy les traigo un post. Entonces, como su nombre lo indica, la ciencia de datos se trata de datos, procesándolos con métodos científicos, algoritmos, etc. Incluye muchos conceptos y teorías como Estadística, Probabilidad, Cálculo avanzado, Ciencias de la computación, Ciencias de la información, etc. Antes de continuar [...]

Leer más

Introducción a la ciencia de datos y el aprendizaje automático

Muy buenas, les saluda Luis y aquí les traigo otro tutorial. Predecir los precios de los alimentos mediante regresión lineal ¿Qué es la ciencia de datos? La ciencia de datos es un campo de estudio interdisciplinario que se centra en el uso del proceso científico para analizar datos sin procesar y aprovechar el conocimiento adquirido al analizar [...]

Leer más

Hola Data, ¿hubo Sharknados en 2020?

Muy buenas, les saluda Miguel y para hoy les traigo este tutorial. Técnicas avanzadas de SQL Parte 1: embellezca sus datos con declaraciones de casos Los datos reales son variados y desordenados. Si obtiene sus datos de una base de datos usando SQL, puede limpiar esos datos antes de que lleguen a usted. Esta técnica facilita el análisis [...]

Leer más

Cómo migrar sus proyectos a Google Colab

Hola, me llamo Luis y esta vez les traigo este nuevo post. Es decir, cómo sacarle el máximo partido a la plataforma y hackearla. Google Colab (abreviatura de Colaboratory) es una plataforma en línea para ciencia de datos alojada por Google. Consiste en un cuaderno en línea que se ejecuta en la nube, sin utilizar recursos en su máquina local. Sin [...]

Leer más