Hola, soy Luis y hoy les traigo otro artículo. Hoy, Spark SQL es uno de los componentes más valiosos de Apache Spark. Impulsa tanto las consultas SQL como la API de DataFrame. En su esencia, el Optimizador de catalizador, que aprovecha las funciones avanzadas de Scala para crear un optimizador de consultas extensible y extremadamente potente. En [...]
Leer másCiencia de datos
Hola, me llamo Luis y esta vez les traigo este artículo. Si trabaja como desarrollador de Python, analista de datos o científico de datos para cualquier organización, entonces es muy importante que sepa cómo jugar con Listas y obtener la información solicitada, como índices o elementos coincidentes. In Python, Lists store an ordered collection of [...]
Leer másHola, me llamo Miguel y en esta ocasión les traigo otro tutorial. GUI para analizar el marco de datos de Pandas El análisis exploratorio de datos es la parte más crucial, para empezar, siempre que trabajemos con un conjunto de datos. Nos permite analizar los datos y explorar los hallazgos iniciales a partir de datos como cuántas filas y columnas [...]
Leer másHola, les saluda Luis y esta vez les traigo este nuevo tutorial. Productividad de audio Escuchamos música, escuchamos podcasts, videos de YouTube, incluso pájaros cantando. Escuchar es una gran parte de nuestras vidas y, sin embargo, las herramientas para utilizar este sentido como mecanismo para aumentar nuestra productividad parecen ser escasas [...]
Leer másMuy buenas, me llamo Miguel y hoy les traigo otro post. Cómo ordenar listas, tuplas, cadenas y diccionarios en Python En este tutorial, veremos cómo ordenar iterables, como listas, tuplas, cadenas y diccionarios, según diferentes criterios. Ordenar una lista Hay dos formas de ordenar una lista. Podemos usar el método sort() o la función sorted() [...]
Leer másHola, me llamo Miguel y hoy les traigo otro artículo. Escribir aplicaciones Java para recopilar datos de Twitter y visualizarlos en un gráfico En este artículo, crearemos un proyecto de ciencia de datos. Recopilamos datos de Twitter porque tiene una enorme cantidad de datos y nos permite obtenerlos. Preferimos Java porque es un lenguaje compilado [...]
Leer másMuy buenas, soy Luis y para hoy les traigo un post. Entonces, como su nombre lo indica, la ciencia de datos se trata de datos, procesándolos con métodos científicos, algoritmos, etc. Incluye muchos conceptos y teorías como Estadística, Probabilidad, Cálculo avanzado, Ciencias de la computación, Ciencias de la información, etc. Antes de continuar [...]
Leer másMuy buenas, les saluda Luis y aquí les traigo otro tutorial. Predecir los precios de los alimentos mediante regresión lineal ¿Qué es la ciencia de datos? La ciencia de datos es un campo de estudio interdisciplinario que se centra en el uso del proceso científico para analizar datos sin procesar y aprovechar el conocimiento adquirido al analizar [...]
Leer másMuy buenas, les saluda Miguel y para hoy les traigo este tutorial. Técnicas avanzadas de SQL Parte 1: embellezca sus datos con declaraciones de casos Los datos reales son variados y desordenados. Si obtiene sus datos de una base de datos usando SQL, puede limpiar esos datos antes de que lleguen a usted. Esta técnica facilita el análisis [...]
Leer másHola, me llamo Luis y esta vez les traigo este nuevo post. Es decir, cómo sacarle el máximo partido a la plataforma y hackearla. Google Colab (abreviatura de Colaboratory) es una plataforma en línea para ciencia de datos alojada por Google. Consiste en un cuaderno en línea que se ejecuta en la nube, sin utilizar recursos en su máquina local. Sin [...]
Leer más