Muy buenas, les saluda Miguel y esta vez les traigo un nuevo post.
Esta serie de artículos consta de 4 partes principales y este artículo es «¿Qué es la ciencia de datos?» es el tercero de la serie.
A tener en cuenta: normalmente utilizaré algunas palabras abreviadas a continuación:
- Ciencia de datos – DS
- Inteligencia artificial – IA
- Aprendizaje automático: aprendizaje automático
- Big Data – BD
- Aprendizaje profundo – DL
Índice
Hablemos del objetivo de DS
¡Entender el pasado con datos!
Mientras hablaba de los objetivos de DS, dije que queremos obtener información útil sobre el pasado a partir de los datos. Abramos esto un poco y veamos cómo podemos encontrar información histórica útil a partir de los datos:
Por ejemplo, en su empresa, se le han proporcionado datos sobre el número de ventas pasadas y se le ha pedido que estudie cómo los movimientos del tipo de cambio afectan las ventas. Vamos a enumerar la ruta que seguirá aproximadamente de la siguiente manera:
- Examinará los datos de ventas e intentará solucionar los problemas que identificó en los datos.
- Recopilarás datos que consideres útiles en tu análisis. Por ejemplo, si bien la moneda afecta el volumen de ventas, lo hace a través de varios canales:
I) Afecta sus ventas como afecta el poder adquisitivo de las personas.
II) Afecta la demanda de sus productos ya que afecta los precios de sus productos debido a los insumos importados.
III) Afecta el uso del crédito ya que afecta los intereses y por lo tanto afecta la demanda de sus productos, etc. En resumen, para controlar los canales de influencia anteriores en su análisis, debe considerar variables como el Ingreso Nacional Bruto, el interés de los préstamos de consumo y el Califique la transferencia de sus productos en su análisis y prepare los datos relevantes. Tenga en cuenta que tener en cuenta todos estos efectos requiere no solo un mero conocimiento estadístico, sino también un conocimiento de campo de su campo.
3. Después de los pasos anteriores, aplicó un «flujo de trabajo de análisis de datos» clásico y llegó a los resultados del efecto de los tipos de cambio en su volumen de ventas.
El hallazgo que ha logrado es invaluable para su empresa. Ha hecho un trabajo para darle sentido al pasado, pero ha presentado uno de los pilares importantes de su empresa al formular la estrategia de intercambio a seguir en el futuro.
El ejemplo anterior es uno de esos en los que el estudio del pasado tiene como objetivo iluminar el futuro. Además, hay cosas que deben hacerse solo para comprender el pasado. Por ejemplo, midiendo el impacto del desarrollo del comercio atlántico en el siglo XV en el comercio mediterráneo.
Viviendo el momento con datos
Vayamos ahora. Ya sabes, hay un patrón como «vivir el momento». Es un tema importante expandir el momento en que vivimos en términos de información porque lo más importante que podemos controlar sobre el futuro es “ahora”. Entonces, ¿cómo pueden ayudarnos los datos? Comencemos con una aventura de Rumi:
Un día, un hombre construye una casa y hace un trato con las paredes de la casa. Antes de que se derrumben los muros, informará al propietario para que el propietario y su familia no sufran daños. Pasan los años y un día de repente caen los muros. El hombre grita a las paredes que se derrumban en lágrimas y enojo:
- ¿Sabes que teníamos un trato?
- ¿Qué me ibas a hacer saber? Se escucha un ruido desde las paredes:
- Intentamos informar. Cuando abrimos la boca para decir algo, viniste con barro y nos tapaste la boca.
Adaptemos esta historia al presente. Tienes una fábrica y elaboras productos de alto valor agregado en esta fábrica con cientos de máquinas en mil una integración y automatización. Tiene máquinas tales que si no funcionan, todo su proceso de producción se detiene. Si un día estas máquinas fallan y su producción falla, ¿con quién se enojará?
El fenómeno conocido como Internet de las cosas es muy común. Todas estas máquinas generan datos sobre sí mismas y su trabajo cada segundo. Si puede extraer información de estos datos y detectar anomalías en sus máquinas, puede tener tiempo para tomar precauciones. Esto es lo que harás aproximadamente:
- Configurará una infraestructura para recibir y almacenar la transmisión de datos en vivo en sus máquinas.
- Aprenderá de los errores que cometió en el pasado. En otras palabras, identificará las fallas de la máquina en sus datos históricos y diseñará modelos estadísticos que puedan capturar situaciones de falla.
- Además del segundo elemento, también diseñará modelos estadísticos para detectar situaciones que podría llamar anomalías.
- Intentarás comprender lo que dicen tus máquinas sin interrumpirlas.
En resumen, es posible que experimente el momento que vive con datos más informados.
Persiguiendo el futuro con datos
Supongamos que la palabra «futuro» significa «desconocido». El propósito aquí es dedicar esta sección a la predicción de cosas desconocidas / invisibles independientemente del concepto de tiempo. Si consideramos que las cosas temporalmente futuras también son cosas que aún no se conocen / ven, puede ignorar la suposición aquí. Sin embargo, comencemos con el examen de un ejemplo futuro de vez en cuando.
Digamos que tiene algo de dinero para invertir. Un montón de herramientas de inversión alternativas: mercado de valores, moneda, oro, depósitos, bienes raíces, Bitcoin, Ethereum, Ripple, etc. ¿En cuál invertiría? ¿A qué hora esperas una devolución? Dispones de datos históricos de todas estas alternativas de inversión. Si puede modelar el precio de cada una de las alternativas, también puede predecir precios futuros. Tome el mercado de valores, por ejemplo, y cree un flujo de trabajo simple:
- Ha elaborado la lista histórica de todas las acciones que cotizan en la bolsa de valores de BIST (Borsa Istanbul).
- También ha llegado a los datos que cree que afectan al precio de las acciones. Por ejemplo, ahora tiene datos sobre los balances de algunas empresas, así como variables macro como tipos de interés, tipos de cambio, inflación y Producto Interno Bruto.
- Ha procesado los datos que tiene que utilizar en sus modelos.
- Has determinado tus modelos alternativos para elegir el mejor entre ellos.
- Ha decidido utilizar el método de ventanas flotantes para medir el rendimiento de sus modelos. Avanzará diseñando un pseudo futuro en sus datos históricos. Por ejemplo, con datos anteriores de 20 períodos, predecirá el período 21 como si estuviera por venir. Luego deslizará su ventana un período y predecirá el vigésimo segundo período con los 20 períodos anteriores. Entonces vendrás hasta el último período.
- Simplemente al promediar el rendimiento predictivo de su modelo, sabrá qué tan bien está funcionando su modelo.
- Ha repetido los elementos quinto y sexto para todas sus alternativas de modelo y ha seleccionado el modelo de mejor rendimiento.
- Usando el modelo que ha elegido, ahora puede predecir el futuro real con los últimos 20 períodos de datos en su mano.
¿Entonces, te gusta?
Cuando puede hacer algo similar a lo anterior para todos los vehículos de inversión alternativos, tiene una predicción basada en datos de dónde debe invertir su dinero.
¡Pero lo desconocido no es solo el futuro!
Por ejemplo, ¡desea diseñar un sistema de navegación para automóvil sin conductor! ¿Qué harás? ¿Codificará las reglas que sugieren cómo debe comportarse su vehículo en qué camino recorriendo todos los caminos de la tierra? Por supuesto que esto es imposible. Lo que va a hacer es dejar que su automóvil aprenda a moverse en caminos que nunca ha visto, ingresando lo que debe hacerse en una cantidad y variedad suficientes de caminos.
Demos un ejemplo más.
Dirige una institución educativa, una escuela. Has recibido 100 nuevas inscripciones en el 1er grado de secundaria. Tienes alguna información sobre cada alumno, pero no sabes cómo agrupar a estos 100 alumnos, a quién ponerlos en qué clases.
¿Qué haces?
Al menos, tus datos tienen algo que decirte. Deberías escucharlos primero. Si el número de aulas nuevas que abrirá para 100 estudiantes es 5, por ejemplo, puede comenzar dividiendo a estos 100 estudiantes en 5 grupos según los datos que tenga. ¿Qué pasa si los datos en su mano lo guían y estos 5 grupos también están en su mente?
¿No se te metió en la cabeza?
Entonces, tal vez puedas intentar abrir 6 aulas o 4 aulas. Tal vez cree grupos más coherentes. Siempre que sepa descifrar el idioma de los datos.
Mi siguiente publicación es «¿Es la ciencia de datos = inteligencia artificial o aprendizaje automático?» Nos vemos…
¡No lo olvide!
«En la vida, la guía más real es la ciencia … MKA»
«Y puedes explicar esto con datos … MA»
Referencias
- https://d-aim.com/consulting-data-science/
- https://datajarlabs.com/blog/
- https://www.veribilimiokulu.com/nasil-veri-bilimci-olunur/
- https://www.msci.com/www/blog-posts/what-fed-monetary-policy-has/01244264353
- https://t24.com.tr/haber/borsa-istanbul-da-yeni-rekor,857008
Añadir comentario