Muy buenas, me llamo Miguel y aquà les traigo otro nuevo post.
Índice
Aquà hay algunas bibliotecas súper útiles para que pueda aprovechar al máximo R
para análisis
La ciencia de datos y R
, una combinación perfecta, van de la mano como champán y fresas, gelatina y helado o cocaÃna y gofres.
Pero aprender R
y saber qué bibliotecas mejorarán sus habilidades en ciencia de datos puede ser abrumador.
Aquà hay cinco bibliotecas que harán que su experiencia analÃtica sea mucho más agradable y son esenciales para dominar o alcanzar el siguiente paso de su carrera en ciencia de datos.
Dplyr
es una gran biblioteca de limpieza y disputa de datos que es súper útil y bien conocida en el campo. Dplyr
tiene muchas funciones integradas que son inmediatamente útiles y aplicables para casi cualquier tarea de análisis.
Algunas funciones útiles incluyen:
- Seleccione: determinadas columnas de datos.
- Filtrar: sus datos para seleccionar filas especÃficas.
- Organizar: las filas de sus datos en un pedido.
- Mutar: su marco de datos para contener nuevas columnas.
- Resumir: fragmentos de sus datos de alguna manera.
Cualquier cientÃfico de datos que se precie sabe cómo manejar un ggplot
. La segunda biblioteca de visualización actualizada de R
tiene una variedad y un alcance asombrosos para la modificación personal.
Ggplot
puede generar de todo, desde un simple gráfico circular hasta un gráfico de barras complejo, sombreado y apilado, hasta una representación tridimensional de sus incrustaciones de palabras previamente entrenadas.
Realmente es algo de primera categorÃa y no se puede promocionar lo suficiente.
Otra fantástica biblioteca de R
que se usa mucho, especialmente en situaciones aplicadas de la vida real es Lubridate
.
Lubridate
es una gran biblioteca para disputar y limpiar datos de series de tiempo y administrar cualquier variable relacionada con el tiempo con la que esté trabajando.
Puede hacer todo lo que siempre quiso hacer con la aritmética de fechas usando esta biblioteca, aunque comprender y usar la funcionalidad disponible puede ser algo complejo aquÃ. ¡Échale un vistazo!
Este es para todos los académicos y redactores de informes. Knitr
es un software de publicación esencial para R
. Su propósito es producir informes reproducibles en una variedad de formatos.
Este paquete también permite la integración de código R
en documentos LaTeX
, Markdown
, LyX, HTML
, AsciiDoc
y reStructuredText
.
Puede agregar R
a un documento de rebajas y generar informes fácilmente en HTML
, Word
y otros formatos. Imprescindible si está interesado en investigar y automatizar el viaje desde el análisis de datos hasta la creación de informes.
Este es para toda la gente de PNL
. Una extensión del paquete Quanteda
, esta extensión le permite hacer uso de una amplia gama de diccionarios de datos.
Todo, desde palabras vacÃas hasta léxicos. Una gran investigación para realizar comparaciones rápidas y sencillas o para aplicar diccionarios de léxico con un mÃnimo de esfuerzo.
¡Cosas interesantes!
Estas son solo algunas de las bibliotecas más comunes, hay tantas bibliotecas R
útiles y tantas en producción.
Para mÃ, es importante que las bibliotecas que uso sean estables hasta que se actualicen y reparen con nuevas versiones. Puede ser desgarrador intentar usar una versión heredada de una biblioteca que simplemente no funcionará en su proyecto.
Espero que haya disfrutado de este recorrido en algunas bibliotecas R
esenciales y de primera categorÃa para sus proyectos de ciencia de datos.
Feliz análisis.
Añadir comentario