Introducción a la ciencia de datos y aprendizaje automático. Herramientas y técnicas esenciales
En Introducción a la ciencia de datos y aprendizaje automático, los autores Mark Levene y Martyn Harris presentan una introducción completa y accesible a la ciencia de datos, pues posibilita a los lectores desarrollar su intuición con los métodos adoptados en la ciencia de datos y en el aprendizaje automático, a partir del componente algorítmico de la ciencia de datos que implica el descubrimiento de patrones de datos de entrada.
Este libro aborda la ciencia de datos desde una perspectiva aplicada, es decir, hace hincapié en los aspectos algorítmicos de la ciencia de datos y en los conceptos estadísticos fundamentales necesarios para comprender el tema.
Se inicia explorando la naturaleza de la ciencia de datos y sus orígenes en la estadística básica. Después, los autores guían a los lectores por los pasos esenciales de la ciencia de datos, pues van del análisis exploratorio de datos con base en el uso de herramientas de visualización, pasan por explicar el proceso de formar hipótesis, construir modelos estadísticos y, finalmente, utilizar métodos algorítmicos para descubrir patrones en los datos. Por último, los autores discuten temas generales y conceptos preliminares necesarios para comprender el aprendizaje automático, central en la disciplina de la ciencia de datos.
En todo el libro se presentan ejemplos prácticos y conjuntos de datos del mundo real para reforzar la comprensión de los conceptos. Todos los ejemplos están respaldados por código en Python externo al material de lectura, pues así se logra mantener el carácter atemporal del libro