Este libro introduce a aquellos que no son Data Scientists (científicos de datos), ni tienen conocimientos particulares de matemáticas, en la metodología de Machine Learning (Aprendizaje Automático), sus conceptos, sus principales algoritmos y la implementación de estos en Python usando Scikit-learn.
Comienza con una presentación del Machine Learning y, a continuación, del método CRISP, sobre el que se aborda cada fase y sus diversas etapas. Los primeros capítulos tratan sobre el Business Understanding (conocimiento del negocio), la Data Understanding (compresión de los datos) y la Data Preparation (preparación de los datos). Estos capítulos presentan los análisis estadísticos de los conjuntos de datos (datasets) tanto en forma numérica como gráfica, así como las principales técnicas utilizadas para preparar los datos, su función y consejos sobre cómo utilizarlas.
A continuación, se dedican varios capítulos a cada tarea de Machine Learning: la clasificación, la regresión (con el caso especial de la predicción), el clustering (agrupación) y, de forma más general, el aprendizaje no supervisado. Para cada tarea presentada, se detallan sucesivamente los criterios de evaluación, los conceptos en los que se basan los principales algoritmos y su implementación usando Scikit-learn.
Para ilustrar los distintos capítulos, las técnicas y algoritmos presentados se aplican a conjuntos de datos de uso frecuente: Iris (clasificar flores), Boston (prever el precio de venta de pisos) y Titanic (definir la probabilidad de supervivencia de los pasajeros de un barco). El código Python está comentado y puede descargarse (en forma de cuadernos Jupyter) a partir del sitio web www.ediciones-eni.com.