Módulo I: INTRODUCCIÓN A PYTHON PARA LA CIENCIA DE DATOS (3 HORAS)
- Introducción a Google Colab.
- Fundamentos de Python: variables y estructuras de datos.
- Numpy y Pandas.
- Visualización con Matplotlib y Seaborn.
Módulo II: INTRODUCCIÓN A ESTADÍSTICA PARA LA CIENCIA DE DATOS (3 HORAS)
- Estadística descriptiva.
- Fundamentos de estadística inferencial.
- Estimación y test de hipótesis.
Módulo III: APRENDIZAJE NO SUPERVISADO (3 HORAS)
- Clustering por K-means: teoría y práctica.
- DBSCAN.
- Reducción de dimensionalidad por Componentes Principales: teoría y práctica.
Módulo IV: APRENDIZAJE SUPERVISADO PARA CLASIFICACIÓN (6 HORAS)
- Fundamentos de clasificación: codificación de variables categóricas y métricas para evaluar la clasificación.
- Decision Trees, Random Forest, Support Vector Machines (SVM), K-Nearest Neighbors, Bagging.
Módulo V: APRENDIZAJE SUPERVISADO PARA REGRESIÓN (6 HORAS)
- Regresión lineal y no lineal (logística).
- Métricas de evaluación y selección de modelos: RMSE y R-cuadrado.
- Tópicos modernos de regresión con datos de alta dimensionalidad: regularización.
- Random Forest Regression
Módulo VI: APRENDIZAJE PROFUNDO (3 HORAS)
- Fundamentos teóricos del Deep Learning: funciones de activación, neurones, Gradient Descent, capas.
- Aplicación práctica en clase.
Módulo VII: SISTEMAS DE RECOMENDACIÓN (3 HORAS)
- Fundamentos de los sistemas de recomendación.
- Collaborative Filtering, Matrix Factorization y Nearest Neighbors/Clustering.
- Aplicaciones prácticas.
