Módulo 1: Introducción
- Necesidades del negocio
- Casos de Usos
- Analítica: descriptiva, predictiva y prescriptiva
- Entendimiento de los datos
- Planificación de proyectos
- Comunicación de resultados
- Data Business Transformation
Módulo 2: Fundamentos de programación
- Definición de Algoritmo
- Revisión de algoritmos básicos y avanzados
- Principales lenguajes de programación de Ciencia de Datos
- ¿Qué es Python? Introducción al Python, principales librerías
- Python como lenguaje de programación de Ciencia de Datos
- Estructuras en Python: listas, tuplas, diccionarios, matrices y vectores
- Estructura de control de Python para manejo de información masiva
- Definición de funciones en Python. Recursividad. Ejemplos básicos
Módulo 3: Estadística para ciencia de datos
- Introducción de la Estadística en la Ciencia de Datos
- Estadística descriptiva: medidas de tendencia central y de posición, desviación estándar y coeficiente de variación
- Probabilidad e incertidumbre
- Coeficiente de correlación
- Preparación y limpieza de datos
- Gráficos: histogramas, líneas y pies
- Introducción a la inferencia estadística
- Prueba de hipótesis
Módulo 4: Modelos analíticos para ciencia de datos
- Conocimiento del negocio y entendimiento de datos para crear valor
- Metodologías para la explotación de datos. CRISP-DM y otras metodologías
- Partición de la muestra en train-test para el inicio del modelado.
- Entendimiento y técnicas de balanceo de datos
- Revisión del análisis de componentes principales
- Selección de variables mediante técnicas estadísticas
- Regresión lineal simple
- Regresión lineal múltiple
- Principales librerías de visualización de datos
- Revisión de resultados
Módulo 5: Introducción a la Inteligencia Artificial y al Machine Learning
- Definición de Inteligencia Artificial y Machine Learning
- Aprendizaje supervisado:
- Regresión Logística
- Naive Bayes
- Arboles de decisión
- Maquina de Soporte Vectorial
- Random forest
- Aprendizaje no supervisado
- K-means y DBSCan
- Validación de modelos a través de métricas: Gini, K-S y Matriz de confusión.
- Deep Learning: Red neuronal