Objetivo
Proporcionar a los participantes de un entendimiento sobre la aplicación estratégica de la ciencia de datos en contextos empresariales. Enfatizando la importancia de identificar necesidades de negocio, desarrollar casos de uso pertinentes y emplear diferentes tipos de analíticas.
- Necesidades del negocio
- Casos de Usos
- Analítica: descriptiva, diagnóstica, predictiva y prescriptiva
- Transformación Empresarial
- Ciencia de Datos
- Profesionales en Ciencias de Datos
- Funciones y responsabilidades de los profesionales en Ciencia de Datos
- Herramientas de un analista de datos
Objetivo
Introducir a los participantes en los conceptos de programación con Python. Comprensión de sintaxis, estructuras de datos, control de flujos, operaciones de Python, así como diferentes librerías necesarias para modelar, analizar y visualizar información obtenida de los datos.
Herramientas básicas del Análisis de Datos
- Principales herramientas del Analista de Datos
- Las Hojas electrónicas: Excel y Google Sheets
- Las Bases de Datos: Fundamentos del SQL
- Herramientas visualizadoras de Datos
Conceptos fundamentales de la Ciencia de Datos
- Conceptos fundamentales de los lenguajes de programación en Ciencias de Datos
- IDEs actuales para el desarrollo de la Ciencia de Datos
- Fundamentos de Lenguaje de Programación R y R Studio
- Python y Colab
Librerías en Python
- Librería Matplotlib
- Librería Pandas
- Librería Seaborn
- Librería Scikit-learn
- Otras Librerías
Preparación de datos
- Definición de variables
- Listas y estructuras
- Gestión de datos con librerías Numpy y Pandas
Modelado y visualización de datos I
- Selección del tipo de modelo (librerías)
- Librerías para diferentes tipos de análisis: NumPy, Matplotlib, Seaborn, SciPy
Modelado y visualización de datos II
- Librerías para Machine Learning: Scikit-learn, Tensorflow
- Análisis de datos
- Visualización de datos y gráficos estadísticos con Matplotlib y Seaborn
Caso de Análisis de Datos
- Caso completo de Análisis de Datos, desde la concepción hasta la visualización de datos
Objetivo
Desarrollar un entendimiento profundo de los conceptos estadísticos fundamentales y su aplicación en la ciencia de datos. Este módulo está diseñado para enseñar a los participantes cómo preparar, analizar y interpretar datos utilizando métodos estadísticos, con el objetivo de apoyar la toma de decisiones empresariales efectivas. Se enfocará en técnicas descriptivas e inferenciales, con ejemplos prácticos usando Python.
Estadística descriptiva
- Introducción a la estadística: Población y Muestra
- Tipos de variables y escalas de medición
- Datos agrupados y tabla de frecuencias
Preparación de datos
- Transformación de datos y discretización
- Limpieza de datos
- Identificación de Outliers
Análisis descriptivo
- Medidas de tendencia central: Media, Mediana y Moda
- Medidas de dispersion: Rango , Cuantiles , Varianza y desviación estándar
- Elaboración de histogramas, gráficos de caja.
- ¿Cuándo usar? ¿Qué preguntas responde?
Inferencia estadística
- Relación entre variables cuantitativas: coeficiente de correlación
- Relación entre variables cualitativas: Prueba chi cuadrado
- Pruebas de hipótesis y su aplicación en la toma de decisiones.
- ¿Cuándo usar? ¿Qué preguntas responde?
Objetivo
Capacitar a los participantes en los principios y técnicas fundamentales de la regresión, el aprendizaje automático (Machine Learning) y la inteligencia artificial, con un enfoque práctico orientado a su aplicación en la toma de decisiones en entornos empresariales.
Los participantes aprenderán a seleccionar, implementar y evaluar modelos utilizando Python, poniendo especial énfasis en cómo estos modelos pueden definirse y aplicarse para alcanzar objetivos de negocio concretos
Regresión lineal simple y múltiple
- Definición y supuestos de la regresión lineal
- Interpretación de los coeficientes de regresión
- Evaluación de la bondad de ajuste del modelo
Modelos de regresión no lineal
- Definición y ejemplos de modelos de regresión no lineal
- Métodos de ajuste de modelos no lineales
- Evaluación de la bondad de ajuste en modelos no lineales
Inteligencia Artificial y Machine Learning
- Introducción
- Definiciones
- Conceptos
- Procesos y Aplicaciones
- Tipos de Aprendizaje
Aprendizaje Supervisado
- Regresión Logística
- Introducción y Definición
- Supuestos del modelo
- Formulación del modelo
- Estimación de parámetros
- Aplicación
Validación de modelos de Aprendizaje Supervisado
- Matriz de Confusión
- GINI
- K-S
- ROC
- Sensibilidad
- Especificidad
Aprendizaje Supervisado
- Arboles de Clasificación
- Random forest
- SVM ( Máquinas de Soporte Vectorial)
- Naive Bayes
- Aplicaciones
Aprendizaje Supervisado
- Redes Neuronales
- La Neurona
- Funcionamiento
- Arquitectura
- Perceptrón
- Funciones de Activación
- Aplicación
Aprendizaje No Supervisado
- Agrupamiento K-means
- Componentes Principales
- Aplicaciones
Fundamentos de Deep Learning
- Perceptrón Multicapa
Objetivo
Desarrollar en los participantes las habilidades necesarias para evaluar, seleccionar, implementar y monitorear modelos analíticos, priorizando su aplicabilidad a problemas reales de negocio. Se busca que los participantes aprendan a equilibrar precisión, complejidad e interpretabilidad del modelo, tomando decisiones basadas en datos alineadas a los objetivos estratégicos de sus organizaciones.
Estimación de modelos
- Selección de variables explicativas
- Estimación del modelo de regresión
- Análisis de Residuos
Validación de modelos
- Validación cruzada y particionamiento de datos
- Métricas de evaluación de modelos: R2, MAE, RMSE, etc.
- Interpretación de las métricas de evaluación de modelos
Selección de modelos
- Métodos de selección de modelos: MSE, MAPE, AIC, BIC, etc.
- Comparación de modelos y selección del mejor modelo
- Interpretabilidad vs. complejidad del modelo
Implementación de modelos
- Implementación de modelos
- Integración de modelos en los procesos de negocio
- Consideraciones prácticas para la implementación de modelos
Monitoreo de modelos
- Monitoreo del rendimiento de modelos en producción
- Detección y diagnóstico de problemas en modelos
- Actualización y reentrenamiento de modelos en producción
Aplicación Global del Mejor Modelo
