Programa especializado en Data Science - Decisiones basadas en datos (Online)

Introducción: Introducción

Objetivo

Proporcionar a los participantes de un entendimiento sobre la aplicación estratégica de la ciencia de datos en contextos empresariales. Enfatizando la importancia de identificar necesidades de negocio, desarrollar casos de uso pertinentes y emplear diferentes tipos de analíticas.

Necesidades del negocio
Casos de Usos
Analítica: descriptiva, diagnóstica, predictiva y prescriptiva
Transformación Empresarial
Ciencia de Datos
Profesionales en Ciencias de Datos
Funciones y responsabilidades de los profesionales en Ciencia de Datos
Herramientas de un analista de datos

Módulo I. Programación para Ciencia de Datos

Objetivo

Introducir a los participantes en los conceptos de programación con Python. Comprensión de sintaxis, estructuras de datos, control de flujos, operaciones de Python, así como diferentes librerías necesarias para modelar, analizar y visualizar información obtenida de los datos.

Herramientas básicas del Análisis de Datos

Principales herramientas del Analista de Datos
Las Hojas electrónicas: Excel y Google Sheets
Las Bases de Datos: Fundamentos del SQL
Herramientas visualizadoras de Datos

Conceptos fundamentales de la Ciencia de Datos

Conceptos fundamentales de los lenguajes de programación en Ciencias de Datos
IDEs actuales para el desarrollo de la Ciencia de Datos
Fundamentos de Lenguaje de Programación R y R Studio
Python y Colab

Librerías en Python

Librería Matplotlib
Librería Pandas
Librería Seaborn
Librería Scikit-learn
Otras Librerías

Preparación de datos

Definición de variables
Listas y estructuras
Gestión de datos con librerías Numpy y Pandas

Modelado y visualización de datos I

Selección del tipo de modelo (librerías)
Librerías para diferentes tipos de análisis: NumPy, Matplotlib, Seaborn, SciPy

Modelado y visualización de datos II

Librerías para Machine Learning: Scikit-learn, Tensorflow
Análisis de datos
Visualización de datos y gráficos estadísticos con Matplotlib y Seaborn

Caso de Análisis de Datos

Caso completo de Análisis de Datos, desde la concepción hasta la visualización de datos

Módulo II: Estadística para Ciencia de Datos

Objetivo

Desarrollar un entendimiento profundo de los conceptos estadísticos fundamentales y su aplicación en la ciencia de datos. Este módulo está diseñado para enseñar a los participantes cómo preparar, analizar y interpretar datos utilizando métodos estadísticos, con el objetivo de apoyar la toma de decisiones empresariales efectivas. Se enfocará en técnicas descriptivas e inferenciales, con ejemplos prácticos usando Python.

Estadística descriptiva

Introducción a la estadística: Población y Muestra
Tipos de variables y escalas de medición
Datos agrupados y tabla de frecuencias

Preparación de datos

Transformación de datos y discretización
Limpieza de datos
Identificación de Outliers

Análisis descriptivo

Medidas de tendencia central: Media, Mediana y Moda
Medidas de dispersion: Rango , Cuantiles , Varianza y desviación estándar
Elaboración de histogramas, gráficos de caja.
¿Cuándo usar? ¿Qué preguntas responde?

Inferencia estadística

Relación entre variables cuantitativas: coeficiente de correlación
Relación entre variables cualitativas: Prueba chi cuadrado
Pruebas de hipótesis y su aplicación en la toma de decisiones.
¿Cuándo usar? ¿Qué preguntas responde?

Módulo III: Machine Learning e introducción a la Inteligencia Artificial

Objetivo

Capacitar a los participantes en los principios y técnicas fundamentales de la regresión, el aprendizaje automático (Machine Learning) y la inteligencia artificial, con un enfoque práctico orientado a su aplicación en la toma de decisiones en entornos empresariales.

Los participantes aprenderán a seleccionar, implementar y evaluar modelos utilizando Python, poniendo especial énfasis en cómo estos modelos pueden definirse y aplicarse para alcanzar objetivos de negocio concretos

Regresión lineal simple y múltiple

Definición y supuestos de la regresión lineal
Interpretación de los coeficientes de regresión
Evaluación de la bondad de ajuste del modelo

Modelos de regresión no lineal

Definición y ejemplos de modelos de regresión no lineal
Métodos de ajuste de modelos no lineales
Evaluación de la bondad de ajuste en modelos no lineales

Inteligencia Artificial y Machine Learning

Introducción
Definiciones
Conceptos
Procesos y Aplicaciones
Tipos de Aprendizaje

Aprendizaje Supervisado

Regresión Logística
- Introducción y Definición
- Supuestos del modelo
- Formulación del modelo
- Estimación de parámetros
- Aplicación

Validación de modelos de Aprendizaje Supervisado

Matriz de Confusión
GINI
K-S
ROC
Sensibilidad
Especificidad

Aprendizaje Supervisado

Arboles de Clasificación
Random forest
SVM ( Máquinas de Soporte Vectorial)
Naive Bayes
Aplicaciones

Aprendizaje Supervisado

Redes Neuronales
- La Neurona
- Funcionamiento
- Arquitectura
- Perceptrón
- Funciones de Activación
- Aplicación

Aprendizaje No Supervisado

Agrupamiento K-means
Componentes Principales
Aplicaciones

Fundamentos de Deep Learning

Perceptrón Multicapa

Módulo IV: Evaluación y Aplicación de Modelos para la Toma de Decisiones

Objetivo

Desarrollar en los participantes las habilidades necesarias para evaluar, seleccionar, implementar y monitorear modelos analíticos, priorizando su aplicabilidad a problemas reales de negocio. Se busca que los participantes aprendan a equilibrar precisión, complejidad e interpretabilidad del modelo, tomando decisiones basadas en datos alineadas a los objetivos estratégicos de sus organizaciones.

Estimación de modelos

Selección de variables explicativas
Estimación del modelo de regresión
Análisis de Residuos

Validación de modelos

Validación cruzada y particionamiento de datos
Métricas de evaluación de modelos: R2, MAE, RMSE, etc.
Interpretación de las métricas de evaluación de modelos

Selección de modelos

Métodos de selección de modelos: MSE, MAPE, AIC, BIC, etc.
Comparación de modelos y selección del mejor modelo
Interpretabilidad vs. complejidad del modelo

Implementación de modelos

Implementación de modelos
Integración de modelos en los procesos de negocio
Consideraciones prácticas para la implementación de modelos

Monitoreo de modelos

Monitoreo del rendimiento de modelos en producción
Detección y diagnóstico de problemas en modelos
Actualización y reentrenamiento de modelos en producción

Aplicación Global del Mejor Modelo

Facultad de Ingeniería

Programa especializado en Data Science - Decisiones basadas en datos (Online)

Próximamente