Facultad de Ingeniería

Programa especializado en Data Science - Decisiones basadas en datos (Online)

  • Inicio
  • Ingeniería
  • Programa especializado en Data Science – Decisiones basadas en datos (Online)

Introducción: Introducción

Objetivo

Proporcionar a los participantes de un entendimiento sobre la aplicación estratégica de la ciencia de datos en contextos empresariales. Enfatizando la importancia de identificar necesidades de negocio, desarrollar casos de uso pertinentes y emplear diferentes tipos de analíticas.

  1. Necesidades del negocio
  2. Casos de Usos
  3. Analítica: descriptiva, diagnóstica, predictiva y prescriptiva
  4. Transformación Empresarial
  5. Ciencia de Datos
  6. Profesionales en Ciencias de Datos
  7. Funciones y responsabilidades de los profesionales en Ciencia de Datos
  8. Herramientas de un analista de datos

Módulo I. Programación para Ciencia de Datos

Objetivo

Introducir a los participantes en los conceptos de programación con Python. Comprensión de sintaxis, estructuras de datos, control de flujos, operaciones de Python, así como diferentes librerías necesarias para modelar, analizar y visualizar información obtenida de los datos.

Herramientas básicas del Análisis de Datos

  • Principales herramientas del Analista de Datos
  • Las Hojas electrónicas: Excel y Google Sheets
  • Las Bases de Datos: Fundamentos del SQL
  • Herramientas visualizadoras de Datos

Conceptos fundamentales de la Ciencia de Datos

  • Conceptos fundamentales de los lenguajes de programación en Ciencias de Datos
  • IDEs actuales para el desarrollo de la Ciencia de Datos
  • Fundamentos de Lenguaje de Programación R y R Studio
  • Python y Colab

Librerías en Python

  • Librería Matplotlib
  • Librería Pandas
  • Librería Seaborn
  • Librería Scikit-learn
  • Otras Librerías

Preparación de datos

  • Definición de variables
  • Listas y estructuras
  • Gestión de datos con librerías Numpy y Pandas

Modelado y visualización de datos I

  • Selección del tipo de modelo (librerías)
  • Librerías para diferentes tipos de análisis: NumPy, Matplotlib, Seaborn, SciPy

Modelado y visualización de datos II

  • Librerías para Machine Learning: Scikit-learn, Tensorflow
  • Análisis de datos
  • Visualización de datos y gráficos estadísticos  con Matplotlib y Seaborn

Caso de Análisis de Datos

  • Caso completo de Análisis de Datos, desde la concepción hasta la visualización de datos

Módulo II: Estadística para Ciencia de Datos

Objetivo

Desarrollar un entendimiento profundo de los conceptos estadísticos fundamentales y su aplicación en la ciencia de datos. Este módulo está diseñado para enseñar a los participantes cómo preparar, analizar y interpretar datos utilizando métodos estadísticos, con el objetivo de apoyar la toma de decisiones empresariales efectivas. Se enfocará en técnicas descriptivas e inferenciales, con ejemplos prácticos usando Python.

Estadística descriptiva

  • Introducción a la estadística: Población y Muestra
  • Tipos de variables y escalas de medición
  • Datos agrupados y tabla de frecuencias

Preparación de datos

  • Transformación de datos y discretización
  • Limpieza de datos
  • Identificación de Outliers

Análisis descriptivo

  • Medidas de tendencia central: Media, Mediana y Moda
  • Medidas de dispersion: Rango , Cuantiles , Varianza y desviación estándar
  • Elaboración de histogramas, gráficos de caja.
  • ¿Cuándo usar? ¿Qué preguntas responde?

Inferencia estadística

  • Relación entre variables cuantitativas: coeficiente de correlación
  • Relación entre variables cualitativas: Prueba chi cuadrado
  • Pruebas de hipótesis y su aplicación en la toma de decisiones.
  • ¿Cuándo usar? ¿Qué preguntas responde?

Módulo III: Machine Learning e introducción a la Inteligencia Artificial

Objetivo

Capacitar a los participantes en los principios y técnicas fundamentales de la regresión, el aprendizaje automático (Machine Learning) y la inteligencia artificial, con un enfoque práctico orientado a su aplicación en la toma de decisiones en entornos empresariales.

Los participantes aprenderán a seleccionar, implementar y evaluar modelos utilizando Python, poniendo especial énfasis en cómo estos modelos pueden definirse y aplicarse para alcanzar objetivos de negocio concretos

Regresión lineal simple y múltiple

  • Definición y supuestos de la regresión lineal
  • Interpretación de los coeficientes de regresión
  • Evaluación de la bondad de ajuste del modelo

Modelos de regresión no lineal

  • Definición y ejemplos de modelos de regresión no lineal
  • Métodos de ajuste de modelos no lineales
  • Evaluación de la bondad de ajuste en modelos no lineales

Inteligencia Artificial y Machine Learning

  • Introducción
  • Definiciones
  • Conceptos
  • Procesos y Aplicaciones
  • Tipos de Aprendizaje

Aprendizaje Supervisado

  • Regresión Logística
    • Introducción y Definición
    • Supuestos del modelo
    • Formulación del modelo
    • Estimación de parámetros
    • Aplicación

Validación de modelos de Aprendizaje Supervisado

  • Matriz de Confusión
  • GINI
  • K-S
  • ROC
  • Sensibilidad
  • Especificidad

Aprendizaje Supervisado

  • Arboles de Clasificación
  • Random forest
  • SVM ( Máquinas de Soporte Vectorial)
  • Naive Bayes
  • Aplicaciones

Aprendizaje Supervisado

  • Redes Neuronales
    • La Neurona
    • Funcionamiento
    • Arquitectura
    • Perceptrón
    • Funciones de Activación
    • Aplicación

Aprendizaje No Supervisado

  • Agrupamiento K-means
  • Componentes Principales
  • Aplicaciones

Fundamentos de Deep Learning

  • Perceptrón Multicapa

Módulo IV: Evaluación y Aplicación de Modelos para la Toma de Decisiones

Objetivo

Desarrollar en los participantes las habilidades necesarias para evaluar, seleccionar, implementar y monitorear modelos analíticos, priorizando su aplicabilidad a problemas reales de negocio. Se busca que los participantes aprendan a equilibrar precisión, complejidad e interpretabilidad del modelo, tomando decisiones basadas en datos alineadas a los objetivos estratégicos de sus organizaciones.

Estimación de modelos

  • Selección de variables explicativas
  • Estimación del modelo de regresión
  • Análisis de Residuos

Validación de modelos

  • Validación cruzada y particionamiento de datos
  • Métricas de evaluación de modelos: R2, MAE, RMSE, etc.
  • Interpretación de las métricas de evaluación de modelos

Selección de modelos

  • Métodos de selección de modelos: MSE, MAPE, AIC, BIC, etc.
  • Comparación de modelos y selección del mejor modelo
  • Interpretabilidad vs. complejidad del modelo

Implementación de modelos

  • Implementación de modelos
  • Integración de modelos en los procesos de negocio
  • Consideraciones prácticas para la implementación de modelos

Monitoreo de modelos

  • Monitoreo del rendimiento de modelos en producción
  • Detección y diagnóstico de problemas en modelos
  • Actualización y reentrenamiento de modelos en producción

Aplicación Global del Mejor Modelo