Programa

La diplomatura se organiza en 8 módulos temáticos que abordarán 6 grandes ejes. Cada módulo tendrá una carga horaria acorde a los contenidos incluidos. El eje número 6 es transversal al cursado e involucra un proyecto final que debe aprobarse para completar la diplomatura.

Contenidos de cada eje y módulo:

Eje 1: Introducción a la ciencia de datos en salud

Módulo I: Fundamentos de la inteligencia artificial y de la ciencia de datos.

  • Introducción a la ciencia de datos y al concepto de inteligencia artificial.
  • Uso de IA generativa en la investigación en salud.
  • Herramientas y entornos de trabajo (Python, Jupyter Notebook, Google Colaboratory). Aplicación sobre bases de datos.
  • Ética y privacidad de los datos en salud.

Módulo II: Manipulación y análisis de datos en salud

  • Análisis exploratorio de datos. Estadística descriptiva, medidas de tendencia y dispersión. 
  • Estadística inferencial.
  • Técnicas de limpieza y preprocesamiento de datos. Curación de bases de datos. Tratamiento de datos nulos o atípicos.
  • Visualización de datos. 

Eje 2: Aprendizaje automático (machine learning) aplicado a la salud

Módulo III: Introducción al aprendizaje automático y aprendizaje automático supervisado

  • Introducción al aprendizaje automático y tipos.
  • Tipos de problemáticas que aborda el  aprendizaje automático supervisado (regresión, clasificación).
  • Conjunto de datos de entrenamiento, test y validación. Optimización de hiperparámetros. 
  • Algoritmos básicos y de ensemble.
  • Evaluación y validación de algoritmos.

Módulo IV: Introducción al aprendizaje no supervisado

  • Introducción al aprendizaje no supervisado. Objetivos y aplicaciones. 
  • Reducción de dimensionalidad – Análisis de componentes principales.
  • Visualización: biplot.
  • Algoritmos más utilizados en clustering. Kmeans y clustering jerárquico. 
  • DBSCAN
  • Medidas de desempeño.

Eje 3: Análisis de imágenes para investigación en salud

Módulo V: Imágenes en salud

  • Estructura de una imagen: dimensiones, pixel, tipo de dato, visualización, imagen DICOM, resolución espacial. 
  • Histograma y transformaciones en imágenes: contraste, imagen negativa, binarizado, filtros. 
  • Extracción de información, algoritmos de ML, segmentación semántica y clasificación en imágenes.

Eje 4: Introducción a las redes neuronales

Módulo VI: Introducción a Redes Neuronales

  • Conceptos básicos de deep learning y redes neuronales, aplicación de red neuronal de una sola capa. 
  • Perceptron simple para clasificación y regresión. Redes feed-forward. Redes de una capa oculta. Redes neuronales profundas. Ejemplos. Redes recurrentes. Redes convolucionales. Redes transformers.

Eje 5: Procesamiento del Lenguaje Natural para investigación en salud

Módulo VII: Fundamentos, técnicas y aplicaciones de PLN

  • Minería de datos de texto.
  • Introducción al procesamiento del lenguaje natural.
  • Herramientas y bibliotecas (NLTK, spaCy).
  • Tokenización, etiquetado de partes del discurso y extracción de entidades nombradas.
  • Expresiones regulares. Análisis exploratorio, técnicas más utilizadas: TF-IDF, word clustering, word embedding. Análisis de textos clínicos y encuestas.
  • Introducción y manejo de modelos grandes del lenguaje (LLMs). 

Eje 6: Proyecto final de cursado

Módulo VIII: Integración y aplicación de contenidos

  • Construcción y diseño de aplicación de contenidos aprendidos en áreas de la ciencia de la salud