La diplomatura se organiza en 8 módulos temáticos que abordarán 6 grandes ejes. Cada módulo tendrá una carga horaria acorde a los contenidos incluidos. El eje número 6 es transversal al cursado e involucra un proyecto final que debe aprobarse para completar la diplomatura.
Contenidos de cada eje y módulo:
Eje 1: Introducción a la ciencia de datos en salud
Módulo I: Fundamentos de la inteligencia artificial y de la ciencia de datos.
- Introducción a la ciencia de datos y al concepto de inteligencia artificial.
- Uso de IA generativa en la investigación en salud.
- Herramientas y entornos de trabajo (Python, Jupyter Notebook, Google Colaboratory). Aplicación sobre bases de datos.
- Ética y privacidad de los datos en salud.
Módulo II: Manipulación y análisis de datos en salud
- Análisis exploratorio de datos. Estadística descriptiva, medidas de tendencia y dispersión.
- Estadística inferencial.
- Técnicas de limpieza y preprocesamiento de datos. Curación de bases de datos. Tratamiento de datos nulos o atípicos.
- Visualización de datos.
Eje 2: Aprendizaje automático (machine learning) aplicado a la salud
Módulo III: Introducción al aprendizaje automático y aprendizaje automático supervisado
- Introducción al aprendizaje automático y tipos.
- Tipos de problemáticas que aborda el aprendizaje automático supervisado (regresión, clasificación).
- Conjunto de datos de entrenamiento, test y validación. Optimización de hiperparámetros.
- Algoritmos básicos y de ensemble.
- Evaluación y validación de algoritmos.
Módulo IV: Introducción al aprendizaje no supervisado
- Introducción al aprendizaje no supervisado. Objetivos y aplicaciones.
- Reducción de dimensionalidad – Análisis de componentes principales.
- Visualización: biplot.
- Algoritmos más utilizados en clustering. Kmeans y clustering jerárquico.
- DBSCAN
- Medidas de desempeño.
Eje 3: Análisis de imágenes para investigación en salud
Módulo V: Imágenes en salud
- Estructura de una imagen: dimensiones, pixel, tipo de dato, visualización, imagen DICOM, resolución espacial.
- Histograma y transformaciones en imágenes: contraste, imagen negativa, binarizado, filtros.
- Extracción de información, algoritmos de ML, segmentación semántica y clasificación en imágenes.
Eje 4: Introducción a las redes neuronales
Módulo VI: Introducción a Redes Neuronales
- Conceptos básicos de deep learning y redes neuronales, aplicación de red neuronal de una sola capa.
- Perceptron simple para clasificación y regresión. Redes feed-forward. Redes de una capa oculta. Redes neuronales profundas. Ejemplos. Redes recurrentes. Redes convolucionales. Redes transformers.
Eje 5: Procesamiento del Lenguaje Natural para investigación en salud
Módulo VII: Fundamentos, técnicas y aplicaciones de PLN
- Minería de datos de texto.
- Introducción al procesamiento del lenguaje natural.
- Herramientas y bibliotecas (NLTK, spaCy).
- Tokenización, etiquetado de partes del discurso y extracción de entidades nombradas.
- Expresiones regulares. Análisis exploratorio, técnicas más utilizadas: TF-IDF, word clustering, word embedding. Análisis de textos clínicos y encuestas.
- Introducción y manejo de modelos grandes del lenguaje (LLMs).
Eje 6: Proyecto final de cursado
Módulo VIII: Integración y aplicación de contenidos
- Construcción y diseño de aplicación de contenidos aprendidos en áreas de la ciencia de la salud