- Inicio: 28 de julio 2026
- diplomados.informatica@usm.cl
El Diplomado en Ciencia de Datos Aplicada tiene como propósito formativo desarrollar en profesionales las competencias necesarias para diseñar, implementar y evaluar soluciones basadas en datos, mediante el uso de técnicas de análisis estadístico, visualización, machine learning e inteligencia artificial, aplicadas a contextos organizacionales reales. El programa está dirigido a profesionales con formación universitaria y conocimientos previos de programación en Python que buscan profundizar y actualizar sus capacidades técnicas en el ámbito de la ciencia de datos, fortaleciendo su desempeño profesional y su capacidad de aportar a la toma de decisiones basada en datos.
El trabajo asincrónico se organiza a través de la plataforma virtual institucional AULA USM e incluye el acceso a recursos de aprendizaje, tales como lecturas y videos complementarios, la participación en foros de discusión, el desarrollo de tareas y la realización de evaluaciones breves. A través de esta plataforma, los participantes acceden al material de estudio, entregan evidencias de aprendizaje y reciben retroalimentación docente.
A lo largo del diplomado, los participantes abordan progresivamente fundamentos, técnicas de modelamiento y enfoques contemporáneos de inteligencia artificial, integrando consideraciones éticas y de gobernanza de datos. El programa se articula en torno al desarrollo de un proyecto integrador, que se construye de manera progresiva a lo largo de las asignaturas y permite aplicar los aprendizajes en un problema o contexto profesional pertinente, favoreciendo la transferencia de los conocimientos adquiridos y el fortalecimiento de competencias aplicadas en ciencia de datos.
La ciencia de datos se ha consolidado en los últimos años como una de las disciplinas de mayor impacto y transversalidad, producto de la convergencia entre la estadística, la inteligencia artificial, el aprendizaje automático y los modelos de lenguaje de gran escala. Esta convergencia ha generado capacidades sin precedentes para extraer valor de los datos y desarrollar sistemas que transforman la forma en que las organizaciones analizan información, resuelven problemas, innovan y compiten en entornos cada vez más complejos y dinámicos.
El dominio de estas tecnologías ofrece a profesionales de diversas disciplinas la posibilidad de contribuir activamente a la mejora de procesos organizacionales y al desarrollo de soluciones innovadoras que, hasta hace pocos años, no eran viables ni sostenibles. Esta necesidad se manifiesta de manera transversal en sectores estratégicos para la industria chilena y latinoamericana, tales como la minería, la energía, los servicios financieros, la salud y el retail, entre otros.
Diversos estudios y reportes del sector productivo evidencian, sin embargo, una brecha creciente entre la demanda por profesionales con competencias avanzadas en ciencia de datos y la oferta disponible de capital humano especializado. Esta brecha representa, por una parte, un desafío para las organizaciones y, por otra, una oportunidad para los profesionales que buscan ampliar y actualizar.
En el Diplomado se enfatiza además la integración entre teoría y práctica mediante el uso de tecnologías educativas y herramientas avanzadas de programación y análisis de datos, favoreciendo una formación aplicada y contextualizada. Junto con ello, incorpora una perspectiva de responsabilidad social y ética, considerando aspectos de inclusión y el tratamiento responsable de los datos y de los sistemas basados en inteligencia artificial. El diplomado contribuye al desarrollo de competencias transversales sello UTFSM, tales como la resolución de problemas, el manejo avanzado de tecnologías de la información, la innovación, y la responsabilidad social y ética.
El Diplomado en Ciencia de Datos está dirigido a profesionales con grado de licenciatura o título profesional en cualquier área, pero que cuenten con conocimientos de nivel medio a avanzado en programación en Python y nociones básicas de análisis de datos. El programa está orientado a participantes que se desempeñan, o buscan desempeñarse, en contextos profesionales donde el uso de datos resulta relevante para el análisis de información y la toma de decisiones.
El diplomado no contempla formación introductoria en programación en Python, por lo que se requiere que los postulantes acrediten experiencia previa en el uso de este lenguaje (si hay sesiones prácticas voluntarias que pueden ayudar también a resolver dudas).
CE1: Desarrollar soluciones basadas en datos mediante el uso integrado de técnicas de análisis estadístico, visualización, machine learning e inteligencia artificial, para apoyar la toma de decisiones y la mejora de procesos en contextos organizacionales.
CE2: Evaluar soluciones basadas en datos considerando aspectos de rendimiento y escalabilidad, así como principios de ética, gobernanza, y marco regulatorio, con el fin de asegurar una implementación sostenible y responsable.
Las clases son online sincrónicas, que se complementan con ayudantías y talleres. Se utiliza aprendizaje basado en experiencia (estudios de casos), aprendizaje colaborativo, y Aprendizaje orientado a proyectos.
Entre otros aspectos, los participantes diseñan soluciones basada en datos que representa una innovación o mejora de procesos en su contexto profesional, especificando claramente el problema a resolver, construyen y presentan dashboard, diseñan, implementan y comparan componentes, resultados y/o modelos, elaboran un proyecto capstone (de integración) que incluye informes técnicos y presentaciones donde defienden sus resultados cumpliendo con mecanismos regulatorios.
Calificación mínima de aprobación por cada asignatura: 60%
Esta asignatura tiene como propósito formativo entregar a los participantes las bases conceptuales y metodológicas necesarias para el análisis inicial de datos en contextos organizacionales y profesionales. A través de ella, los participantes comprenden el rol estratégico de los datos y los fundamentos estadísticos que sustentan el análisis exploratorio como apoyo a la toma de decisiones y a la identificación de oportunidades de mejora o innovación basadas en datos.
Aborda contenidos de estadística descriptiva, análisis exploratorio de datos, nociones introductorias de probabilidad e inferencia estadística, junto con el uso de herramientas computacionales del ecosistema Python orientadas al análisis de datos. El aprendizaje se desarrolla mediante actividades teóricas y prácticas que combinan clases online y talleres aplicados, utilizando conjuntos de datos reales o realistas.
Cumple un rol introductorio y habilitante, entregando los fundamentos que permiten a los participantes abordar progresivamente los módulos posteriores y dar inicio al desarrollo del proyecto integrador, desde una perspectiva metodológica y analítica básica.
RA1.1: Aplica técnicas de análisis exploratorio de datos utilizando el ecosistema Python (NumPy, Pandas, Matplotlib) para identificar patrones, tendencias y relaciones estadísticas que apoyen la toma de decisiones en escenarios de incertidumbre.
RA1.2: Define un problema de su contexto profesional susceptible de ser abordado mediante una solución basada en datos, identificando los datos requeridos y los criterios iniciales de análisis.
– Ciencia de datos: historia y fundamentos conceptuales.
– Ciclo de vida de proyectos de ciencia de datos.
– Tipos de datos y tipos de variables.
– Estadística descriptiva.
– Análisis exploratorio de datos (EDA).
– Fundamentos de probabilidad.
– Nociones básicas de inferencia estadística.
– Ecosistema Python para ciencia de datos: NumPy, Pandas y Matplotlib
Esta asignatura tiene como propósito formativo desarrollar en los participantes las competencias necesarias para comunicar hallazgos basados en datos de manera efectiva, transparente y responsable a diferentes audiencias organizacionales. A través de esta asignatura, los participantes comprenden los principios que sustentan una visualización efectiva así como sus implicancias en la toma de decisiones, considerando posibles riesgos de interpretación para las audiencias objetivo.
Aborda contenidos de principios de visualización efectiva, herramientas de visualización para distintos tipos de datos, storytelling y narrativas con datos, métricas de negocio y KPIs por función organizacional, y diseño de dashboards en sus niveles operacional, táctico y estratégico. Además, se incorporan aspectos fundamentales de gobernanza de datos y privacidad en el contexto de la inteligencia de negocios, incluyendo buenas prácticas para evitar sesgos y manipulaciones en la representación visual de información, así como consideraciones sobre protección de datos sensibles en dashboards y reportes. El aprendizaje se desarrolla mediante actividades teóricas y prácticas que combinan clases online y talleres aplicados, utilizando herramientas de inteligencia de negocios como PowerBI y Tableau.
En el contexto general del diplomado, esta asignatura cumple un rol articulador entre el análisis exploratorio desarrollado en el módulo anterior y los módulos técnicos posteriores, enfatizando la capacidad de comunicar resultados y hallazgos de manera ética y transparente. Los participantes aplican los contenidos al proyecto integrador mediante la construcción de un dashboard que comunica las métricas clave y hallazgos preliminares relacionados con la innovación propuesta, considerando tanto las necesidades de información de las audiencias objetivo como aspectos de calidad y coherencia en la presentación de datos.
RA2.1 Diseña visualizaciones de datos efectivas, basadas en principios de visualización e inteligencia de negocios, considerando criterios de claridad, pertinencia y adecuación a las audiencias organizacionales.
RA2.2: Construye un dashboard que comunica hallazgos y métricas claves asociados a un problema o innovación real, considerando criterios de selección de métricas, coherencia de la información presentada y posibles riesgos de interpretación para las audiencias objetivo.
– Principios de visualización efectiva
– Técnicas de visualización para distintos tipos de datos
– Storytelling y narrativas con datos para diferentes audiencias
– Métricas de negocio y KPIs por función organizacional
– Diseño de dashboards operacionales, tácticos y estratégicos
– Herramientas de BI: Power BI, Tableau
Esta asignatura tiene como propósito formativo desarrollar en los participantes las competencias necesarias para diseñar y evaluar soluciones basadas en aprendizaje automático que apoyen procesos decisionales en contextos organizacionales. A través de esta asignatura, los participantes comprenden los fundamentos del machine learning y su aplicación práctica como herramienta para resolver problemas complejos, enfatizando tanto la capacidad predictiva de los modelos como su interpretabilidad.
Aborda contenidos de aprendizaje supervisado (regresión, clasificación y métodos de ensemble), evaluación y selección de modelos, metodologías de validación, aprendizaje no supervisado (clustering, PCA y detección de anomalías), redes neuronales completamente conectadas como fundamento para técnicas avanzadas, y métodos de explicabilidad como SHAP y LIME. El aprendizaje se desarrolla mediante actividades teóricas y prácticas que combinan clases online y talleres utilizando principalmente la biblioteca Scikit-learn del ecosistema Python.
En el marco del diplomado, esta asignatura cumple un rol central en la formación técnica, conectando los fundamentos estadísticos y de visualización de los módulos anteriores con las técnicas avanzadas de deep learning del módulo posterior. Los participantes aplican los contenidos al proyecto capstone mediante el diseño e implementación de modelos de machine learning apropiados al problema/innovación propuesta, evaluando su desempeño y asegurando su pertinencia.
RA3.1: Implementa modelos de machine learning supervisado y no supervisado, considerando métricas de desempeño, supuestos y limitaciones relevantes para su aplicación en contextos organizacionales.
RA3.2: Evalúa la integración de modelos de machine learning en un proyecto de ciencia de datos, considerando criterios de capacidad predictiva, interpretabilidad y viabilidad técnica.
– Aprendizaje supervisado: regresión, clasificación y ensemble methods
– Evaluación y selección de modelos: metodologías y buenas prácticas
– Aprendizaje no supervisado: clustering, PCA
– Redes neuronales completamente conectadas (perceptrón multicapa)
– Métodos de explicabilidad (SHAP, LIME)
– Herramientas para ML: Scikit-learn
Esta asignatura tiene como propósito formativo desarrollar en los participantes las competencias necesarias para aplicar técnicas modernas de aprendizaje profundo e inteligencia artificial generativa en la resolución de problemas que involucran datos no estructurados como texto e imágenes. A través de esta asignatura, los participantes comprenden las arquitecturas fundamentales del deep learning y las capacidades transformadoras de los modelos de lenguaje de gran escala, preparándolos para incorporar estas tecnologías emergentes en soluciones organizacionales.
Aborda contenidos de redes neuronales convolucionales para visión computacional (incluyendo explicabilidad visual y transfer learning), mecanismos de atención y arquitectura Transformer, modelos de lenguaje de gran escala (LLMs), técnicas de prompt engineering y RAG (Retrieval-Augmented Generation), e IA generativa multimodal con aplicaciones prácticas. El aprendizaje se desarrolla mediante actividades teóricas y prácticas que combinan clases online y talleres aplicados, utilizando herramientas como Keras, Hugging Face y LangChain.
En el marco del diplomado, esta asignatura representa la frontera tecnológica del programa, extendiendo las competencias de machine learning del módulo anterior hacia técnicas de vanguardia. Los participantes aplican los contenidos al proyecto integrador explorando cómo las técnicas de deep learning e IA generativa pueden potenciar o complementar la solución propuesta, evaluando la pertinencia de estas tecnologías según el contexto específico del problema.
RA4.1: Implementa técnicas de deep learning, LLMs e IA generativa para el análisis de datos no estructurados, utilizando herramientas modernas del ecosistema de inteligencia artificial.
RA4.2: Evalúa la incorporación de técnicas de deep learning o IA generativa en un proyecto de ciencia de datos, considerando criterios de pertinencia, desempeño y viabilidad técnica en el contexto de aplicación.
– CNNs para visión, explicabilidad visual, transfer learning
– Atención y Transformers
– Large Language Models (LLMs)
– Prompt engineering
– RAG (Retrieval-Augmented Generation)
– IA generativa multimodal: text-to-image, aplicaciones prácticas
– Herramientas para DL: Keras, Hugging Face, LangChain
La asignatura aborda contenidos de gobernanza y calidad de datos, explicabilidad y sesgos algorítmicos, auditoría de modelos de IA, marcos regulatorios de privacidad (GDPR y ley chilena de protección de datos), técnicas de anonimización, documentación ética de sistemas de IA, y fundamentos de seguridad en proyectos de datos. El aprendizaje se desarrolla mediante actividades teóricas y prácticas que combinan clases online, análisis de casos y talleres aplicados.
En el marco del diplomado, esta asignatura cumple un rol integrador y de cierre, proporcionando el marco necesario para que las soluciones técnicas desarrolladas a lo largo del programa sean implementables de manera responsable y sostenible. Los participantes aplican los contenidos al proyecto/innovación propuesta mediante una evaluación que considera las perspectivas de gobernanza, ética, privacidad y cumplimiento regulatorio, consolidando así una visión integral de la ciencia de datos aplicada.
RA5.1: Identifica riesgos y requisitos de gobernanza, ética, privacidad y cumplimiento regulatorio aplicables a sistemas basados en datos e inteligencia artificial.
RA5.2: Evalúa un proyecto real de ciencia de datos aplicando criterios de gobernanza, ética, privacidad y marco regulatorio para proponer acciones de mitigación de riesgos.
– Gobernanza y calidad de datos
– Explicabilidad, sesgos algorítmicos y auditoría de modelos de IA
– Privacidad: GDPR, ley chilena, técnicas de anonimización
– Auditoría de sistemas de IA y documentación ética
– Seguridad básica en proyectos de datos
El diplomado se imparte en modalidad online, combinando sesiones sincrónicas, actividades asincrónicas desarrolladas a través de la plataforma virtual institucional y trabajo autónomo del participante (en coherencia con el sistema SCT-Chile y se alinea estrechamente con el Modelo Educativo de la USM).
Se incluye una Jornada de Networking, donde se les invita a concurrir en forma voluntaria a la Casa Central en Valparaíso. Además, se ofrecen talleres prácticos, sincrónicos, 2 por asignatura, de asistencia voluntaria donde se realizan ejercicios que permiten profundizar algunos temas vistos en clases. Las sesiones sincrónicas serán grabadas y estarán disponibles durante todo el desarrollo del diplomado, con el fin de facilitar la revisión de contenidos y la recuperación de clases.
Doctorado en Ciencias de la Ingeniería Informática, UTFSM.
Postdoc en el Laboratorio de Sistemas Inteligentes de la Universidad de Bristol (UK)..
ricardo.nanculef@usm.cl.
Oficina: A-133-B Campus San Joaquín UTFSM
+56223037208
Magíster en Ingeniería, Universidad
Técnica Federico Santa María, Chile.
Ingeniero Civil Electrónico, Universidad
Técnica Federico Santa María, Chile.
Contacto: luis.hevia@inf.utfsm.cl
Doctor en Ingeniería Informática de la Universidad Técnica Federico Santa María, con postdoctorado en el Laboratorio de Sistemas Inteligentes de la Universidad de Bristol (Reino Unido) y múltiples estadías de investigación en la Universidad de Boloña (Italia) y Barcelona (España), instituciones con quienes mantiene estrechos vínculos
Magíster en Ingeniería Informática e Ingeniero Civil Informático de la Universidad Técnica Federico Santa María, con formación de posgrado internacional en el Máster en Diseño de Información y Visualización de Datos de la Universitat Pompeu Fabra (España).
Doctor (PhD) y académico de la Escuela de Auditoría y Control de Gestión de la Universidad Finis Terrae, donde se desempeña como Coordinador de Carrera e investigador en el área de Business Intelligence y Analítica de Negocios (BI&A).
Doctora en Física de la University of New South Wales (Sydney, Australia) y Astrónoma de la Universidad de Chile, con especialización en ciencia de datos aplicada y machine learning.
Doctor en Ciencias de la Ingeniería de la Pontificia Universidad Católica de Chile, con formación complementaria en Data Science y en Ingeniería Biomédica. Actualmente Julio Sotelo es profesor del Departamento de Informática de la Universidad Técnica Federico Santa María, donde desarrolla investigación en procesamiento de imágenes médicas, machine learning y análisis de datos biomédicos.
Científica de Datos con 4 años de experiencia en retail, logística, telcos y servicios digitales, especializada en SQL avanzado, análisis estadístico y automatización con Python.
NOTA: La dirección del Programa se reserva el derecho de cambiar algún relator/a en caso de fuerza mayor.
Carolina Leal
Departamento de Informática
Universidad Técnica Federico Santa María
Teléfono fijo: (+56) 322654424
WhatsApp: (+569) 4405 3325
-30% Alumni. Beneficio especial para exalumnos de pregrado, postgrado o diplomados de la universidad.
-20% Arancel anticipado. Descuento por pago ingresado en el sistema hasta 2 semanas antes del inicio del programa.
-15% Convenio empresas. Descuento aplicable a grupos de 3 o más colaboradores bajo una sola orden de compra.
Condiciones Generales
No acumulable: Los descuentos y beneficios no son acumulables entre sí. En caso de cumplir con más de una categoría, se aplicará siempre el beneficio mayor.
Vigencia: El descuento de Arancel Anticipado es válido estrictamente hasta la fecha señalada.
Quórum: La realización del programa está sujeta al cumplimiento del quórum mínimo de participantes.