Machine Learning (Aprendizaje Automático) | 2019

 

 

 
Facultad de Ciencias Humanas

Escuela de Invierno en Métodos

Machine Learning (Aprendizaje Automático) | 2019

<< Ver cronograma de cursos >>

Descripción

La información generada por usuarios de celulares (su ubicación, registros de los sensores internos, llamadas), datos de transacciones financieras, registros de compras y opiniones vertidas en redes sociales, son solo ejemplos de los millones de datos que por segundo son generados y almacenados en la era digital. También los datos estáticos asociados a información demográfica, social, o que proviene regularmente de series de tiempo también son fuentes disponibles. Sin embargo, la información lisa y llana genera poco valor, limitándose a simples informes estadísticos. El aporte de la Ciencia de Datos es generar valor a partir de esa información. Uno de los ejemplos más conocidos es el de la cadena Target (tienda de descuentos) en los Estados Unidos. Sabiendo la cantidad de dinero que una familia está dispuesta a gastar ante la llegada de un bebé y con la posibilidad de enviar anuncios publicitarios específicos para la ocasión, el departamento de marketing de Target se preguntó si era posible perfilar clientas que estuvieran embarazadas (o su entorno familiar), aún sin tener esa información en forma explícita. La respuesta fue afirmativa: a partir de los patrones de consumo de productos y cruzando con los datos de registros de nacimientos no solo fue posible segmentar esa población de consumidores sino también tener una estimación de la ventana (en días) del nacimiento.

En el curso se tratarán los siguientes temas:

- Revisión de Conceptos básicos de estadística descriptiva y preprocesamiento de datos.

- Fundamentos: algoritmos paramétricos y no paramétricos; aprendizaje supervisado, no supervisado y semi-supervisado; sesgo, varianza y el compromiso entre ambos; sobre y sub-ajuste.

- Estimación del rendimiento: métricas; k-fold cross-validation; estratificación; bootstrapping.

- Métodos lineales: regresión lineal, regresión logística, análisis discriminante.

- Métodos no lineales: árboles de clasificación y de regresión; Naive Bayes; K-Nearest Neighbors; Support Vector Machines

- Métodos de agrupamiento: concepto de distancia y similitud; métodos jerárquicos y de densidad

- Ensambles: concepto; Bagging y Random Forest; Boosting


>> Ver programa <<


Objetivo

El objetivo del "Aprendizaje Automático" (una de las traducciones más utilizadas de Machine Learning) es analizar y descubrir patrones que ocurren en conjuntos de datos. El verdadero potencial se manifiesta cuando se analizan grandes volúmenes de información, o cuando las relaciones entre los datos son tan complejas o desconocidas que humanamente no es posible descubrirlas. El Aprendizaje Automático se enmarca dentro de una disciplina mayor que se denomina Data Science (o Ciencia de Datos). Ciencia de Datos es la intersección del conocimiento de diversas áreas, tales como el aprendizaje automático, matemática (fundamentalmente análisis estadístico), desarrollo de software, visualización y comunicación de resultados.


Prerrequisitos

Los requisitos previos incluyen conocimientos de probabilidad y estadística. También se sugiere un manejo básico de algún programa para la gestión de tablas de datos (puede ser hoja de cálculo, base de datos, software de estadística, etc).

El curso será ofrecido utilizando como herramienta la plataforma gratuita de Rapidminer, la cual brinda un entorno grafico amigable para desarrollar los diferentes modelos. No se requieren conocimientos previos de programación. Sin embargo, quienes lo deseen y conozcan en forma fluida el lenguaje Python recibirán de manera adicional información para implementar los modelos usando la librería scikit-learn. 

Para repaso de conceptos de probabilidad y estadística se sugiere el libro:
Allen B. Downey, “Think Stats: Probability and Statistics for Programmers”, O'Reilly Media (2011). Disponible online en http://greenteapress.com/thinkstats/


Instructores


Gustavo Vázquez
Director del Departamento de Informática y
Ciencias de la Computación
Facultad de Ingeniería y Tecnologías
Universidad Católica del Uruguay
gustavo.vazquez@ucu.edu.uy



Gustavo Vazquez es doctor en Ciencias de la Computación por la Universidad Nacional del Sur (Argentina). Actualmente es director del Departamento de Informática y Ciencias de la Computación de la Universidad Católica del Uruguay (Facultad de Ingeniería y Tecnologías). Sus áreas de investigación se centran en la predicción de propiedades de materiales poliméricos, informática química y aprendizaje automatizado aplicado en bioinformática. Actualmente es profesor del curso Aprendizaje Automático en la Universidad Católica del Uruguay.



Ernesto Ocampo
Profesor del Departamento de Informática y
Ciencias de la Computación
Facultad de Ingeniería y Tecnologías
Universidad Católica del Uruguay
eocampo@ucu.edu.uy




Ernesto Ocampo es doctor en Ciencias de la Computación por la Universidad de Alcalá (España) y magíster en Ingeniería de Software por la Universidad Pontificia de Salamanca (España). Actualmente es profesor TItular en el Departamento de Informática y Ciencias de la Computación, Universidad Católica del Uruguay (Facultad de Ingeniería y Tecnologías). Sus áreas de investigación se centran en sistemas Inteligentes aplicados a la decisión clínica y  metodologías de educación en Ciencias, Tecnología, Ingeniería y Matemáticas. Actualmente es profesor de los cursos Inteligencia Artificial y Aprendizaje Automático en la Universidad Católica del Uruguay.

 

Bookmark and Share