Enrique Alfonseca: "Computación paralela y distribuida, Extracción de Información y Resúmenes Automáticos"

Calendario

Ponente: Enrique Alfonseca (Google Zurich)

Fecha: 12-16 septiembre de 2011

Lugar de celebración: Facultad de Psicología, UNED (mapa)

Resumen

El curso tendrá dos componentes principales: en la primera parte se introducirán tecnologías de procesamiento distribuido a gran escala: MapReduce y BigTable, describiendo la infraestructura desde un punto de vista teórico, sus implementaciones y proporcionando consejos acerca de cómo programar un MapReduce de manera eficiente. En la segunda parte se presentará un tutorial de extracción de información de dominio abierto para el aprendizaje de atributos y valores de entidades.

Bio

Enrique Alfonseca is a senior Research Scientist at Google, where he works on Natural Language Processing and Information Retrieval. During the past four years he has done important contributions to different products in the company, including query expansion and relevance estimation for sponsored search, ranking for web search, information extraction, lexical semantics and automatic text summarization.

Lugar de Celebración

Facultad Psicología, UNED

c/ Juan del Rosal, 10

Ciudad Universitaria

28040 Madrid

Horarios

lunes 12 - viernes 16: 11h00 - 13h00, Sala de Juntas 1.26 (primera planta), Facultad de Psicología, UNED

Estructura del Curso

Introducción a MapReduce.
BigTable, MapReduce, Pregel, Dremel.
Recuperación y Extracción de Información a escala de la Web.
Generación de resúmenes, LDA y LDA distribuido a gran escala.

Materiales

Durante los seminarios, para poder realizar los ejemplos prácticos de MapReduce y Hadoop vamos a necesitar tener instalado en nuestro portátil un cliente SSH, una máquina virtual (p. ej., VirtualBox o VMware Player) y la imagen de Cloudera correspondiente a nuestra máquina virtual.