NLP&IR-UNED
  • M. Felisa Verdejo (Coordinadora/IP)
  • Enrique Amigó
  • Lourdes Araújo
  • Víctor Fresno
  • Ana García-Serrano
  • Julio Gonzalo
  • Fernando López-Ostenero
  • Raquel Martínez Unanue
  • Anselmo Peñas
  • Víctor Peinado (Técnico de Gestión)
  • Damiano Spina
  • Álvaro Rodrigo
  • Bernardo Cabaleiro
  • Juan Manuel Cigarrán
  • Ángel Castellanos
  • David Hernández
  • Agustín Daniel Delgado

El grupo Natural Language Processing and Information Retrieval está formado actualmente por 20 investigadores, 9 de ellos doctores permanentes, de la Escuela Técnica Superior de Ingeniería Informática de la UNED. M. Felisa Verdejo, investigadora principal del grupo, es la coordinadora del consorcio. El grupo comenzó su actividad investigadora en 1993 y desde entonces ha estado involucrado en 14 proyectos de investigación financiados con cargo a convocatorias públicas con concurrencia competitiva, tanto del plan nacional como de los programas marco de la Comisión Europea. En los últimos cinco años se han generado alrededor de un centenar de publicaciones en revistas y congresos de impacto, se han presentado 8 tesis doctorales y otras 9 están siendo dirigidas en la actualidad.

Los temas de interés dentro del grupo se pueden agrupar en torno a dos grandes líneas de investigación básicas:

  1. Acceso Inteligente a la Información: asistentes de búsqueda translingües para recuperación de documentos, sistemas de búsqueda de respuestas y de recuperación de imágenes, síntesis de información, recuperación de terminología multilingüe, técnicas de Procesamiento del Lenguaje Natural superficial y eficiente para tareas de acceso a la información, organización inteligente, visualización y navegación a través de resultados de buscadores, ontologías y sistemas basados en conocimiento, representación y clustering multilingüe de documentos y clasificación automática de páginas web.
  2. Adquisición y Representación de Conocimiento Léxico y Gramatical: bases de datos léxicas, redes semánticas multilingües (EuroWordNet), tesauros multilingües, desambiguación semántica y minería de la Web para la extracción de información léxica.

Los miembros del grupo participan activamente en la organización de evaluaciones competitivas internacionales y en la propuesta de nuevos marcos de evaluación dentro del marco del Cross Language Evaluation Forum (CLEF) y de otros foros: iCLEF, CLEF QA, AVE, Web People Search.

Los proyectos de investigación del grupo más relevantes para las líneas de investigación del consorcio son: QEAVis: Quantitative Evaluation of Academic Websites Visibility (TIN 2007-67581-C02-01) en el que se aplican las Tecnologías del Lenguaje a la visibilidad académica en la Web, desarrollando indicadores web (cibermetría) y estudiando la visibilidad de los sitios web académicos, haciendo especial énfasis en la presencia del Español y en el ámbito de las disciplinas relacionadas con las Humanidades, que requieren una ayuda especial respecto a su posicionamiento en web; TrebleCLEF: Evaluation Best Practice and Collaboration for Multilingual Information Access (FP7, ICT-1-4-1 #215231) centrado en la evaluación de sistemas multilingües de Acceso a la Información; TEXT-MESS: Minería de Textos Inteligente, Interactiva y Multilingüe basada en Tecnología del Lenguaje Humano (TIN2006-15265-C06), centrado en el desarrollo de tecnologías inteligentes, interactivas y multilingües de minería de textos que integren búsqueda documental en páginas web, búsqueda multimedia sobre imágenes y búsqueda sobre información semi-estructurada; MedIEQ: Quality Labeling of Medical Web content using Multilingual Information Extraction (FP6, Public Health A/790604) cuyo objetivo era el desarrollo de una aplicación de etiquetado automático de información multilingüe en sitios web médicos; MultiMATCH: Multilingual/Multimedia Access to Cultural Heritage (FP6-2005-IST-5 #033104 que perseguía la creación de sistemas capaces de ofrecer al usuario acceso a información heterogénea sobre la herencia cultural europea en distintos tipos de medios y lenguas; R2D2: Recuperación de Respuestas en Documentos Digitalizados (TIC2003-07158-C04), centrado en la evaluación de sistemas de respuestas translingües.

 
RocketTheme Joomla Templates