Resumen del proyecto: |
La información disponible en soporte electrónico es cada vez más inmensa. Sin embargo, con las máquinas de
búsqueda actuales, acceder a la información útil para una necesidad específica , resulta a menudo un proceso
ineficiente y con resultados incompletos o insatisfactorios.
En el proyecto HERMES se construirán dos
aplicaciones de acceso a información textual multilingüe que demuestren una mejora significativa sobre
los sistemas actuales, mediante la utilización de técnicas de ingeniería lingüística. Las mejoras se
producirán en cuanto a la pertinencia de los resultados obtenidos así como en el análisis y presentación
de la información seleccionada.
La primera aplicación será un sistema de consulta para una hemeroteca digital
de gran volumen en cuatro idiomas (catalán, español, euskara e inglés). El sistema realizará un análisis
semántico de los documentos utilizando técnicas de categorización, clasificación, reconocimiento de
entidades, extracción de hipervínculos entre documentos relacionados, e indexación independiente del
idioma. El sistema aceptará consultas a la hemeroteca en cualquiera de los cuatro idiomas y proporcionará
así mismo información en los cuatro idiomas. También ofrecerá la posibilidad de hacer resúmenes automáticos
de un documento o colección de documentos relacionados con la consulta.
La segunda aplicación consistirá en
un sistema de búsqueda multilingüe de noticias on-line a través de Internet. El sistema será capaz de
encontrar noticias en cuatro idiomas, a partir de una única consulta en uno de esos idiomas. Para ello
el sistema traducirá y expandirá de forma interactiva con el usuario cada consulta, sugiriendo términos
y conceptos equivalentes para los otros idiomas. |
|