Hermes

Resumen del proyecto:
La información disponible en soporte electrónico es cada vez más inmensa. Sin embargo, con las máquinas de búsqueda actuales, acceder a la información útil para una necesidad específica , resulta a menudo un proceso ineficiente y con resultados incompletos o insatisfactorios.

En el proyecto HERMES se construirán dos aplicaciones de acceso a información textual multilingüe que demuestren una mejora significativa sobre los sistemas actuales, mediante la utilización de técnicas de ingeniería lingüística. Las mejoras se producirán en cuanto a la pertinencia de los resultados obtenidos así como en el análisis y presentación de la información seleccionada.

La primera aplicación será un sistema de consulta para una hemeroteca digital de gran volumen en cuatro idiomas (catalán, español, euskara e inglés). El sistema realizará un análisis semántico de los documentos utilizando técnicas de categorización, clasificación, reconocimiento de entidades, extracción de hipervínculos entre documentos relacionados, e indexación independiente del idioma. El sistema aceptará consultas a la hemeroteca en cualquiera de los cuatro idiomas y proporcionará así mismo información en los cuatro idiomas. También ofrecerá la posibilidad de hacer resúmenes automáticos de un documento o colección de documentos relacionados con la consulta.

La segunda aplicación consistirá en un sistema de búsqueda multilingüe de noticias on-line a través de Internet. El sistema será capaz de encontrar noticias en cuatro idiomas, a partir de una única consulta en uno de esos idiomas. Para ello el sistema traducirá y expandirá de forma interactiva con el usuario cada consulta, sugiriendo términos y conceptos equivalentes para los otros idiomas.

Project summary:
The amount of information available in electronic form is steadily increasing. However, given the current search engines available, trying to find pertinent information for a given task often proves to be a frustrating and ineffective activity giving rise to incomplete and unsatisfactory results.

In the HERMES project two applications will be developed which facilitate the retrieval of multilingual textual information. These applications will offer significant improvements over current systems due to the incorporation of techniques taken from the field of linguistic engineering. The improvements will be seen in terms of the relevance of the obtained results and also in the analysis and presentation of the selected information.

The first application will be a system that deals with requests for information contained in a multilingual (Basque, Catalan, English and Spanish) digital news archive. In order to handle such requests the system will undertake a semantic analysis of the documents based upon categorisation and classification, entity recognition, the extraction of hyperlinks between related documents and indexation independent of the source language. The system will accept queries in any of the four languages and also provide results found in any of the four. Furthermore, it will provide automatic summaries of any documents related to the petition.

The second application will be a Web-based multilingual search system of online news (e.g., Web-based n ewspapers). The system will be capable of finding news items in any of the four languages included in the project, based upon a single petition made in any of the four languages. In order to achieve this goal the system interactively translates and expands each petition providing the user with pertinent concepts and terminology for the other languages.