ITEM

Descripción

El proyecto explora las técnicas de procesamiento de lenguaje natural aplicadas a la recuperación de información en dos vertientes:

Por un lado, en la incorporación de tecnologías lingüísticas a los sistemas clásicos de recuperación de información (básicamente estadísticos), para mejorar tanto la indiciación de textos como su posterior consulta.
Por otro lado, en aumentar el número de usuarios potenciales, facilitando el acceso mediante un sistema de consulta multilingüe a las bases de datos documentales.

Para ello, un primer paso es la implantación e integración de diversas herramientas lingüísticas ya disponibles, en una plataforma común estandar. A continuación, el proyecto plantea el desarrollo de técnicas de parsing robusto -según las necesidades de consulta e indiciación- y la creación de una base de conocimiento conceptual común para todas las lenguas contempladas.