El proyecto explora las técnicas de procesamiento de lenguaje
natural aplicadas a la recuperación de información en dos vertientes:
-
Por un lado, en la incorporación de tecnologías lingüísticas
a los sistemas clásicos de recuperación de información (básicamente estadísticos),
para mejorar tanto la indiciación de textos como su posterior consulta.
-
Por otro lado, en aumentar el número de usuarios potenciales,
facilitando el acceso mediante un sistema de consulta multilingüe a las
bases de datos documentales.
Para ello, un primer paso es la implantación e integración
de diversas herramientas lingüísticas ya disponibles, en una plataforma
común estandar. A continuación, el proyecto plantea el desarrollo de técnicas
de parsing robusto -según las necesidades de consulta e indiciación- y
la creación de una base de conocimiento conceptual común para todas las
lenguas contempladas.