Propuestos

  • Título: Sistema para la anonimización de informes médicos.
    Descripción: Los informes médicos de alta se encuentran en formato electrónico y se pueden utilizar para diferentes tareas, de manera que procesarlos de forma automática es necesario. Esto no es posible ya que los informes contienen datos sensibles de doctores, pacientes, familiares, etc. Por ello, siempre, a la hora de trabajar con este tipo de documentos es necesario anonimizarlos para eliminar toda la información sensible. El objetivo de este proyecto es precisamente ese, anonimizar los datos de informes de alta de un hospital.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Titulación: Grado en Ingeniería Informática, Grado en Ingeniería del Software, Grado en Ingeniería de Computadores.
    Conocimientos previos deseables: Java o Python

  • Título: Identificación y desambiguación de Acrónimos en informes de alta de hospital.
    Descripción: Las siglas y abreviaturas en textos de dominio médico son generalizadas y a menudo llevan asociado diferentes sentidos posibles. Por ello es necesario asignar el sentido apropiado según el contexto en el que se encuentren aquellas siglas y abreviaturas ambiguas. En primer lugar es necesario identificar las siglas y abreviaturas para después desambiguar su sentido. En este proyecto se pretende diseñar e implementar un sistema para el reconocimiento automático de acrónimos en documentos del dominio médico.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Titulación: Grado en Ingeniería Informática, Grado en Ingeniería del Software, Grado en Ingeniería de Computadores.
    Conocimientos previos deseables: Java o python

  • Título: Detección y corrección automática de errores en el texto de informes de alta de hospital.
    Descripción: Es frecuente encontrar errores e imprecisiones de tipo léxico, ortográfico y gramatical en los informes de alta de un hospital. Esto puede originar diferentes problemas, dependiendo del tipo de error (que el paciente no entienda algunas partes del informe, que por algún error ortográfico se confunda el diagnóstico emitido por el facultativo, etc.). Si se quieren procesar de forma automática los informes de alta en formato electrónico, sería necesario previamente una fase de detección de algunos de estos errores para tratar de corregirlos. Ese es el propósito de este TFG.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Titulación: Grado en Ingeniería Informática, Grado en Ingeniería del Software, Grado en Ingeniería de Computadores.
    Conocimientos previos deseables: Java o Python

  • Título: Clustering de informes de alta de un hospital para el seguimiento de los códigos CIE anotados.
    Descripción: Los informes de alta de un hospital se anotan con una serie de códigos CIE (códigos que identifican diagnósticos y procedimientos). El realizar un agrupamiento automático de los informes (clustering de documentos), puede permitir encontrar informes con los mismos diagnósticos y, por lo tanto, comprobar si hay una correlación de los códigos CIE en los informes. En este proyecto se debe desarrollar un sistema que realice un agrupamiento de los informes básico y luego tenga un módulo de visualización de los códigos anotados para cada informe de cada grupo, con el fin de analizar las relaciones entre los códigos y los informes similares.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Titulación: Grado en Ingeniería Informática, Grado en Ingeniería del Software, Grado en Ingeniería de Computadores.
    Conocimientos previos deseables: Java o Python

  • Título: Detección de la negación en documentos clínicos.
    Descripción: La negación se utiliza para modificar el valor de verdad de una proposición, sintagma o palabra sobre la que se aplica. Diferentes mecanismos permiten expresar negación. Su tratamiento implica identificar la presencia de la negación en el texto y, posteriormente, determinar los términos dentro de su ámbito. En los últimos años el tratamiento de este fenómeno ha despertado mucho interés en investigadores de tareas relacionadas con el Procesamiento del Lenguaje Natural, aunque la mayor parte de la investigación realizada es sobre textos en inglés. En este proyecto se pretende construir un sistema sencillo que sea capaz de detectar negación en textos de documentos clínicos de hospitales españoles.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Titulación: Grado en Ingeniería Informática, Grado en Ingeniería del Software, Grado en Ingeniería de Computadores.
    Conocimientos previos deseables: Java o Python

En desarrollo

  • Título: Desarrollo de una interfaz gráfica para la visualización del texto relacionado con los códigos CIE de los informes médicos.
    Descripción: Los códigos CIE representan una codificación internacional para clasificar enfermedades y procedimientos a aplicar. Los informes de alta de los hospitales deben ser anotados con estos códigos CIE. Recientemente se ha cambiado la codificación, pasando de la versión CIE-9 a la versión CIE-10, más completa, por lo que se está tratando de construir sistemas que sean capaces de anotar los informes con los códigos CIE de forma automática. De cara a una validación de estos códigos por parte de expertos, sería muy útil disponer de una herramienta que visualizará aquellas partes del texto del informe que puedan haber dado lugar a la anotación de los códigos y ese es precisamente el propósito del TFG, el desarrollo de esta herramienta con una interfaz gráfica que permita seleccionar los códigos y resalte el texto asociado a cada uno de ellos.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Alejandro García-Caro Nombela
    Titulación: Grado en Ingeniería Informática.

  • Título: Deep Learning para análisis de sentimientos en Twitter.
    Descripción: Es muy habitual analizar los tweets para comprobar si son positivos o negativos en lo que describen. Se pretenden aplicar técnicas de deep learning para una clasificación automática de los tweets en función de su polaridad.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Alejandro Matos Caballero
    Titulación: Grado en Ingeniería Informática.

  • Título: Identificación y desambiguación de Acrónimos en documentos científicos.
    Descripción: En documentos científicos del dominio médico es muy común encontrar siglas y abreviaturas y, además, también es muy frecuente que estás siglas y abreviaturas sean ambiguas, pudiendo tener diferentes sentidos posibles. En este TFG se pretende desarrollar un sistema que sea capaz de reconocer las siglas y abreviaturas de los textos, para después desambiguarlas y encontrar su sentido correcto en función del texto en el que se encuentren. Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Víctor Zabalgo
    Titulación: Grado en Ingeniería de Computadores.

Dirigidos

  • Título: La desambiguación multilingüe de nombres de personas en la Web.
    Descripción: Cuando se realiza una consulta de un nombre de persona en un buscador las páginas devueltas pueden corresponder a personas diferentes que se llaman igual y dichas páginas pueden estar escritas en diferentes lenguas. Este problema de desambiguación se aborda normalmente como un problema de clustering en el que se pretende obtener grupos de páginas de forma que cada grupo corresponda a una persona diferente y pueda contener páginas en diferentes lenguas. Se pretende implementar un sistema que permita la traducción y establecimiento de equivalencias entre el vocabulario de las diferentes lenguas.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Titulación: Grado en Ingeniería Informática.
    Curso: 2015/2016

  • Título: Clustering incremental para agrupamiento de tweets.
    Descripción: Agrupamiento de tweets según su temática de forma incremental. Se puede estar hablando de un tema en Twitter durante horas, días o incluso semanas, por ello en este caso habría que agrupar los tweets del mismo tema teniendo en cuenta que un grupo una vez creado puede crecer con más tweets relacionados.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Celia Losada Gómez
    Titulación: Grado en Ingeniería Informática.

    Curso: 2015/2016

  • Título: Desambiguación de Acrónimos en Twitter dentro del dominio médico.
    Descripción: Las siglas y abreviaturas en textos de dominio médico son generalizadas y a menudo llevan asociado diferentes sentidos posibles. Por ello es necesario asignar el sentido apropiado según el contexto en el que se encuentren aquellas siglas y abreviaturas ambiguas. En primer lugar es necesario identificar las siglas y abreviaturas para después desambiguar su sentido. Los tweets tienen características propias que hacen que esta tarea difiera en algunos aspectos con respecto a otro tipo de documentos. En este proyecto se pretende diseñar e implementar un sistema para el reconocimiento automático de acrónimos en tweets y su desambiguación.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Carmen Navacerrada
    Titulación: Grado en Ingeniería Informática.

    Curso: 2015/2016

  • Título: Clustering multilingüe de tweets.
    Descripción: Los tweets tienen características propias que hacen que el problema de su agrupación automática difiera en muchos aspectos del de la agrupación de otro tipo de documentos. En primer lugar se trata de textos cortos, de un máximo de 140 caracteres, y además en muchos casos se utiliza una forma de lenguaje que se aleja del lenguaje normalizado, incluyendo elementos propios de Twitter.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Manuel Alejandro Diaz
    Titulación: Grado en Ingeniería Informática.
    Curso: 2015/2016
  • Título: Reconocimiento de Entidades Nombradas en Tweets aplicado al dominio médico.
    Descripción: En este proyecto se pretende diseñar e implementar un sistema para el reconocimiento automático de Entidades nombradas del dominio médico en tweets, para reconocer nombres de enfermedades, medicamentos, etc.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Juan Manuel Tena Escobar
    Titulación: Ingeniería Informática-Administración y Dirección de Empresas. Curso: 2014/2015

  • Título: OMIT: Opinion Mining in Teaching. Un sistema para la evaluación y mejora de la docencia basado en análisis de opinión.
    Descripción: En una sociedad donde la opinión de los usuarios cada vez cobra más importancia, se traslada la misma idea al ámbito docente, para que la opinión de los alumnos sea una parte importante en el proceso de evaluación docente.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Jónatan Núñez
    Titulación: Grado en Ingeniería del Software
    Curso: 2012/2013

  • Título: INewsCloud: Un sistema de interfaces web para la plataforma iNewsCollege.
    Descripción: El contenido de diferentes noticias clasificadas se procesa y se manipula para mostrar diferentes datos a través de varias interfaces adaptadas a una mejor localización de la información.
    Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Jesús Palomo (jesus.palomo@urjc.es)
    Alumno: Raquel Plaza
    Titulación: Ingeniería Informática
    Curso: 2012/2013

  • Título: Nuevo sistema fuzzy para identificar cognados entre múltiples pares de idiomas.
    Descripción: Identificar pares de palabras que son similares ortográficamente es muy útil para diferentes tareas dentro del Procesamiento del Lenguaje Natural. Se construye un sistema que sea capaz de identificar cognados mediante lógica borrosa.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Eva Teruel Pinto
    Titulación: Ingeniería Informática
    Curso: 2011/2012

  • Título: Sistema para el análisis automático de noticias deportivas.
    Descripción: A diario se publican gran cantidad de noticias en diferentes medios deportivos, las cuales pueden o no contener información de utilidad para poder predecir cómo serán los resultados de la siguiente jornada. Este proyecto trata de obtener los datos que sí sean de utilidad, descartando el resto.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Irene Callejo
    Titulación: Ingeniería Técnica de Informática de Gestión-ADE
    Curso: 2011/2012

  • Título: INewsCollege: Plataforma para la docencia basada en la Web 2.0 y en la actualidad relevante.
    Descripción: Desarrollo de un portal donde se presentan noticias actualizadas en varios idiomas. Para ello, se requiere el desarrollo de un motor de descarga automática de noticias, así como de modelos de análisis y técnicas para agruparlas y posteriormente visualizarlas en el portal. Además, se incluye también; una plataforma wiki para permitir a los usuarios del portal introducir comentarios y contribuciones e interaccionar con el sistema.
    Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Jesús Palomo (jesus.palomo@urjc.es)
    Alumno: Aránzazu Pardo
    Titulación: Ingeniería Informática
    Curso: 2011/2012

  • Título: Bee News: un Sistema de Clustering Multilingüe de Noticias extraídas de RSS feeds.
    Descripción: Procesamiento y organización en el tiempo de la información contenida en canales RSS que se publican y actualizan varias veces al día.
    Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Eduardo García (eduardo.pardo@urjc.es)
    Alumno: Rus Poves Moreno
    Titulación: Ingeniería Informática
    Curso: 2010/2011

  • Título: Sistema de identificación y clasificación de Entidades Nombradas basado en LingPipe.
    Descripción: Extensión de la herramienta LingPipe para la identificación y clasificación de Entidades Nombradas en varios idiomas.
    Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Eduardo García (eduardo.pardo@urjc.es)
    Alumno: Daniel Álvarez Zorita
    Titulación: Ingeniería Técnica en Informática de Sistemas
    Curso: 2010/2011

  • Título: Sistema de clustering de noticias vía RSS feeds.
    Descripción: A través de los canales RSS está disponible información diaria y actualizada, por lo que procesar dicha información agrupándola por temática resulta de interés para localizar la información deseada.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Carlos Huerta González
    Titulación: LADE+ITIG
    Curso: 2009/2010

  • Título: Portal de conocimiento multilingüe destinado a la educación.
    Descripción: A diario se publican miles de noticias en diferentes medios, por lo que es interesante filtrar aquellas que sean relevantes para diferentes asignaturas de titulaciones de la URJC.
    Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Jesús Palomo (jesus.palomo@urjc.es)
    Alumno: Francisco Javier Romo García
    Titulación: Ingeniería Técnica en Informática de Gestión
    Curso: 2009/2010

  • Título: Estudio de medidas de similitud ortográfica para la identificación de cognados y Entidades Nombradas equivalentes.
    Descripción: Las Entidades Nombradas (nombres de personas, lugares, organizaciones, etc.) son una buena fuente de información para diferentes tareas dentro del Procesamiento del Lenguaje Natural. Por ello, establecer equivalencias entre idiomas de las Entidades proporciona un buen recurso para tareas multilingües. Este proyecto identifica Entidades Nombradas cognadas y de clasificar otro tipo de palabras como cognadas o no.
    Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Eduardo García (eduardo.pardo@urjc.es)
    Alumno: José Enrique Jiménez Blanco
    Titulación: Ingeniería Informática
    Curso: 2008/2009

  • Título: Sistema de clasificación basado en redes neuronales para la identificación de cognados.
    Descripción: Este proyecto construye un sistema de clasificación binaria, basado en un red neuronal, para identificar pares de palabras que sean cognados/falsos amigos o no relacionados.
    Tutores: Eduardo García (eduardo.pardo@urjc.es) y Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: José Luis González Aranda
    Titulación: Ingeniería Técnica en Informática de Sistemas
    Curso: 2008/2009

  • Título: Algoritmo para el Clustering multilingüe de noticias.
    Descripción: Creación de un algoritmo de clustering que agrupa noticias similares. El agrupamiento se realiza con independencia de la lengua en la que están escritas las noticias.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Sergio Más Huelves
    Titulación: Ingeniería Técnica en Informática de Sistemas
    Curso: 2008/2009

  • Título: Portal de noticias multilingües clasificadas automáticamente destinado a la educación superior.
    Descripción: Portal web que presenta las noticias en distintos idiomas agrupadas por su temática, donde cada día se actualizan dichas noticias.
    Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Eduardo García (eduardo.pardo@urjc.es)
    Alumno: Miguel Ángel Blazquez López
    Titulación: Ingeniería Técnica en Informática de Gestión
    Curso: 2008/2009

  • Título: Representación para el Clustering Multilingüe de noticias.
    Descripción: Estudio y propuesta de diferentes representaciones basadas en Entidades Nombradas, teniendo en cuenta su categoría y su posición, para la agrupación de noticias multilingües.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Mª Esther Sanjuán Mediavilla
    Titulación: Ingeniería Informática
    Curso: 2008/2009

  • Título: Development and integration of an awareness applications manager into ASTRA.
    Descripción: Creación e integración de un sistema para gestionar aplicaciones "awareness", incluyendo funcionalidades para compartirlas, etiquetarlas, localizarlas, recuperarlas, etc.
    Tutores: Soto Montalvo (soto.montalvo@urjc.es) y Monica Divitini (NTNU)
    Alumno: David Rozas Domingo
    Titulación: Ingeniería Informática
    Curso: 2008/2009

  • Título: Herramienta de soporte para la generación de Representaciones para procesos de Clustering.
    Descripción: Herramienta para la generación de diferentes representaciones de documentos para tomarlas como entrada de algoritmos de clustering. Cada representación se generará atendiendo a diferentes criterios, donde la herramienta facilitará la selección de dichos criterios.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Miguel Ángel Guadix
    Titulación: Ingeniería Técnica en Informática de Sistemas
    Curso: 2007/2008

  • Título: Identificación de Cognados mediante Lógica Borrosa.
    Descripción: Los cognados constituyen una fuente de información muy útil para muchas tareas dentro del Procesamiento del Lenguaje Natural. Este proyecto tratará de identificar cognados entre noticias escritas en cuatro lenguas diferentes, con independencia de cuáles sean dichas lenguas.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Mª Teresa Peña López
    Titulación: Ingeniería en Informática
    Curso: 2007/2008

  • Título: Crawler de noticias online.
    Descripción: Diseñar e implementar una herramienta que permita descargar noticias en varios idiomas de periódicos online, agrupando aquellas que estén relacionadas. Asimismo, se analizarán las noticias y formatearán a XML siguiendo una estructura determinada, construyendo un corpus de noticias bilingüe comparable.
    Tutores: Alberto Pérez García-Plaza y Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Eduardo García Pardo
    Titulación: Ingeniería en Informática
    Curso: 2006/2007

  • Título: Alineación de oraciones y párrafos en corpus paralelo.
    Descripción: Diseñar e implementar una herramienta que permita alinear, con diferente grado de granularidad, documentos pertenecientes a un corpus paralelo escrito en castellano y euskera.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Marta Plaza Serrano
    Titulación: Ingeniería en Informática
    Curso: 2006/2007

  • Título: Desarrollo de la plataforma AllTheShopping con Ruby on Rails.
    Descripción: Evaluación del framework para aplicaciones web que ha supuesto una revolución en el desarrollo web.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Álvaro Everlet Fernández
    Titulación: Ingeniería en Informática
    Curso: 2005/2006

  • Título: Alineación de nombres propios en corpus paralelos.
    Descripción: Un corpus paralelo es una colección de documentos con los mismos contenidos pero en diferentes lenguas. Se pretende establecer correspondencias entre nombres de dos lenguas. Para ello, será necesario seguir un algoritmo de alineación.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es)
    Alumno: Sergio Hernández Moreno
    Titulación: Ingeniería en Informática
    Curso: 2005/2006

  • Título: Plataforma de soporte para WSD.
    Descripción: Word Sense Desambiguation (WSD) o desambiguación del sentido de las palabras, consiste en asociar una palabra dada de un texto con una definición de un sentido o significado, esto permite distinguirla de otros significados posibles de esa palabra.
    Tutores: Victor Fresno Fernández y Soto Montalvo (soto.montalvo@urjc.es )
    Alumno: Daniel Núñez Yuste
    Titulación: Ingeniería en Informática
    Curso: 2005/2006

  • Título: Herramienta para el Clustering Multilingüe sobre Corpus Comparables.
    Descripción: Diseñar e implementar una herramienta capaz de interactuar con la librería CLUTO y realizar un clustering multilingüe sobre corpora comparables.
    Tutor: Soto Montalvo (soto.montalvo@urjc.es )
    Alumno: Alejandro Navarro Díaz
    Titulación: Ingeniería en Informática
    Curso: 2005/2006

  • Título: Implementación del filtro de partículas para seguimiento visual, utilizando el paradigma de orientación a objetos.
    Descripción: Desarrollar una aplicación para realizar el seguimiento visual de múltiples objetos en una secuencia de imágenes. Se trata de implementar un método de estimación basado en técnicas de simulación, en concreto un filtro de partículas. El lenguaje a utilizar es C++.
    Tutores: Juan José Pantrigo Fernández (juanjose.pantrigo@urjc.es ) y Soto Montalvo (soto.montalvo@urjc.es )
    Alumno: Belén Sáenz Rubio
    Titulación: Ingeniería Técnica en Informática de Sistemas
    Curso: 2005/2006

  • Título: eXitor 2.0: un editor XML con prevalidación y soporte XML-Schema.
    Descripción: Diseño e implementación de una librería para facilitar el manejo de documentos XML-Schema y su integración en una herramienta de edición de documentos XML ya existente.
    Tutores: Víctor Fresno Fernández y Soto Montalvo (soto.montalvo@urjc.es )
    Alumno: Félix Coto Ortiz
    Titulación: Ingeniería Informática
    Curso: 2004/2005

  • Título: Alineación de entidades en corpus XML comparables.
    Descripción: Desarrollo de una herramienta para realizar el proceso de alineación entre las entidades de un corpus comparable.
    Tutores: Raquel Martínez y Soto Montalvo (soto.montalvo@urjc.es )
    Alumno: Carlos Romero Barrionuevo
    Titulación: Ingeniería Informática
    Curso: 2004/2005

  • Título: Interfaz para la visualización de contenidos educativos basados en web en formato de libro electrónico.
    Descripción: Desarrollo de una interfaz en formato de libro para la visualización de contenidos educativos.
    Tutores: Soto Montalvo (soto.montalvo@urjc.es ) y Jaime Urquiza Fuentes (jaime.urquiza@urjc.es )
    Alumno: Daniel Granizo Ayuso
    Titulación: Ingeniería Técnica en Informática de Gestión
    Curso: 2004/2005

  • Título: SerXML - Serialización en XML de objetos Java.
    Descripción: Estudio e implementación de la serialización de objetos Java en XML. La principal característica de esta serialización es que debe aprovechar toda la riqueza semántica de la especificación XML-Schema y que los documentos XML generados no tengan etiquetas y atributos que hagan ver que parten de una serialización de objetos Java.
    Tutores: Víctor Fresno Fernández y Soto Montalvo Herranz (soto.montalvo@urjc.es)
    Alumno: David Arbona Navarro
    Titulación: Ingeniería Informática
    Curso: 2003/2004