LSI UNIVERSIDAD NACIONAL DE EDUCACIÓN A DISTANCIA
Departamento de Lenguajes y Sistemas Informáticos
Curso de Doctorado

Minería de la Web



Estructura
3. Búsqueda en web

3.1 Lectura de artículos

3.2 Búsqueda de referencias y enlaces

3.3 Cuestionario / Resumen

3.4 Entrega

 

Bibliografía




3. Búsqueda
3.1 Lectura de artículos
3.2 Búsqueda de nuevas referencias y enlaces
3.3 Resumen
El resumen (5-10 páginas) debe tener la siguiente estructura:
  1. Características propias de la web que afectan a la búsqueda.
  2. Tipos de información a considerar en la búsqueda en web:
    1. Contenido textual.
    2. Información en los enlaces (link anchor information).
    3. Estructura de enlace entre páginas.
    4. Otros.
  3. Proceso de indexación de la información en web.
  4. Interfaces, browsing y visualización de la búsqueda
  5. Metabúsqueda
  6. Agentes web
  7. Áreas de investigación relacionadas con la búsqueda en web.
  8. Conferencias internacionales donde se aborda la búsqueda en web.
  9. Lista de referencias utilizadas.
  10. Lista de enlaces utilizados.
Se recomienda explorar los enlaces sugeridos para poder dar respuesta a los puntos del resumen.
3.4 Entrega
La entrega de:
  • Resumen en formato HTML
  • Lista de referencias y enlaces encontrados con breve comentario de los mismos
se realizará a través de la siguiente página: http://nlp.uned.es/WebMining/entrega
antes de la fecha indicada.


Bibliografía
 -   Mining the World Wide Web: An Information Search Approach
     G. Chang, M.J. Healey, J.A.M. McHugh, J.T.L Wang
     Kluwer Academic Publishers, 2001
 -   Mining the web: discovering knowledge from hypertext data
     Soumen Chakrabarti
     Morgan Kaufmann, 2002
 -   Web Content Mining with Java
     T. Loton
     John Wiley & Sons; 2002
 -   Programming Spiders, Bots, and Aggregators in Java
     J. Heaton
     Sybex; Book and CD-ROM edition, 2002
 -   Internet Agents
     F.C. Cheong
     New Riders publishing, Indianapolis, Indiana, 1996