LSI UNIVERSIDAD NACIONAL DE EDUCACIÓN A DISTANCIA
Departamento de Lenguajes y Sistemas Informáticos
Curso de Doctorado

Minería de la Web



Estructura
7. Dinámica de la web
7.1 Lectura de artículos

7.2 Búsqueda de referencias y enlaces

7.3 Cuestionario / Resumen

7.4 Entrega

 

Bibliografía




7. Dinámica de la web
7.1 Lectura de artículos
7.2 Búsqueda de nuevas referencias y enlaces
7.3 Resumen
El resumen (5-10 páginas) debe tener la siguiente estructura:
  1. Definición y objetivos del estudio de la dinámica de la  web
  2. Características de la web susceptibles de estudio
  3. Ley de Zipf, "power laws" en la web
  4. Tamaño y tendencia de crecimiento de la web
  5. Web pública y web oculta
  6. Idiomas en la web
  7. Dominios en la web
  8. Estudios sobre la web española
  9. Áreas de investigación relacionadas 
  10. Conferencias internacionales 
  11. Lista de referencias utilizadas.
  12. Lista de enlaces utilizados.
Se recomienda explorar los enlaces sugeridos para poder dar respuesta a los puntos del resumen.
7.4 Entrega
La entrega de:
  • Resumen en formato HTML
  • Lista de referencias y enlaces encontrados con breve comentario de los mismos
se realizará a través de la siguiente página: http://nlp.uned.es/WebMining/entrega
antes de la fecha indicada.


Bibliografía
 -   Mining the World Wide Web: An Information Search Approach
     G. Chang, M.J. Healey, J.A.M. McHugh, J.T.L Wang
     Kluwer Academic Publishers, 2001
 -   Mining the web: discovering knowledge from hypertext data
     Soumen Chakrabarti
     Morgan Kaufmann, 2002
 -   Web Content Mining with Java
     T. Loton
     John Wiley & Sons; 2002
 -   Programming Spiders, Bots, and Aggregators in Java
     J. Heaton
     Sybex; Book and CD-ROM edition, 2002
 -   Internet Agents
     F.C. Cheong
     New Riders publishing, Indianapolis, Indiana, 1996