To access the full text documents, please follow this link: http://hdl.handle.net/2099.1/18140

Implementació d'un crawler modular per a cercadors temàtics
Cabrera Corraliza, Julio
Universitat Politècnica de Catalunya. Departament d’Arquitectura de Computadors; Sánchez López, Sergio
El objetivo de este proyecto es el diseño e implementación de un crawler capaz de mantener actualizada una fuente de información temática. Un crawler o araña web es un software capaz de rastrear y descargar información de Internet. Esta información es tratada a posteriori por otro sistema que le da un uso. Google diseña e implementa este tipo de software con el fin de abastecer información a su buscador. Shuttle es el sistema propuesto como solución para el mantenimiento y actualización automática de una fuente de información. El Sistema posee herramientas propias por las cuales un usuario avanzado puede diseñar crawlers verticales sin la necesidad de programarlos. Además, si se requiere, puede proveer al sistema de una visión distribuida de los procesos en diferentes equipos.
Àrees temàtiques de la UPC::Informàtica::Sistemes d'informació
Search engines
Crawler
Internet
Cercador
Data Minning
Java
PHP
TCP
Servidor
Recuperació de la informació
Attribution-NonCommercial-NoDerivs 3.0 Spain
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
info:eu-repo/semantics/bachelorThesis
Universitat Politècnica de Catalunya
         

Show full item record

 

Coordination

 

Supporters