To access the full text documents, please follow this link: http://hdl.handle.net/10256/4304

ARI: Agent Recaptador d'Informació : desenvolupament d'una aplicació que reculli informació de portals web dedicats a la gestió de premsa
Gómez Pérez, Alejandra
Patow, Gustavo Ariel; Universitat de Girona. Escola Politècnica Superior
Tenint en compte l’evolució a Internet dels portals d’informació dels mitjans de comunicació, sorgeix la idea d’un motor de cerca orientat a la recaptació de notícies dispersades per les diferents pàgines web dels grans mitjans de comunicació espanyols, que permetés obtenir informació sobre “descriptors contractats” pels usuaris d’un portal. El primer objectiu és l’anàlisi de les necessitats que es volen cobrir per a un hipotètic client de l’aplicació, el segon és en l’àmbit algorítmic, cal obtenir una metodologia de treball que permeti l’obtenció de la notícia. En l’àmbit de la programació es consideren tres etapes: descarregar les pàgines web necessàries, que es farà mitjançant les eines que proporciona la llibreria cUrl; l’anàlisi de les notícies (obtenir tots els enllaços que corresponen a notícies, filtrar els descriptors per decidir si cal guardar la notícia, analitzar l’estructura interna de les notícies seleccionades per guardar-ne només les parts establertes), i la base de dades que ens ha de permetre organitzar i gestionar les notícies escollides
2012-04-22
-Cercadors d’Internet
-Indexació automàtica
-Premsa electrònica -- Bases de dades
-Web search engines
-Automatic indexing
-Electronic journals -- Databases
Aquest document està subjecte a una llicència Creative Commons: Reconeixement – No comercial – Sense obra derivada (by-nc-nd)
http://creativecommons.org/licenses/by-nc-nd/3.0/es/deed.ca
Bachelor Thesis
         

Show full item record

 

Coordination

 

Supporters