Use this identifier to quote or link this document: http://hdl.handle.net/2072/43121

Estudio sobre la información de texto contenida en imágenes web
Robles Mestre, Sergi
Universitat Autònoma de Barcelona. Escola Tècnica Superior d'Enginyeria; Karatzas, Dimosthenis
La indexació i la recerca de pàgines web es basa en l’anàlisi de text. La tecnologia actual encara no pot processar d’una manera eficient i suficientment ràpida el text contingut a les imatges de les pàgines web. Aquest fet planteja un problema important d’indexació però també d’inaccessibilitat. Per poder quantificar aquest problema hem desenvolupat una aplicació software que ens permet realitzar un estudi sobre aquesta situació. Hem utilitzat aquest software per analitzar un conjunt de pàgines web representatives de la situació actual a Internet. Aquests resultats obtinguts s’han analitzat i comparat amb estudis anteriors.
La indexación y la búsqueda de páginas web se basan en el análisis de texto. La tecnología actual, aún no puede procesar de una manera eficiente y suficientemente rápida el texto contenido en las imágenes de las páginas WWW. Este hecho plantea un problema importante de indexación pero también de inaccesibilidad. Para poder cuantificar este problema hemos desarrollado una aplicación software que nos permite realizar un estudio sobre esta situación. Hemos utilizado este software para analizar un conjunto de páginas web representativas de la situación actual en Internet. Estos resultados obtenidos se han analizado y comparado con estudios anteriores.
Indexing and searching for WWW pages is relying on analyzing text. Current technology cannot process in an efficient way and quickly enough the text embedded in images on WWW pages. This fact is a significant indexing problem but inaccessibility too. To quantify this problem we have developed a software application that allows us to conduct a study on this. We have used this software to analyze a set of web pages representing the current Internet situation. These results have been analyzed and compared with previous studies.
Nota: Aquest document conté originàriament altre material i/o programari només consultable a la Biblioteca de Ciència i Tecnologia.
2009-07
004 - Informàtica
Imatges -- Processament
Informació -- Sistemes d'emmagatzematge i recuperació
Pàgines web -- Avaluació
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original, la universitat i l'escola i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.5/es/)
info:eu-repo/semantics/bachelorThesis
         

Full text files in this document

Files Size Format Description
PFC_SergiRoblesMestre_annex.pdf 203.1 KB PDF Annex
PFC_SergiRoblesMestre.pdf 1.805 MB PDF Projecte

Show full item record

 

Coordination

 

Supporters