To access the full text documents, please follow this link: http://hdl.handle.net/2099.1/3806

Eines software per la classificació i autocatalogació de material audiovisual
Alujas Tejada, Ramon
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions; Tarrés Ruiz, Francisco
El projecte consisteix en implementar diverses eines per la descripció continguts audiovisuals, en concret, el Color Layout Descriptor i el Motion Activity. Conjuntament amb aquestes eines i d'altres desenvolupades prèviament s'estudiaran i implementaran tècniques de classificació i anàlisis de continguts dels senyals audiovisuals centrades en la classificació de gènere televisiu i sumarització de continguts.
L’objectiu del present projecte consisteix en estudiar un dels descriptors de color que estandaritza MPEG-7 e implementar 2 eines software relacionades amb les funcionalitats d’aquest mateix. Per a realitzar l’estudi del descriptor, s’ha seguit el següent fil conductor : En primer lloc s’ha entès la causa per a la qual va sorgir l’estàndard MPEG-7. Aquest estàndard proporciona les pautes per a descriure tot tipus de contingut multimèdia, ja que en l’actualitat es disposa d’un gran volum d’informació, però el problema recau en el fet de cercar aquest material audiovisual de manera ràpida i eficaç. En segon lloc s’ha escollit com a descriptor per a realitzar l’estudi el Color Layout Descriptor (CLD), el qual és capaç de concentrar en pocs coeficients les distribucions espaials de color d’una imatge. S’ha comprovat que les aplicacions més importants del descriptor consisteixen en la cerca en una base de dades sobre un tipus de contingut en concret (cerca d’imatges o segments de vídeo comparant-les amb una petició). Posteriorment, observant que s’utilitza la comparació entre descriptors per a la cerca de material en una base de dades, s’ha analitzat el comportament enfront de l’edició digital. S’ha estudiat si els coeficients del descriptor canviaven al modificar brillantor i contrast a les imatges. A partir d'aquest anàlisis s'han desenvolupat modificacions del algorisme per tal de fer-lo més robust davant d'aquest tipus d’edicions. Per últim, s’han construït dues aplicacions o eines software que cobreixen les funcionalitats d’ image-to-image matching i vídeo clip-to-video clip matching. La primera aplicació intenta trobar en una base de dades les imatges més similars a una donada com a petició, i la segona, és capaç de trobar en temps real un segment de vídeo dins un flux de vídeo. Per a fer la cerca de les imatges a la base de dades audiovisual i per intentar trobar la seqüència de vídeo, les eines programades han utilitzat els resultats extrets de l’anàlisi del descriptor davant de l’edició digital, ja que d’aquesta manera s’han obtingut millors resultats.
Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament del senyal en les telecomunicacions
info:eu-repo/semantics/bachelorThesis
Universitat Politècnica de Catalunya
         

Show full item record

 

Coordination

 

Supporters