Abstract:
|
El projecte consisteix en implementar diverses eines per la descripció continguts audiovisuals, en concret, el Color Layout Descriptor i el Motion Activity. Conjuntament amb aquestes eines i d'altres desenvolupades prèviament s'estudiaran i implementaran tècniques de classificació i anàlisis de continguts dels senyals audiovisuals centrades en la classificació de gènere televisiu i sumarització de continguts. |
Abstract:
|
L’objectiu del present projecte consisteix en estudiar un dels descriptors de
color que estandaritza MPEG-7 e implementar 2 eines software relacionades
amb les funcionalitats d’aquest mateix.
Per a realitzar l’estudi del descriptor, s’ha seguit el següent fil conductor :
En primer lloc s’ha entès la causa per a la qual va sorgir l’estàndard MPEG-7.
Aquest estàndard proporciona les pautes per a descriure tot tipus de contingut
multimèdia, ja que en l’actualitat es disposa d’un gran volum d’informació, però
el problema recau en el fet de cercar aquest material audiovisual de manera
ràpida i eficaç.
En segon lloc s’ha escollit com a descriptor per a realitzar l’estudi el Color
Layout Descriptor (CLD), el qual és capaç de concentrar en pocs coeficients
les distribucions espaials de color d’una imatge. S’ha comprovat que les
aplicacions més importants del descriptor consisteixen en la cerca en una base
de dades sobre un tipus de contingut en concret (cerca d’imatges o segments
de vídeo comparant-les amb una petició).
Posteriorment, observant que s’utilitza la comparació entre descriptors per a la
cerca de material en una base de dades, s’ha analitzat el comportament
enfront de l’edició digital. S’ha estudiat si els coeficients del descriptor
canviaven al modificar brillantor i contrast a les imatges. A partir d'aquest
anàlisis s'han desenvolupat modificacions del algorisme per tal de fer-lo més
robust davant d'aquest tipus d’edicions.
Per últim, s’han construït dues aplicacions o eines software que cobreixen les
funcionalitats d’ image-to-image matching i vídeo clip-to-video clip matching.
La primera aplicació intenta trobar en una base de dades les imatges més
similars a una donada com a petició, i la segona, és capaç de trobar en temps
real un segment de vídeo dins un flux de vídeo.
Per a fer la cerca de les imatges a la base de dades audiovisual i per intentar
trobar la seqüència de vídeo, les eines programades han utilitzat els resultats
extrets de l’anàlisi del descriptor davant de l’edició digital, ja que d’aquesta
manera s’han obtingut millors resultats. |