dc.contributor |
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions |
dc.contributor |
Tarrés Ruiz, Francisco |
dc.contributor.author |
Bosch Anglarill, Enric |
dc.date |
2006-02-24 |
dc.identifier.uri |
http://hdl.handle.net/2099.1/11012 |
dc.language.iso |
cat |
dc.publisher |
Universitat Politècnica de Catalunya |
dc.rights |
Attribution-NonCommercial-NoDerivs 3.0 Spain |
dc.rights |
info:eu-repo/semantics/openAccess |
dc.rights |
http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
dc.subject |
Àrees temàtiques de la UPC::So, imatge i multimèdia::Creació multimèdia::Vídeo digital |
dc.subject |
Image processing -- Digital techniques |
dc.subject |
MPEG (Video coding standard) |
dc.subject |
Imatges -- Processament -- Tècniques digitals |
dc.subject |
Estàndard MPEG |
dc.title |
Anàlisi audiovisual mitjançant descriptors MPEG-7 |
dc.type |
info:eu-repo/semantics/bachelorThesis |
dc.description.abstract |
L’objectiu és dur a terme una classificació audiovisual de dibuixos animats a través de descriptors MPEG-7.
Inicialment s’ha creat una base de dades audiovisual sobre dibuixos animats formada per 140 fitxers (de vídeo, d’àudio i de text).
A continuació s’ha implementat el descriptor de textura HTD definit per l'estàndard MPEG-7. Aquest descriptor analitza la potència de la imatge en direccions i bandes en el domini freqüencial.
S’han extret de cada segment de vídeo les característiques associades al descriptor de textura.
Aquestes característiques s’han utilitzat per introduir-les a quatre classificadors (PCA, LDA, M-NN i Fuzzy Integral) i obtenir els resultats de la classificació de vídeos de dibuixos animats.
Per tal de dur a terme una classificació multimodal, s’ha adjuntat el descriptor de textura amb altres descriptors (àudio, moviment i color) .
S’han generat fitxers de classificació amb 43 característiques d’àudio (volum mig, creuaments per zero, ample de banda...) i 79 de vídeo (mitja RGB, autocorrelograma, filtre Gabor nº1, ....).
A partir d’aquests fitxers s’han fet diverses proves de classificació.
En el cas d’utilitzar només el descriptor de textura, els resultats han estat d’un 77% de reconeixement de vídeos de dibuixos animats.
Utilitzant característiques d’àudio i vídeo, el resultat de reconeixement de dibuixos en el millor cas és del 85 %. |