Title:
|
UPC system for the 2015 MediaEval multimodal person discovery in broadcast TV task
|
Author:
|
India, Miquel; Varas González, David; Vilaplana Besler, Verónica; Morros Rubió, Josep Ramon; Hernando Pericás, Francisco Javier
|
Other authors:
|
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions; Universitat Politècnica de Catalunya. GPI - Grup de Processament d'Imatge i Vídeo; Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla |
Abstract:
|
This paper describes a system to identify people in broadcast TV shows in a purely unsupervised manner. The system outputs the identity of people that appear, talk and can be identified by using information appearing in the show (in our case, text with person names). Three types of monomodal technologies are used: speech diarization, video diarization and text detection / named entity recognition. These technologies are combined using a linear programming approach
where some restrictions are imposed. |
Subject(s):
|
-Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic -Àrees temàtiques de la UPC::So, imatge i multimèdia::Creació multimèdia::Vídeo digital -Digital television -Automatic speech recognition -Speech processing systems -Digital video -Vídeo digital -Televisió digital -Reconeixement automàtic de la parla |
Rights:
|
|
Document type:
|
Article - Published version Conference Object |
Share:
|
|