2026-04-17T06:02:49Zhttps://recercat.cat/oai/request

oai:recercat.cat:2099.1/114192025-07-23T05:27:16Zcom_2072_1033col_2072_452951

00925njm 22002777a 4500 dc Godayol Roca, Bárbara author 2010-05 El proyecto tiene como principal objectivo el desarrollo de una aplicación de "talking head", es decir, mostrar la imagen de una persona hablando con una voz sintética. Para llevar a cabo el objetivo planteado, tanto audio como video serán tratados por separado para luego unirlos y crear finalmente la síntesis audiovisual del habla. Se ha creído conveniente dividir el proyecto en tres fases importantes, la 1ª será obtener la base de datos, dónde se obtendrán los archivos de video y audio, se almacenarán e indexarán de forma que la búsqueda para su posterior uso seafácil y rápida. Como 2ª fase se hablará de programación, dónde se creará el programa principal para la realización del objetivo deseado. En esta fase se manipularán tanto los archivos de video como los archivos de audio para poder unirlos y crear las frases finales, además en esta fase se creará la voz sintética con el programa Festival. Y finalmente, la 3ª fase será la llamada interfaz de usuario que permitirá al usuario un fácil uso de la aplicación. Àrees temàtiques de la UPC::So, imatge i multimèdia::Dispositius de so, imatge i multimèdia Speech processing systems Image processing Processament de la parla Imatges--Processament Síntesis audiovisual de la voz