Un modelo híbrido orientado a la síntesis multimodal del habla

Inicio | ¿Qué es? | Contacto

English | Català

Consultar RECERCAT

Por comunidades y
colecciones Por fecha Por autores Por títulos Por temas (CDU)

Consultar departamento

Por fecha Por autores Por títulos Por temas (CDU)

Estadisticas

Del documento Todo RECERCAT

Mi RECERCAT

Entrar Alertas por correo-e

Directorio de otros repositorios

RECERCAT Principal > Universitat Ramon Llull > La Salle > Articles publicats a revistes científiques > Visualizar documento

Utilizad este identificador para citar o enlazar este documento: http://hdl.handle.net/2072/374880

Título:	Un modelo híbrido orientado a la síntesis multimodal del habla
Autor/a:	Iriondo Sanz, Ignasi; Alías Pujol, Francesc; Melenchón Maldonado, Javier
Otros autores:	Universitat Ramon Llull. La Salle
Resumen:	En este articulo se presenta un sistema de conversión texto-habla de alta calidad utilizando voz segmentada en difonemas y trifonemas. El sistema de síntesis implementado se basa en un modelo híbrido que combina aspectos de un modelo "armónico + ruido", con el que se descompone la señal de voz original en dos componentes y aspectos del TD-PSOLA. Los procesos de análisis y síntesis se realizan síncronamente con e pitch de forma que se pueden conseguir modificaciones prosódicas con un alto grado de naturalidad en el habla generada gracias a la representación parmétrica de la señal de voz. Este sistema resulta una buena solución para la síntesis del habla emocionada que requiere grandes variaciones de la prosodia. El objetivo fina de este proyecto consiste en implementar este modelo hibrido de síntesis audiovisual del habla, capaz de generar síncronamente voz y animación facial para simular expresiones emocionales
Fecha de creación:	2002
Materias (CDU):	62 - Enginyeria. Tecnologia
Materia(s):	Reconeixement automàtic de la parla Percepció del llenguatge Processament de la parla Perceptrons Anàlisi prosòdica (Lingüística)
Derechos:	© L'autor/a L'accés als continguts d'aquest document queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons:http://creativecommons.org/licenses/by/4.0/
Páginas:	5 p.
Tipo de documento:	Artículo Artículo - Versión publicada
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Publish at:	Procesamiento del lenguaje natural, No. 29 (2002)
Compartir:

Documentos con el texto completo de este documento

Ficheros	Tamaño	Formato
Un modelo híbri ... s multimodal del habla.pdf	332.1 KB	PDF

Mostrar el registro completo del ítem

Documentos relacionados

Otros documentos del mismo autor/a

A Hybrid Method Oriented to Concatenative Text-to-Speech Synthesis (Fecha de creación: 01-09-2003)

Iriondo Sanz, Ignasi; Alías Pujol, Francesc; Sanchís Bernabeu, Francisco Javier; Melenchón Maldonado, Javier

Simultaneous and causal appearance learning and tracking (Fecha de creación: 08-2005)

Melenchón Maldonado, Javier; Iriondo Sanz, Ignasi; Meler Corretjé, Lourdes

Multi-domain Text-to-Speech Synthesis by Automatic Text Classification (Fecha de creación: 17-09-2006)

Alías Pujol, Francesc; Socoró Carrié, Joan Claudi; Sevillano Domínguez, Xavier; Iriondo Sanz, Ignasi; Gonzalvo Fructuoso, Xavier

Adaptación del CTH-URL para la competición Albayzin 2008 (Fecha de creación: 11-2008)

Monzo Sánchez, Carlos; Formiga Fanals, Lluís; Adell, Jordi; Iriondo Sanz, Ignasi; Alías Pujol, Francesc; Socoró Carrié, Joan Claudi

Asignación automática de marcas de pitch basada en programación dinámica (Fecha de creación: 2001)

Alías Pujol, Francesc; Iriondo Sanz, Ignasi

Accesibilidad | Aviso legal | Política de Cookies | Documentos de uso interno

Coordinación

Patrocinio