<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-17T06:02:49Z</responseDate><request verb="GetRecord" identifier="oai:www.recercat.cat:2099.1/11419" metadataPrefix="marc">https://recercat.cat/oai/request</request><GetRecord><record><header><identifier>oai:recercat.cat:2099.1/11419</identifier><datestamp>2025-07-23T05:27:16Z</datestamp><setSpec>com_2072_1033</setSpec><setSpec>col_2072_452951</setSpec></header><metadata><record xmlns="http://www.loc.gov/MARC21/slim" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:doc="http://www.lyncode.com/xoai" xsi:schemaLocation="http://www.loc.gov/MARC21/slim http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd">
   <leader>00925njm 22002777a 4500</leader>
   <datafield ind2=" " ind1=" " tag="042">
      <subfield code="a">dc</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="720">
      <subfield code="a">Godayol Roca, Bárbara</subfield>
      <subfield code="e">author</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="260">
      <subfield code="c">2010-05</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="520">
      <subfield code="a">El proyecto tiene como principal objectivo el desarrollo de una aplicación de "talking head", es decir, mostrar la imagen de una persona hablando con una voz sintética. Para llevar a cabo el objetivo planteado, tanto audio como video serán tratados por separado para luego unirlos y crear finalmente la síntesis audiovisual del habla. Se ha creído conveniente dividir el proyecto en tres fases importantes, la 1ª será obtener la base de datos, dónde se obtendrán los archivos de video y audio, se almacenarán e indexarán de forma que la búsqueda para su posterior uso seafácil y rápida. Como 2ª fase se hablará de programación, dónde se creará el programa principal para la realización del objetivo deseado. En esta fase se manipularán tanto los archivos de video como los archivos de audio para poder unirlos y crear las frases finales, además en esta fase se creará la voz sintética con el programa Festival. Y finalmente, la 3ª fase será la llamada interfaz de usuario que permitirá al usuario un fácil uso de la aplicación.</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Àrees temàtiques de la UPC::So, imatge i multimèdia::Dispositius de so, imatge i multimèdia</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Speech processing systems</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Image processing</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Processament de la parla</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Imatges--Processament</subfield>
   </datafield>
   <datafield ind2="0" ind1="0" tag="245">
      <subfield code="a">Síntesis audiovisual de la voz</subfield>
   </datafield>
</record></metadata></record></GetRecord></OAI-PMH>