<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-14T02:07:08Z</responseDate><request verb="GetRecord" identifier="oai:www.recercat.cat:2117/422856" metadataPrefix="oai_dc">https://recercat.cat/oai/request</request><GetRecord><record><header><identifier>oai:recercat.cat:2117/422856</identifier><datestamp>2025-07-17T15:47:57Z</datestamp><setSpec>com_2072_1033</setSpec><setSpec>col_2072_452951</setSpec></header><metadata><oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:doc="http://www.lyncode.com/xoai" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
   <dc:title>GAN para la creación de imágenes sintéticas basadas en texto</dc:title>
   <dc:creator>Silva Mendes, Johny</dc:creator>
   <dc:contributor>Universitat Politècnica de Catalunya. Departament d'Enginyeria Electrònica</dc:contributor>
   <dc:contributor>Soria Pérez, José Antonio</dc:contributor>
   <dc:subject>Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial</dc:subject>
   <dc:subject>Artificial intelligence</dc:subject>
   <dc:subject>Digital images</dc:subject>
   <dc:subject>Dogs</dc:subject>
   <dc:subject>GAN</dc:subject>
   <dc:subject>CGAN</dc:subject>
   <dc:subject>Inteligencia Artificial Generativa</dc:subject>
   <dc:subject>Generación de Imágenes</dc:subject>
   <dc:subject>Intel·ligència artificial</dc:subject>
   <dc:subject>Imatges digitals</dc:subject>
   <dc:subject>Gossos</dc:subject>
   <dc:description>This Bachelor’s Thesis explores the development of a Conditional Generative Adversarial&#xd;
Network (CGAN) designed to generate dog images based on specific breed names. The project&#xd;
focuses on ten different dog breeds and evaluates the model’s ability to create visually realistic&#xd;
images. To train the CGAN, a dataset augmented with various techniques was employed,&#xd;
addressing the need for diverse input data.&#xd;
The evaluation process included a Visual Recognition Rate assessment, where human evaluators rated the realism of 50 generated images. Out of these, 20 images were identified as&#xd;
dogs by at least half of the evaluators, resulting in a 40 % recognition rate based on realism&#xd;
criteria. This outcome highlights the CGAN’s capability to produce recognizable dog images&#xd;
but also underscores the necessity for further improvements.&#xd;
Key findings suggest that the quality of the dataset and the architecture of the model&#xd;
significantly impact the results. Issues such as contrast, brightness, and deformation were&#xd;
noted, indicating areas for enhancement. The generated images displayed recognizable features&#xd;
of different dog breeds, although some images were indistinguishable or clearly deformed.&#xd;
The conclusions recommend focusing on higher-quality datasets and refining the CGAN&#xd;
architecture to achieve better performance. Future work should explore advanced dataset&#xd;
acquisition strategies and further optimization of model parameters to enhance image realism&#xd;
and breed specificity</dc:description>
   <dc:description>Este Trabajo de Fin de Grado aborda el desarrollo de una Red Generativa Adversaria&#xd;
Condicional (CGAN) destinada a la generación de imágenes de perros a partir de nombres de&#xd;
razas específicas. El proyecto se centra en diez razas distintas de perros y evalúa la capacidad&#xd;
del modelo para crear imágenes visualmente realistas. Para entrenar la CGAN, se utilizó un&#xd;
conjunto de datos ampliado con diversas técnicas de aumento, abordando la necesidad de&#xd;
datos de entrada variados.&#xd;
El proceso de evaluación incluyó una tasa de reconocimiento visual, donde evaluadores&#xd;
humanos calificaron el realismo de 50 imágenes generadas. De estas, 20 imágenes fueron&#xd;
identificadas como perros por al menos la mitad de los evaluadores, resultando en una tasa de&#xd;
reconocimiento del 40 % basada en criterios de realismo. Este resultado destaca la capacidad&#xd;
de la CGAN para producir imágenes de perros reconocibles, pero también subraya la necesidad&#xd;
de mejoras adicionales.&#xd;
Los hallazgos clave sugieren que la calidad del conjunto de datos y la arquitectura del&#xd;
modelo impactan significativamente en los resultados. Se notaron problemas como contraste,&#xd;
brillo y deformación, lo que indica áreas para mejorar. Las imágenes generadas mostraron&#xd;
características reconocibles de diferentes razas de perros, aunque algunas imágenes eran&#xd;
indistinguibles o claramente deformadas.&#xd;
Las conclusiones recomiendan centrarse en conjuntos de datos de mayor calidad y refinar&#xd;
la arquitectura de la CGAN para lograr un mejor rendimiento. El trabajo futuro debería&#xd;
explorar estrategias avanzadas de adquisición de conjuntos de datos y una mayor optimización&#xd;
de los parámetros del modelo para mejorar el realismo de las imágenes y la especificidad de&#xd;
la raza.</dc:description>
   <dc:date>2024-07-15</dc:date>
   <dc:type>Bachelor thesis</dc:type>
   <dc:identifier>https://hdl.handle.net/2117/422856</dc:identifier>
   <dc:identifier>PRISMA-190281</dc:identifier>
   <dc:language>spa</dc:language>
   <dc:rights>Open Access</dc:rights>
   <dc:format>application/pdf</dc:format>
   <dc:publisher>Universitat Politècnica de Catalunya</dc:publisher>
</oai_dc:dc></metadata></record></GetRecord></OAI-PMH>