<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-13T05:44:02Z</responseDate><request verb="GetRecord" identifier="oai:www.recercat.cat:2117/449250" metadataPrefix="mets">https://recercat.cat/oai/request</request><GetRecord><record><header><identifier>oai:recercat.cat:2117/449250</identifier><datestamp>2025-12-18T00:23:58Z</datestamp><setSpec>com_2072_1033</setSpec><setSpec>col_2072_452951</setSpec></header><metadata><mets xmlns="http://www.loc.gov/METS/" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:doc="http://www.lyncode.com/xoai" ID="&#xa;&#x9;&#x9;&#x9;&#x9;DSpace_ITEM_2117-449250" TYPE="DSpace ITEM" PROFILE="DSpace METS SIP Profile 1.0" xsi:schemaLocation="http://www.loc.gov/METS/ http://www.loc.gov/standards/mets/mets.xsd" OBJID="&#xa;&#x9;&#x9;&#x9;&#x9;hdl:2117/449250">
   <metsHdr CREATEDATE="2026-04-13T07:44:02Z">
      <agent ROLE="CUSTODIAN" TYPE="ORGANIZATION">
         <name>RECERCAT</name>
      </agent>
   </metsHdr>
   <dmdSec ID="DMD_2117_449250">
      <mdWrap MDTYPE="MODS">
         <xmlData xmlns:mods="http://www.loc.gov/mods/v3" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-1.xsd">
            <mods:mods xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-1.xsd">
               <mods:name>
                  <mods:role>
                     <mods:roleTerm type="text">author</mods:roleTerm>
                  </mods:role>
                  <mods:namePart>González Rodríguez, Elena</mods:namePart>
               </mods:name>
               <mods:extension>
                  <mods:dateAccessioned encoding="iso8601">2025-12-18T00:23:58Z</mods:dateAccessioned>
               </mods:extension>
               <mods:extension>
                  <mods:dateAvailable encoding="iso8601">2025-12-18T00:23:58Z</mods:dateAvailable>
               </mods:extension>
               <mods:originInfo>
                  <mods:dateIssued encoding="iso8601">2025-06-27</mods:dateIssued>
               </mods:originInfo>
               <mods:identifier type="none"/>
               <mods:identifier type="uri">http://hdl.handle.net/2117/449250</mods:identifier>
               <mods:abstract>Aquest treball presenta una solució integral (backend i frontend) per a la recopilació, extracció, enriquiment i classificació automatitzada de dades turístiques procedents de fonts web diverses. L'objectiu principal és obtenir informació estructurada i actualitzada sobre punts d'interès turístics (POIs) per alimentar una base de dades integrada amb l'aplicació turística Diskover. El sistema disposa d'una interfície web intuïtiva, implementada amb React, que permet seleccionar i gestionar fàcilment les regions objectiu. El procés automatitzat (pipeline) realitza cerques web mitjançant scraping, identifica i classifica semànticament els POIs mitjançant models de llenguatge avançats (LLMs), enriqueix les dades utilitzant APIs externes per obtenir coordenades, imatges i descripcions, i finalment valida i neteja els resultats obtinguts, assegurant així la qualitat, fiabilitat i utilitat pràctica de la informació turística recopilada.This project presents a comprehensive solution (backend and frontend) for the automated collection, extraction, enrichment, and classification of tourism data gathered from various web sources. The primary goal is to obtain structured and up-to-date information about Points of Interest (POIs) to populate a database integrated with the Diskover tourism application. The system features an intuitive web interface built with React, allowing users to easily select and manage target regions. The automated pipeline performs web searches using scraping techniques, identifies and semantically classifies POIs through advanced language models (LLMs), enriches the data with external APIs to gather geographical coordinates, images, and descriptions, and finally validates and cleans the resulting information. This ensures the collected tourism data's quality, reliability, and practical utility.Este trabajo presenta una solución integral (backend y frontend) para la recopilación, extracción, enriquecimiento y clasificación automatizada de datos turísticos provenientes de diversas fuentes web. El objetivo principal es obtener información estructurada y actualizada sobre puntos de interés turísticos (POIs) para alimentar una base de datos integrada con la aplicación turística Diskover. El sistema cuenta con una interfaz web intuitiva, desarrollada con React, que permite seleccionar y gestionar fácilmente las regiones objetivo. El proceso automatizado (pipeline) realiza búsquedas web mediante scraping, identifica y clasifica semánticamente los POIs utilizando modelos avanzados de lenguaje (LLMs), enriquece los datos con APIs externas para obtener coordenadas geográficas, imágenes y descripciones, y finalmente valida y limpia los resultados obtenidos, asegurando así la calidad, fiabilidad y utilidad práctica de la información turística recopilada.</mods:abstract>
               <mods:language>
                  <mods:languageTerm authority="rfc3066"/>
               </mods:language>
               <mods:accessCondition type="useAndReproduction">Open Access</mods:accessCondition>
               <mods:subject>
                  <mods:topic>Àrees temàtiques de la UPC::Informàtica::Enginyeria del software</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Software engineering</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Natural language processing (Computer science)</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Geographic information systems</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Application program interfaces (Computer software)</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Backend</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Frontend</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Automatizació</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Extracció web</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Scraping</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Punts d'interès</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>POIs</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Models de llenguatge</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>LLM</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Classificació semàntica</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Enriquiment de dades</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>APIs externes</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Interfície web</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Turisme</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Dades estructurades</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Bases de dades</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Points of interest</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Language models</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Data enrichment</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Web interface</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Structured data</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Data bases</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Data bases</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Data bases</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Data bases</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Data bases</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Data bases</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Enginyeria de programari</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Tractament del llenguatge natural (Informàtica)</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Sistemes d'informació geogràfica</mods:topic>
               </mods:subject>
               <mods:subject>
                  <mods:topic>Interfícies de programació d'aplicacions (Programari)</mods:topic>
               </mods:subject>
               <mods:titleInfo>
                  <mods:title>Creació d'un sistema d'adquisició de dades, gestió i validació de la qualitat per a l'aplicació turística Diskover</mods:title>
               </mods:titleInfo>
               <mods:genre>Bachelor thesis</mods:genre>
            </mods:mods>
         </xmlData>
      </mdWrap>
   </dmdSec>
   <structMap LABEL="DSpace Object" TYPE="LOGICAL">
      <div TYPE="DSpace Object Contents" ADMID="DMD_2117_449250"/>
   </structMap>
</mets></metadata></record></GetRecord></OAI-PMH>