<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-17T07:36:28Z</responseDate><request verb="GetRecord" identifier="oai:www.recercat.cat:2117/446123" metadataPrefix="marc">https://recercat.cat/oai/request</request><GetRecord><record><header><identifier>oai:recercat.cat:2117/446123</identifier><datestamp>2025-11-13T08:35:29Z</datestamp><setSpec>com_2072_1033</setSpec><setSpec>col_2072_452951</setSpec></header><metadata><record xmlns="http://www.loc.gov/MARC21/slim" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:doc="http://www.lyncode.com/xoai" xsi:schemaLocation="http://www.loc.gov/MARC21/slim http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd">
   <leader>00925njm 22002777a 4500</leader>
   <datafield ind2=" " ind1=" " tag="042">
      <subfield code="a">dc</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="720">
      <subfield code="a">Molina Díez, Víctor</subfield>
      <subfield code="e">author</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="260">
      <subfield code="c">2025-06-27</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="520">
      <subfield code="a">Aquesta tesi presenta un marc modular que integra Models de Llenguatge a Gran Escala (LLMs) amb ontologies per permetre la manipulació robòtica guiada per llenguatge natural. El sistema proposat permet que usuaris inexperts interactuïn amb un robot mitjançant descripcions textuals i definint tasques, les quals es tradueixen en representacions simbòliques estructurades per a la planificació i execució autònomes. El marc consta de tres mòduls principals. Primer, un component encarregat d'instanciar l'ontologia que extreu les entitats, propietats i relacions a partir d'un text no estructurat mitjançant LLMs, que després es validen i s'instancien en una base de coneixement semàntic, permetent als usuaris inexperts descriure escenaris al robot de manera senzilla. Segon, un mòdul de recuperació d'informació que tradueix les preguntes dels usuaris en consultes SPARQL utilitzant LLMs, i les valida mitjançant raonament basat en regles per obtenir una resposta a la pregunta a partir de la informació disponible a l'ontologia. Tercer, un LLM que s'utilitza per generar l'estat objectiu a partir de les accions desitjades per l'usuari. A continuació, es genera un fitxer de problema en Planning Domain Definition Language (PDDL), i genera un fitxer complet de configuració de Planificació de Tasques i Moviments (TAMP) per a la seva execució en un entorn robòtic simulat. El sistema es valida en un escenari realista de manipulació de cuina mitjançant el simulador Kautham, demostrant la seva capacitat per traduir la intenció de l'usuari a alt nivell en comportament robòtic de baix nivell. En combinar la flexibilitat interpretativa dels LLMs amb el rigor formal de les ontologies, aquest treball contribueix a una interfície innovadora i centrada en l'ésser humà per a l'autonomia robòtica guiada pel coneixement.</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="520">
      <subfield code="a">This thesis presents a modular framework that integrates Large Language Models (LLMs) with ontologies to enable natural language-driven robotic manipulation. The proposed system allows non-expert users to interact with a robot through free-form textual descriptions and task queries, which are grounded into structured, symbolic representations for autonomous planning and execution. The framework comprises three main modules. First, an ontology population component extracts entities, properties, and relations from unstructured text using LLMs, which are then validated and instantiated in a semantic knowledge base, enabling non-expert users to easily give scenario descriptions to the robot. Second, an information retrieval module translates user questions into SPARQL queries using LLMs and validates them using rule-based reasoning to obtain a response for the query based on the available information in the ontology. Third, an LLM is used to generate the goal state from the user desired actions. Then it constructs a Planning Domain Definition Language (PDDL) problem file, and builds a complete Task-and-Motion Planning (TAMP) configuration file for execution in a simulated robotic environment. The system is validated in a realistic kitchen manipulation scenario using the Kautham simulator, demonstrating its ability to translate high-level user intent into grounded robot behavior. By combining the interpretive flexibility of LLMs with the formal rigor of ontologies, this work contributes a novel, human-centric interface for knowledge-driven robotic autonomy.</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="520">
      <subfield code="a">Esta tesis presenta un marco modular que integra Modelos de Lenguaje de Gran Escala (LLMs) con ontologías para permitir la manipulación robótica guiada por lenguaje natural. El sistema propuesto permite que usuarios inexpertos interactúen con un robot mediante descripciones textuales y definiendo tareas, que se traducen en representaciones simbólicas estructuradas para la planificación y ejecución autónomas. El marco consta de tres módulos principales. Primero, un componente encargado de instanciar ontologías que extrae entidades, propiedades y relaciones a partir de texto no estructurado usando LLMs, que luego se validan e instancian en una base de conocimiento semántico, permitiendo a los usuarios inexpertos describir escenarios al robot de forma sencilla. Segundo, un módulo de recuperación de información que traduce las preguntas del usuario en consultas SPARQL usando LLMs y las valida mediante razonamiento basado en reglas para obtener una respuesta a la pregunta basada en la información disponible en la ontología. Tercero, un LLM que se utiliza para generar el estado objetivo a partir de las acciones deseadas por el usuario. Luego construye un archivo de problema en Planning Domain Definition Language (PDDL), y genera un archivo completo de configuración de Planificación de Tareas y Movimiento (TAMP) para su ejecución en un entorno robótico simulado. El sistema se valida en un escenario realista de manipulación en cocina usando el simulador Kautham, demostrando su capacidad para traducir la intención de alto nivel del usuario en comportamiento robótico fundamentado. Al combinar la flexibilidad interpretativa de los LLMs con el rigor formal de las ontologías, este trabajo contribuye con una interfaz novedosa y centrada en el ser humano para la autonomía robótica guiada por el conocimiento.</subfield>
   </datafield>
   <datafield ind1="8" ind2=" " tag="024">
      <subfield code="a">http://hdl.handle.net/2117/446123</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Aprenentatge automàtic</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Deep learning (Machine learning)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Human-robot interaction</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Ontologies (Information retrieval)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Models de Llenguatge a Gran Escala (LLMs)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Ontologies</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Manipulació robòtica</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Processament del Llenguatge Natural (PLN)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Població d'ontologies</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Consultes SPARQL</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Recuperació d'Informació</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">PDDL (Planning Domain Definition Language)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Planificació de Tasques i Moviments (TAMP)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Kautham</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Enginyeria de prompts per a LLMs</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">OWL</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">RDF</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">SPARQL</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">LangChain</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">LangGraph</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Raonament semàntic</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Cinemàtica Inversa (IK)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Interacció humà-robot</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Large Language Models (LLMs)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Natural Language Processing (NLP)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Ontology population</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">SPARQL queries</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Information retrieval</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">PDDL (Planning Domain Definition Language)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Task and Motion Planning (TAMP)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Kautham simulator</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Knowledge representation</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">LLM prompt engineering</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Semantic reasoning</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Human-robot interaction</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Human-robot interaction</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Human-robot interaction</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Human-robot interaction</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Human-robot interaction</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Aprenentatge profund (Aprenentatge automàtic)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Interacció persona-robot</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Ontologies (Informàtica)</subfield>
   </datafield>
   <datafield ind2="0" ind1="0" tag="245">
      <subfield code="a">Combining large language models and ontologies for knowledge-driven robotic manipulation</subfield>
   </datafield>
</record></metadata></record></GetRecord></OAI-PMH>