<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-17T14:15:17Z</responseDate><request verb="GetRecord" identifier="oai:www.recercat.cat:2117/169305" metadataPrefix="qdc">https://recercat.cat/oai/request</request><GetRecord><record><header><identifier>oai:recercat.cat:2117/169305</identifier><datestamp>2025-07-23T04:41:20Z</datestamp><setSpec>com_2072_1033</setSpec><setSpec>col_2072_452951</setSpec></header><metadata><qdc:qualifieddc xmlns:qdc="http://dspace.org/qualifieddc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:doc="http://www.lyncode.com/xoai" xsi:schemaLocation="http://purl.org/dc/elements/1.1/ http://dublincore.org/schemas/xmls/qdc/2006/01/06/dc.xsd http://purl.org/dc/terms/ http://dublincore.org/schemas/xmls/qdc/2006/01/06/dcterms.xsd http://dspace.org/qualifieddc/ http://www.ukoln.ac.uk/metadata/dcmi/xmlschema/qualifieddc.xsd">
   <dc:title>Games in Machine Learning: Differentiable n-Player Games and Structured Planning</dc:title>
   <dc:creator>Domingo Enrich, Carles</dc:creator>
   <dc:subject>Àrees temàtiques de la UPC::Enginyeria de la telecomunicació</dc:subject>
   <dc:subject>Telecommunication</dc:subject>
   <dc:subject>n-player differentiable games</dc:subject>
   <dc:subject>Nash equilibria</dc:subject>
   <dc:subject>extra-gradient method</dc:subject>
   <dc:subject>planning in structured environments</dc:subject>
   <dc:subject>reinforcement learning</dc:subject>
   <dc:subject>Telecomunicació</dc:subject>
   <dcterms:abstract>L'objectiu de l'estada és ampliar les capacitats actuals dels models d'exploració en entorns amb estructura aritmètica i geomètrica. L'estudiant serà exposat a l'avantguarda de la&#xd;
recerca en les àrees de deep learning i reinforcement learning, amb ús de biblioteques de programari com Pytorch.&#xd;
El primer objectiu és desenvolupar el model en entorns simulats. El segon objectiu és utilitzar el model en entorns continus. El treball serà&#xd;
presentat en una conferència de primer nivell de machine learning.</dcterms:abstract>
   <dcterms:abstract>Outgoing</dcterms:abstract>
   <dcterms:issued>2019-05-30</dcterms:issued>
   <dc:type>Bachelor thesis</dc:type>
   <dc:rights>http://creativecommons.org/licenses/by-nc-nd/3.0/es/</dc:rights>
   <dc:rights>Open Access</dc:rights>
   <dc:rights>Attribution-NonCommercial-NoDerivs 3.0 Spain</dc:rights>
   <dc:coverage>east=-73.9956593; north=40.7286679; name=17 W 3rd St, New York, NY 10012, Estats Units d'Amèrica</dc:coverage>
   <dc:publisher>Universitat Politècnica de Catalunya</dc:publisher>
</qdc:qualifieddc></metadata></record></GetRecord></OAI-PMH>