Esquemes d'aprenentatge automàtic en videojocs per torns per oferir reptes basats en habilitat

Home | About RECERCAT | Contact

Català | Castellano

All of RECERCAT

By Communities &
Collections By Defense Date By Authors By Titles By Subject

This Collection

By Defense Date By Authors By Titles By Subject

Statistics

View Statistics All RECERCAT

My RECERCAT

Other repositories directory

RECERCAT Home > Universitat Politècnica de Catalunya > Tesines i projectes i treballs de final de carrera > View document

To access the full text documents, please follow this link: http://hdl.handle.net/2117/109084

Title:	Esquemes d'aprenentatge automàtic en videojocs per torns per oferir reptes basats en habilitat
Author:	Tudela Alcacer, Jordi
Other authors:	Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics; Solano Albajés, Lluís
Abstract:	En aquest estudi es pretén dissenyar, implementar i analitzar la viabilitat de l’ús de certs esquemes d’aprenentatge automàtic en un prototip de joc per torns basat en les mecàniques de combat en Japanese RolePlaying Games. A tal fi, s’ha dissenyat un entorn de proves en forma de prototip de joc on s’enfronten dos personatges idèntics. Per això, s’ha definit una sèrie d’atributs que regeixen el comportament i l’efectivitat d’un personatge i s’ha dissenyat un conjunt d’accions que poden realitzar durant el seu torn. Per aportar certa complexitat al model, s’ha intentat dotar a cada acció d’un perfil únic amb ratis i elements singulars. Un cop implementats els elements bàsics del prototip que ha de servir com entorn de proves, s’han dissenyat un conjunt d’esquemes bàsics de control per poder entrenar els models basats en aprenentatge automàtic i analitzar-ne el comportament. A tal efecte, s’ha implementat un sistema d’elecció aleatòria d’accions, un sistema d’elecció única i un sistema d’elecció estructurat basat en un arbre de decisions i que, tots tres, funcionen com a referències comparatives per entrenar i avaluar el rendiment dels futurs models. En la part central de l’estudi, s’han dissenyat i implementat dos sistemes de control basats en aprenentatge automàtic. Concretament, s’ha definit un primer sistema basat en els principis de funcionament del Q-Learning, implementant una matriu de recompenses que vinculen els últims moviments del rival a la recompensa associada a escollir una acció particular i s’assumeix que el procés de decisió d’accions és markovianitzable. D’altra banda, també s’ha implementat un sistema basat en xarxes neurals evolutives de topologies ascendents i se n’ha analitzat la funcionalitat a l’hora de trobar models que aproximin correctament un patró guanyador.
Subject(s):	-Àrees temàtiques de la UPC::Informàtica::Llenguatges de programació -Programming languages (Computers) -Llenguatges de programació
Rights:	Attribution-NonCommercial-NoDerivs 3.0 Spain http://creativecommons.org/licenses/by-nc-nd/3.0/es/
Document type:	Bachelor Thesis
Published by:	Universitat Politècnica de Catalunya
Share:

Show full item record

Accesibility | Legal note | Cookies Policy

Coordination

Supporters