Abstract:
|
En aquest estudi es pretén dissenyar, implementar i analitzar la viabilitat de l’ús de certs esquemes d’aprenentatge automàtic en un prototip de joc per torns basat en les mecàniques de combat en Japanese RolePlaying Games.
A tal fi, s’ha dissenyat un entorn de proves en forma de prototip de joc on s’enfronten dos personatges idèntics. Per això, s’ha definit una sèrie d’atributs que regeixen el comportament i l’efectivitat d’un personatge i s’ha dissenyat un conjunt d’accions que poden realitzar durant el seu torn. Per aportar certa complexitat al model, s’ha intentat dotar a cada acció d’un perfil únic amb ratis i elements singulars.
Un cop implementats els elements bàsics del prototip que ha de servir com entorn de proves, s’han dissenyat un conjunt d’esquemes bàsics de control per poder entrenar els models basats en aprenentatge automàtic i analitzar-ne el comportament. A tal efecte, s’ha implementat un sistema d’elecció aleatòria d’accions, un sistema d’elecció única i un sistema d’elecció estructurat basat en un arbre de decisions i que, tots tres, funcionen com a referències comparatives per entrenar i avaluar el rendiment dels futurs models.
En la part central de l’estudi, s’han dissenyat i implementat dos sistemes de control basats en aprenentatge automàtic. Concretament, s’ha definit un primer sistema basat en els principis de funcionament del Q-Learning, implementant una matriu de recompenses que vinculen els últims moviments del rival a la recompensa associada a escollir una acció particular i s’assumeix que el procés de decisió d’accions és markovianitzable. D’altra banda, també s’ha implementat un sistema basat en xarxes neurals evolutives de topologies ascendents i se n’ha analitzat la funcionalitat a l’hora de trobar models que aproximin correctament un patró guanyador. |