2026-04-19T13:02:49Zhttps://recercat.cat/oai/request

oai:recercat.cat:2117/1693052025-07-23T04:41:20Zcom_2072_1033col_2072_452951

Games in Machine Learning: Differentiable n-Player Games and Structured Planning Domingo Enrich, Carles Àrees temàtiques de la UPC::Enginyeria de la telecomunicació Telecommunication n-player differentiable games Nash equilibria extra-gradient method planning in structured environments reinforcement learning Telecomunicació L'objectiu de l'estada és ampliar les capacitats actuals dels models d'exploració en entorns amb estructura aritmètica i geomètrica. L'estudiant serà exposat a l'avantguarda de la recerca en les àrees de deep learning i reinforcement learning, amb ús de biblioteques de programari com Pytorch. El primer objectiu és desenvolupar el model en entorns simulats. El segon objectiu és utilitzar el model en entorns continus. El treball serà presentat en una conferència de primer nivell de machine learning. Outgoing 2019-05-30 Bachelor thesis http://creativecommons.org/licenses/by-nc-nd/3.0/es/ Open Access Attribution-NonCommercial-NoDerivs 3.0 Spain east=-73.9956593; north=40.7286679; name=17 W 3rd St, New York, NY 10012, Estats Units d'Amèrica Universitat Politècnica de Catalunya