Sistema automàtic d'aprenentatge de preferències personals sobre notícies classificades en seccions i definides per paraules clau

dc.contributor.author
Pueyo Busquets, Jordi
dc.date
2014-06-25T09:40:15Z
dc.date
2014-06-25T09:40:15Z
dc.date
2014-06-11
dc.date.accessioned
2014-06-25T22:20:31Z
dc.date.available
2014-06-25T22:20:31Z
dc.date.issued
2014-06-25T22:20:31Z
dc.identifier.uri
http://hdl.handle.net/10609/32961
dc.description.abstract
Entrar a una pàgina web de continguts i trobar a l'instant allò que et ve de gust llegir, escoltar o veure en aquell precís instant és un dels somnis de molts internautes. Aquest projecte ha tingut com a objectiu dissenyar un prototip de sistema d'aprenentatge automàtic que va en aquesta línia, dins les possibilitats d'un projecte de final de carrera d'Enginyeria en Informàtica. El programa desenvolupat treballa sobre una mostra de documents classificats en una secció principal i definits per paraules clau. Està pensat per ser vàlid per a qualsevol repositori de dades però s'ha aplicat a un cas concret, l'aprenentatge de gustos sobre notícies del diari britànic 'The Guardian'. L'algoritme té un perfil ideal que modela el cervell d'un lector i un perfil evolutiu, que comença de zero i va aprenent a mesura que l'usuari va consumint notícies. L'aprenentatge s'ha aconseguit fent una simulació d'aquestes tries en dos corpus de notícies d'uns 6.000 articles cadascun. En cada iteració, l'algorisme té en compte un petit grup notícies, a les quals s'assignen dues valoracions, una d'acord amb el perfil ideal i una altra segons el perfil evolutiu. La diferència entre les dues seleccions és la que ens dóna informació per a l'aprenentatge, que s'ha abordat amb dues estratègies. L'aprenentatge online fa una petita variació al perfil evolutiu després de cada tria, mentre que l'offline s'espera a tenir més dades per trobar patrons de conducta i poder fer modificacions més de més magnitud. Després de diverses proves, s'ha comprovat que s'aconsegueix reduir la distància entre valoracions de les seccions principals i tags, comparant el perfil ideal i l'evolutiu abans i després de l'execució de l'algorisme d'aprenentatge.
dc.language.iso
cat
dc.publisher
Universitat Oberta de Catalunya
dc.rights
<a href="http://creativecommons.org/licenses/by-nc-nd/3.0/es/">http://creativecommons.org/licenses/by-nc-nd/3.0/es/</a>
dc.subject
Intel·ligència artificial
dc.subject
aprenentatge no supervisat
dc.subject
recomanador
dc.subject
notícies
dc.subject
The Guardian
dc.subject
aprenentatge
dc.subject
dades
dc.title
Sistema automàtic d'aprenentatge de preferències personals sobre notícies classificades en seccions i definides per paraules clau
dc.type
Bachelor thesis


Ficheros en el ítem

FicherosTamañoFormatoVer

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)