dc.contributor |
Agència de Gestió d'Ajuts Universitaris i de Recerca |
dc.contributor.author |
Gonzàlez i Pellicer, Edgar |
dc.date.accessioned |
2009-02-27T13:15:26Z |
dc.date.available |
2009-02-27T13:15:26Z |
dc.date.created |
2008 |
dc.date.issued |
2009-02-27T13:15:26Z |
dc.identifier.uri |
http://hdl.handle.net/2072/13834 |
dc.format.extent |
29 p. |
dc.format.extent |
315438 bytes |
dc.format.mimetype |
application/pdf |
dc.language.iso |
cat |
dc.relation.ispartofseries |
Els ajuts de l'AGAUR; |
dc.rights |
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original i l’Agència i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.5/es/) |
dc.subject.other |
Recuperació de la informació |
dc.subject.other |
Aprenentatge automàtic |
dc.subject.other |
Algorismes |
dc.title |
Kernels semàntics per a clustering de patrons |
dc.type |
info:eu-repo/semantics/report |
dc.subject.udc |
004 - Informàtica |
dc.description.abstract |
Memòria elaborada a partir d’una estada al projecte Proteus de la New York University entre abril i juny del 2007. Les tècniques de clustering poden ajudar a reduir la supervisió en processos d’obtenció de patrons per a Extracció d’Informació. Tanmateix, és necessari disposar d’algorismes adequats a documents, i aquests algorismes requereixen mesures adequades de similitud entre
patrons. Els kernels poden oferir una solució a aquests problemes, però l’aprenentatge no
supervisat requereix d’estrat`egies m´es astutes que l’aprenentatge supervisat per a incorporar
major quantitat d’informació. En aquesta memòria, fruit de la meva estada de mes d’Abril al de Juny de 2007 al projecte. Proteus de la New York University, es proposen i avaluen diversos kernels sobre patrons. Ini-
cialment s’estudien kernels amb una família de patrons restringits, i a continuació s’apliquen
kernels ja usats en tasques supervisades d’Extracció d’Informació. Degut a la degradació del
rendiment que experimenta el clustering a l’afegir informació irrellevant, els kernels se simpli-
fiquen i es busquen estratègies per a incorporar-hi semàntica de forma selectiva. Finalment,
s’estudia quin efecte té aplicar clustering sobre el coneixement semàntic com a pas previ al
clustering de patrons. Les diverses estratègies s’avaluen en tasques de clustering de documents i patrons usant dades reals. |