dc.contributor |
Agència de Gestió d'Ajuts Universitaris i de Recerca |
dc.contributor |
Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics |
dc.contributor.author |
Gonzàlez Pellicer, Edgar |
dc.date.accessioned |
2009-06-03T15:41:29Z |
dc.date.available |
2009-06-03T15:41:29Z |
dc.date.created |
2009 |
dc.date.issued |
2009-06-03T15:41:29Z |
dc.identifier.uri |
http://hdl.handle.net/2072/16020 |
dc.format.extent |
31 p. |
dc.format.extent |
305811 bytes |
dc.format.mimetype |
application/pdf |
dc.language.iso |
cat |
dc.relation.ispartofseries |
Els ajuts de l'AGAUR;2005FI01060 |
dc.rights |
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original i l’Agència i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.5/es/) |
dc.subject.other |
Clústers |
dc.subject.other |
Extracció de dades -- Automatització |
dc.subject.other |
Aprenentatge automàtic |
dc.title |
Una aproximació d'aprenentatge automàtic per a extracció d'informació adaptativa |
dc.type |
info:eu-repo/semantics/article |
dc.subject.udc |
62 - Enginyeria. Tecnologia |
dc.description.abstract |
Les tècniques de clustering poden ajudar a reduir la supervisió en processos d'obtenció de patrons per a Extracció d'Informació. En aquest treball, que abarca un període de 4 anys de recerca, es comença per estudiar la representació de documents més adequada per a la tasca de clustering. Per tal d'evitar els biaixos dels mètodes individuals de clustering, es consideren mètodes de clustering conjunt. S'exploren diversos mètodes de combinació supervisada, i s'hi afegeixen estratègies automàtiques per a determinar el nombre de clusters de la combinació. També es consideren mecanismes per a obtenir clusterings conjunts ponderats, així com estratègies de combinació no supervisada. Finalment, els resultats del clustering s'utilitzen en un sistema d'adquisició de patrons per a substituir els elements de supervisió humana. Totes aquestes estratègies i mètodes s'avaluen en tasques de clustering de documents i adquisició de patrons usant dades reals. Es comprova que els mots com representació de documents superen altres models per a la tasca de clustering, així com que el clustering conjunt supera les limitacions dels clusterings individuals, i que les estratègies no supervisades d'adquisició de patrons obtenen resultats competitius respecte a les estratègies supervisades. |