Title:
|
Analysis of Similarity based Representations on Heterogeneous Data; El análisis de las representaciones basadas en similitud datos heterogéneos; L'anàlisi de les representacions basades en similitud dades heterogènies
|
Author:
|
Seshadri, Shreyas
|
Other authors:
|
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions; Belanche Muñoz, Luis Antonio |
Abstract:
|
[ANGLÈS] The most common methodology of similarity based learning is the k-nearest neighbour method. But this has the disadvantage of having to store and calculate distances (similarities) for all the instances in the dataset. A more efficient methodology is to calculate similarities to only a set of chosen prototypes and use this as a new representation for learning. The current thesis deals with the implementation of these ideas using the Gower’s similarity measure for heterogeneous data. The comparison of clustering and feature selection methods for prototype selection is explored. Different methodologies are implemented in an attempt to improve the Gower’s similarity measure with the incorporation of weights for features. Novel methodologies to extract deep/higher level features from the similarity representation are proposed. The thesis provides preliminary results in these areas of research which are encouraging. |
Abstract:
|
[CASTELLÀ] La metodología más común de aprendizaje basada en la similitud es el método del vecino k-más cercano. Pero esto tiene la desventaja de tener que almacenar y calcular distancias (similitudes) para todos los casos del conjunto de datos. Una metodología más eficiente es calcular similitudes con sólo un conjunto de prototipos seleccionados y utilizar esto como una nueva representación para el aprendizaje. La presente tesis trata de la puesta en práctica de estas ideas usando medida de similitud de Gower de datos heterogéneos. La comparación de la agrupación y la selección de características para la selección de métodos de prototipo se explora. Diferentes metodologías se implementan en un intento de mejorar la medida de similitud de la Gower, con la incorporación de los pesos para las características. Se proponen metodologías novedosas para extraer características de nivel de profundidad / superiores de la representación similitud. La tesis ofrece resultados preliminares en estas áreas de investigación que son alentadores |
Abstract:
|
[CATALÀ] La metodologia més comuna d'aprenentatge basada en la similitud és el mètode del veí k-més proper. Però això té el desavantatge d'haver de emmagatzemar i calcular distàncies (similituds) per a tots els casos del conjunt de dades. Una metodologia més eficient és calcular similituds amb només un conjunt de prototips seleccionats i utilitzar això com una nova representació per a l'aprenentatge. Aquesta tesi tracta de la posada en pràctica d'aquestes idees utilitzant mesura de similitud de Gower de dades heterogènies. La comparació de l'agrupació i la selecció de característiques per a la selecció de mètodes de prototip s'explora. Diferents metodologies s'implementen en un intent de millorar la mesura de similitud de la Gower, amb la incorporació dels pesos per a les característiques. Es proposen metodologies noves per extreure característiques de nivell de profunditat / superiors de la representació similitud. La tesi ofereix resultats preliminars en aquestes àrees de recerca que són encoratjadors. |
Subject(s):
|
-Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Aprenentatge automàtic -Àrees temàtiques de la UPC::Enginyeria de la telecomunicació -Machine learning -Similarity Representation -Machine learning -aprendizaje automático -Aprenentatge automàtic |
Rights:
|
S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
Document type:
|
Research/Master Thesis |
Published by:
|
Universitat Politècnica de Catalunya
|
Share:
|
|