Analysis of Similarity based Representations on Heterogeneous Data

Home | About RECERCAT | Contact

Català | Castellano

All of RECERCAT

By Communities &
Collections By Defense Date By Authors By Titles By Subject

This Collection

By Defense Date By Authors By Titles By Subject

Statistics

View Statistics All RECERCAT

My RECERCAT

Other repositories directory

RECERCAT Home > Universitat Politècnica de Catalunya > Tesines i projectes i treballs de final de carrera > View document

To access the full text documents, please follow this link: http://hdl.handle.net/2099.1/22038

Title:	Analysis of Similarity based Representations on Heterogeneous Data; El análisis de las representaciones basadas en similitud datos heterogéneos; L'anàlisi de les representacions basades en similitud dades heterogènies
Author:	Seshadri, Shreyas
Other authors:	Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions; Belanche Muñoz, Luis Antonio
Abstract:	[ANGLÈS] The most common methodology of similarity based learning is the k-nearest neighbour method. But this has the disadvantage of having to store and calculate distances (similarities) for all the instances in the dataset. A more efficient methodology is to calculate similarities to only a set of chosen prototypes and use this as a new representation for learning. The current thesis deals with the implementation of these ideas using the Gower’s similarity measure for heterogeneous data. The comparison of clustering and feature selection methods for prototype selection is explored. Different methodologies are implemented in an attempt to improve the Gower’s similarity measure with the incorporation of weights for features. Novel methodologies to extract deep/higher level features from the similarity representation are proposed. The thesis provides preliminary results in these areas of research which are encouraging.
Abstract:	[CASTELLÀ] La metodología más común de aprendizaje basada en la similitud es el método del vecino k-más cercano. Pero esto tiene la desventaja de tener que almacenar y calcular distancias (similitudes) para todos los casos del conjunto de datos. Una metodología más eficiente es calcular similitudes con sólo un conjunto de prototipos seleccionados y utilizar esto como una nueva representación para el aprendizaje. La presente tesis trata de la puesta en práctica de estas ideas usando medida de similitud de Gower de datos heterogéneos. La comparación de la agrupación y la selección de características para la selección de métodos de prototipo se explora. Diferentes metodologías se implementan en un intento de mejorar la medida de similitud de la Gower, con la incorporación de los pesos para las características. Se proponen metodologías novedosas para extraer características de nivel de profundidad / superiores de la representación similitud. La tesis ofrece resultados preliminares en estas áreas de investigación que son alentadores
Abstract:	[CATALÀ] La metodologia més comuna d'aprenentatge basada en la similitud és el mètode del veí k-més proper. Però això té el desavantatge d'haver de emmagatzemar i calcular distàncies (similituds) per a tots els casos del conjunt de dades. Una metodologia més eficient és calcular similituds amb només un conjunt de prototips seleccionats i utilitzar això com una nova representació per a l'aprenentatge. Aquesta tesi tracta de la posada en pràctica d'aquestes idees utilitzant mesura de similitud de Gower de dades heterogènies. La comparació de l'agrupació i la selecció de característiques per a la selecció de mètodes de prototip s'explora. Diferents metodologies s'implementen en un intent de millorar la mesura de similitud de la Gower, amb la incorporació dels pesos per a les característiques. Es proposen metodologies noves per extreure característiques de nivell de profunditat / superiors de la representació similitud. La tesi ofereix resultats preliminars en aquestes àrees de recerca que són encoratjadors.
Subject(s):	-Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Aprenentatge automàtic -Àrees temàtiques de la UPC::Enginyeria de la telecomunicació -Machine learning -Similarity Representation -Machine learning -aprendizaje automático -Aprenentatge automàtic
Rights:	S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada' http://creativecommons.org/licenses/by-nc-nd/3.0/es/
Document type:	Research/Master Thesis
Published by:	Universitat Politècnica de Catalunya
Share:

Show full item record

Accesibility | Legal note | Cookies Policy

Coordination

Supporters