To access the full text documents, please follow this link: http://hdl.handle.net/2099.1/23191

Learning similarity metrics based on pairwise boosting
Bertrán Hernández, David
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions; De Vleeschouwer, Christophe
[ANGLÈS] Early studies affirm that there is a relation between the structure of cell nucleolus and the pathology of the cell. For that reason, a biological component (called silencer) is applied to different cell cultures to try to obtain different kind of structures (so pathologies). Maybe two different silencers (each one applied to different cultures of cells) have the same impact. Thus, the structure obtained is the same for two different cultures. For that reason we doesn't know how many clusters we have. To cluster the cells (or samples extracted from the cells) we must learn a metric able to indicate if two nucleolus structures are similar or they are not. This metric must indicate: - 2 samples from the same cultures are similar. - 2 samples from cultures with its samples distributed in a very sunukar way must be similar. - 2 samples from different cultures with different distributions must have a metric that indicates that both are dissimilar. For this metric learning we are going to use Pairwise boosting. An algorithm that improves the performance of a set of weak classifiers by iteratively selecting and combining them to build a strong classifier. The expression of the strong classifier is going to be used to compute the metric function. Finally, with the metric learned we can measure the similarity between all the samples to cluster them using the Louvain Method.
[CASTELLÀ] Estudios recientes afirman que hay una relación entre la estructura del nucleolus de una célula y su patología. Por esta razón, un componente biológico (llamado silenciador) es aplicado a diferentes células con el objetivo de obtener distintas estructuras de nucleolus (por tanto, distintas patologías). Pued e que dos silenciadores distintos (cada uno aplicado a un cultivo de células distinto) tengan el mismo impacto. Es decir, que la estructura obtenida sea la misma para ambos cultivos. por esta razón, no sabemos el número de clusters que vamos a tener. Para agrupar las células (o muestras extraídas de éstas), debemos aprender una métrica capaz deindicar si dos nucleolus son similares o no. Esta métrica debe indicar: - 2 muestras del mismo cultivo son similares. - 2 muestras de cultivos distintos con muestras distribuidas de manera muy similar deben ser similares. - 2 muestras de distintos cultivos con distintas distribuciones deben tener una métrica que indique que son disimilares. Para este aprendizaje vamos a usar el algoritmo llamado Pairwise boosting. Un algoritmo que mejora la realización de un conjunto de clasificadores débiles seleccionando de manera iterativa los mejores clasificadores y combinándolos para construir un clasificador fuerte. La expresión del clasificador fuerte es usada para calcular la función métrica. Finalmente, con esta métrica aprendida podemos medir la similitud entre todas las muestras y agruparlas usando el método de Louvain.
[CATALÀ] Estudis recents afirmen que hi ha una relació entre la estructura del nucleolus d'una cèl·lula i la patologia d'aquesta. Per això, un component biològic (anomenat silenciador) és aplicat a diferents cèl·lules per intentar obtenir diferents tipus d'estructures (o patologies). Potser dos silenciadors diferents (cada un aplicat a diferents cultius de cèl·lules) tenen el mateix impacte. Per tant, la estructura obtinguda pot ser la mateixa per dos cultius diferents (cada un afectat per un silenciador diferent). Per aquesta raó, no sabem quants clusters tenim. Per agrupar les cèl·lules (o mostres extretes d'elles) hem d'aprendre una mètrica capaç d'indicar si dos estructures de nucleolus són similars o no. Aquesta mètrica ha d'indicar: - 2 mostres del mateix cultiu són similars. - 2 mostres de cultius diferents amb mostres distribuides de manera similar són similars. - 2 mostres de diferents cultius amb diferents distribucions han de tenir una mètrica que indiqui que els cultius són dissimilars. Per aquest aprenentatge de mètrica utilitzarem l'algorisme conegut com Pairwise boosting. Un algorisme que millora la realització d'un conjunt de classificadors dèbils seleccionant iterativament i combinant-los per contruir un classificador fort. La expressió del classificador fort serà utilitzada per calcular la funció de mètrica. Finalment, amb la mètrica apresa, podem mesurar la similitud entre totes les mostres per agrupar-les utilitzant el mètode de Louvain.
Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal
Signal theory (Telecommunication)
Classification
adaboost
pairwise
boosting
similarity
metrics
clusters
Senyal
Teoria del (Telecomunicació)
Senyal, Teoria del (Telecomunicació)
S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
info:eu-repo/semantics/bachelorThesis
Universitat Politècnica de Catalunya
         

Show full item record

 

Coordination

 

Supporters