Empreu aquest identificador per citar o enllaçar aquest document: http://hdl.handle.net/2072/4709

Data size sufficiency analyses of haplotype inference algortihms
Cleary, Sean; St. John, Katherine
Centre de Recerca Matemàtica
We present experimental and theoretical analyses of data requirements for haplotype inference algorithms. Our experiments include a broad range of problem sizes under two standard models of tree distribution and were designed to yield statistically robust results despite the size of the sample space. Our results validate Gusfield's conjecture that a population size of n log n is required to give (with high probability) sufficient information to deduce the n haplotypes and their complete evolutionary history. The experimental results inspired our experimental finding with theoretical bounds on the population size. We also analyze the population size required to deduce some fixed fraction of the evolutionary history of a set of n haplotypes and establish linear bounds on the required sample size. These linear bounds are also shown theoretically.
08-2007
51 - Matemàtiques
Gens -- Mapatge
Filogènia -- Processament de dades
Inferència
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original, la universitat i el centre i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.5/es/)
Edició preliminar
Centre de Recerca Matemàtica
Prepublicacions del Centre de Recerca Matemàtica;757
         

Text complet d'aquest document

Fitxers Mida Format
Pr757.pdf 205.1 KB PDF

Mostra el registre complet del document

Documents relacionats

Altres documents del mateix autor/a

Bonet Carbonell, Maria Luisa; St. John, Katherine; Mahindru, Ruchi; Amenta, Nina
Burillo Puig, José; Cleary, Sean; Martino, Armando; Röver, Claas E.