Abstract:
|
La información mutua (MI) es una medida general de asociación entre variables que detecta tanto relaciones lineales como no lineales. Esta medida puede ser muy útil en análisis genéticos, donde los genes pueden interactuar entre ellos de una manera no lineal.
En este trabajo se lleva a cabo una estimación de la información mutua basada en métodos de kernel, empleándose un algoritmo que permite reducir el coste computacional. La significación estadística de los estimadores se evalúa a partir de un test de permutaciones, utilizando una aproximación en el caso de p-valores pequeños. Además, su error estándar es estimado mediante bootstrap.
Se ha creado un paquete en R con esta metodología, aplicándose a datos reales de expresión génica, y se han comparado los resultados con los obtenidos utilizando el coeficiente de correlación de Spearman. Por último, se han explorado otras aplicaciones de la información mutua como la construcción de redes de asociación génica o su uso como distancia en la técnica de MultiDimensional Scaling.. La información mutua (IM) puede ser una medida de asociación interesante para evaluar asociación. Ha sido descrita inicialmente para variables categóricas pero puede extenderse a variables numéricas. En este caso es necesario calcular una doble integral que supone un reto si se desea analizar esta medida para un número importante de combinaciones de variables. El proyecto consistirá en evaluar las propiedades estadísticas de la IM, elaborar un software en R para su cálculo rápido, posiblemente con paralelización que permita el análisis de su error estándar por bootstrap y de la significación por un test de permutaciones. Finalmente se aplicará la IM al análisis de datos genéticos de expresión. |