Sesgo en la optimización de las longitudes de ramas de Raxml

Spa: Las longitudes de ramas son parámetros importantes para otros estudios tales como la reconstrucción de área ancestral o la conservación basada en filogenias. RaxML es un programa para análisis filogenético basado en máxima verosimilitud, de utilidad paramatrices grandes de datos, pero, produce...

Full description

Bibliographic Details
Main Authors: Leon Alvarado, Omar Daniel, Miranda Esquivel, Daniel Rafael
Format: Documento de Conferencia
Language:spa
Published: 2021
Online Access:http://repositorio.uptc.edu.co/handle/001/6986
Description
Summary:Spa: Las longitudes de ramas son parámetros importantes para otros estudios tales como la reconstrucción de área ancestral o la conservación basada en filogenias. RaxML es un programa para análisis filogenético basado en máxima verosimilitud, de utilidad paramatrices grandes de datos, pero, produce valores de verosimilitud diferentes a los de otros programas (e.j. PhyML, GARLI). Se ha propuesto una post-optimización de longitudes de ramas, y el programa más común ha sido PhyML. Aquí evaluamos, si, después de la optimización de ramas, las terminales mantienen la proporción de longitudes. Se esperaría una alta correlación lineal entre las longitudes de ramas optimizadas y no optimizadas. Para responder esto, se construyeron 50 filogenias usando tres diferentes métodos, primero usando RaxML v8, después, la filogenia obtenida con RaxML v8 fue usada como árbol inicial para PhyML v3.0 y finalmente se corrió PhyML v3.0 sin ningún árbol inicial. Todos los métodos usaron el modelo de evolución nucleotídico GTR+GAMMA con análisis particionado. Se realizaron tres comparaciones: 1) Optimización de la topología de RaxMLvs la topología original de RaxML, 2.) Topología original de PhyML vs topología original de RaxML, y 3.) Optimización de la topología de RaxML vs topología original de PhyML.Para cada comparación, se realizó una correlación de Spearman usando solo las longitudes de ramas de las terminales. Las tres comparaciones presentaron un alto valor en la correlación (1. R2=0.77, 2. R2=0.77, 3. R2=0.94), sin embargo, todas las correlaciones no fueron significativas (p-value> 0.05). Para las comparaciones 1 y 2, algunas especiespresentaron ramas cortas en PhyML, pero largas en RaxML y vice versa. Aun con el alto valor en las correlaciones, la optimización de longitudes de ramas de RaxML está sesgada porque, en general, las especies no mantienen la proporción de longitudes de ramas después de la optimización, así que es necesario revisar las longitudes con PhyML.