Información

5.1: Introducción al movimiento browniano multivariante - Biología

5.1: Introducción al movimiento browniano multivariante - Biología


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Como se discutió en el Capítulo 4, el tamaño del cuerpo es uno de los rasgos más importantes de un animal. Necesitamos entender cómo la evolución del tamaño corporal se correlaciona con las características de otras especies.

Se puede enmarcar una amplia variedad de hipótesis como pruebas de correlaciones entre rasgos que varían continuamente entre especies. Por ejemplo, ¿el tamaño corporal de una especie está relacionado con su tasa metabólica? ¿Cómo se relaciona la longitud de la cabeza de una especie con el tamaño total? ¿Se relacionan las desviaciones de esta relación con la dieta de un animal? Estas preguntas y otras similares son de interés para los biólogos evolutivos porque nos permiten probar hipótesis sobre los factores que influyen en la evolución del carácter a lo largo de escalas de tiempo prolongadas. Este tipo de enfoques nos permite responder algunas de las preguntas clásicas de "por qué" en biología. ¿Por qué los elefantes son tan grandes? ¿Por qué algunas especies de cocodrilos tienen cabezas más largas que otras? Si encontramos una correlación entre dos caracteres, podríamos sospechar que existe una relación causal entre nuestras dos variables de interés, o quizás que nuestras dos variables medidas comparten una causa común.

En este capítulo usaremos el ejemplo del tamaño del área de distribución del hogar, que es el área donde un animal realiza sus actividades diarias. Usaremos nuevamente datos de Garland (1992) y probaremos una relación entre el tamaño corporal y el tamaño del área de distribución de un mamífero. Describiré métodos para usar datos empíricos para estimar los parámetros de modelos de movimiento browniano multivariante. Luego describiré un enfoque de ajuste de modelo para probar las correlaciones evolutivas. Este enfoque de ajuste de modelo es simple pero no se usa comúnmente. Finalmente, revisaré dos enfoques estadísticos comunes para probar las correlaciones evolutivas, los contrastes filogenéticos independientes y los mínimos cuadrados filogenéticos generalizados, y describiré su relación con los enfoques de ajuste de modelos.


Definición y propiedades del movimiento browniano multivariante

La siguiente es la definición de un proceso de Wiener que estoy siguiendo:

Estoy confundido con respecto al movimiento browniano multivariado que se define de la siguiente manera:

Mi pregunta es, ¿$ mathbf_t $ sigue las mismas condiciones 1-4 para un proceso de Wiener univariado? Obviamente, la condición 1. se cumple ya que $ mathbf_0 = (W_0 ^ 1, cdots, W_0 ^ k) ^ T = (0, cdots, 0) ^ T $, pero ¿cómo se satisfacen las condiciones 2. y 3.? Por ejemplo, ¿es cierto que $ mathbf_u - mathbf_t $ independiente de $ mathbf_s - mathbf_r $? Si escribo los vectores, obtengo:

$ mathbf_u - mathbf_t = begin W_u ^ 1 - W_t ^ 1 vdots W_u ^ k - W_t ^ k end$ y $ mathbf_s - mathbf_r = comenzar W_s ^ 1 - W_r ^ 1 vdots W_s ^ k - W_r ^ k endPS ¿Cómo son estos dos vectores independientes entre sí? Si miramos elemento por elemento, claramente $ W_u ^ 1 - W_t ^ 1 $ es independiente de $ W_s ^ 1 - W_r ^ 1 $ pero es $ W_u ^ 1 - W_t ^ 1 $ independiente de $ W_s ^ 2 - W_r ^ 2 PS

Finalmente, para la condición 3. ¿es cierto que $ mathbf_t - mathbf_s sim N (0, (t-s) mathbf_k) $ donde $ mathbf_k $ es la matriz identidad $ k veces k $? Si es así, ¿por qué es verdad?


5.1: Introducción al movimiento browniano multivariado - Biología

Esta función permite ajustar el modelo de movimiento browniano multivariado / paseo aleatorio en series de tiempo. Esta función también puede adaptarse a modelos restringidos.

Uso

Argumentos

Serie temporal: vector de edades muestrales.

Matriz o marco de datos con especies / puntos muestreados en filas y rasgos continuos en columnas

Matriz o marco de datos con especies / puntos muestreados en filas y varianza de muestreo de rasgos continuos (error estándar al cuadrado) en columnas.

Lista de argumentos que se pasarán a la función. Vea los detalles abajo.

Elija entre & quotrpf & quot, & quotinverse & quot o & quot pseudoinverse & quot para el cálculo de la verosimilitud logarítmica durante el proceso de ajuste. Vea los detalles abajo.

Si la serie de tiempo debe escalarse a la longitud de la unidad o no.

Métodos utilizados por las rutinas de optimización (consulte? Optim y? Subplex para obtener más detalles). El método & quotfixed & quot devuelve únicamente la función de probabilidad logarítmica.

Max. dependiente del número de iteraciones del optimizador, se pueden fijar otras opciones en la lista (ver? optim o? subplex).

Opcional. Precálculo de parámetros fijos. Ver? Mvmorph.Precalc.

Si los diagnósticos de convergencia deben devolverse o no.

Si los resultados deben devolverse o no.

Detalles

La función mvRWTS se ajusta a un Random Walk multivariante (RW, es decir, la contraparte de la serie temporal del proceso de movimiento browniano).

El argumento "método" permite al usuario probar diferentes algoritmos para calcular la probabilidad logarítmica. Los métodos & quotrpf & quot y & quotsparse & quot utilizan algoritmos GLS rápidos basados ​​en la factorización para evitar el cálculo de la inversa de la matriz de varianza-covarianza y su determinante involucrado en la estimación logarítmica de verosimilitud. El enfoque "inverso" utiliza el cálculo explícito estándar "estable" de la inversa y el determinante de la matriz y, por lo tanto, es más lento. El método "pseudoinverso" utiliza un inverso generalizado que es más seguro para la matriz cercana a la singularidad pero que requiere mucho tiempo. Consulte? MvLL para obtener más detalles sobre estos métodos computacionales.

Argumentos en el & quotparam & quot lista están:

& quot restricción & quot - El argumento & quotconstraint & quot en la lista & quotparam & quot permite al usuario calcular la probabilidad conjunta para cada rasgo asumiendo que evolucionaron de forma independiente (restricción = "diagonal" o restricción = "equaldiagonal"). Si restricción = "igual", los valores sigma están restringidos a ser los mismos para cada rasgo utilizando la descomposición restringida de Cholesky propuesta por Adams (2013) o una estrategia de separación basada en parametrización esférica cuando p & gt2 (Clavel et al. 2015).

Las restricciones definidas por el usuario se pueden especificar mediante una matriz numérica (cuadrada y simétrica) con valores enteros tomados como índices de los parámetros.

Por ejemplo, para tres rasgos:

restricción = matriz (c (1, 3, 3, 3, 2, 3, 3, 3, 2), 3).

Las covarianzas restringidas a cero son introducidas por valores NA, por ejemplo,

restricción = matriz (c (1, 4, 4, 4, 2, NA, 4, NA, 3), 3).

La diferencia entre dos modelos ajustados anidados se puede evaluar utilizando la función & quot LRT & quot. Vea el ejemplo a continuación y? LRT.

& quotdecomp & quot - Para el caso general (modelos no restringidos), la matriz sigma se parametriza mediante varios métodos para asegurar su definición positiva (Pinheiro y Bates, 1996). Estos métodos son las parametrizaciones "cholesky", "eigen +" y "esférica".

& quottendencia & quot - Establecido por defecto en FALSO. Si es VERDADERO, se permite que el estado ancestral se desvíe y conduzca a una caminata aleatoria direccional. Tenga en cuenta que es posible proporcionar un vector de índices enteros para restringir las tendencias estimadas cuando p & gt1 (consulte las viñetas).

& quotsigma & quot - Valores iniciales para la estimación de verosimilitud. De forma predeterminada, las covarianzas de rasgos se utilizan como valores iniciales para la optimización de la probabilidad. El usuario puede especificar valores iniciales como matrices simétricas cuadradas o un vector simple de valores para el factor superior de la matriz sigma. La parametrización se realiza mediante la factorización determinada mediante el argumento & quotdecomp & quot (Pinheiro y Bates, 1996). Por lo tanto, debe proporcionar p * (p + 1) / 2 valores, con p el número de rasgos (por ejemplo, números aleatorios o los valores del factor de Cholesky de una matriz sigma definida positiva simétrica, vea el ejemplo a continuación). Si se utiliza un modelo restringido, el número de valores iniciales es (p * (p-1) / 2) +1.

Valor

La probabilidad logarítmica del modelo óptimo.

Criterio de información de Akaike para el modelo óptimo.

Estados ancestrales estimados.

Matriz de tasas evolutivas para cada régimen selectivo.

El estado de convergencia de la función de optimización & quot0 & quot indica convergencia (consulte? Optim para más detalles).

Fiabilidad de las estimaciones de verosimilitud calculadas mediante la descomposición propia de la matriz de arpillera. & quot0 & quot significa que se ha alcanzado una estimación fiable (consulte? mvOU).

Lista de parámetros de ajuste del modelo (optimización, método, modelo, número de parámetros).

La función logarítmica de verosimilitud evaluada en el modelo se ajusta a & quot $ llik (par, root.mle = TRUE) & quot.

Autor (es)

Referencias

Adams D.C. 2013. Comparación de tasas evolutivas para diferentes rasgos fenotípicos en una filogenia usando verosimilitud. Syst. Biol. 62: 181-192.

Clavel J., Escarguel G., Merceron G. 2015. mvMORPH: un paquete R para ajustar modelos evolutivos multivariados a datos morfométricos. Métodos Ecol. Evol., 6 (11): 1311-1319.

Caza G. (2012). Medir las tasas de evolución fenotípica y la inseparabilidad del tempo y el modo. Paleobiología, 38 (3): 351-373.


Detalles

La función mvBM se ajusta a un proceso de movimiento browniano (BM) multivariado, con tasas de BM únicas o múltiples (ver O'Meara et al., 2006 Revell y Collar, 2009). Tenga en cuenta que la función utiliza el enfoque no censurado de O'Meara et al. (2006) por defecto (es decir, se asume un estado ancestral común para los diferentes regímenes), pero es posible especificar múltiples estados ancestrales (es decir, uno para cada régimen) a través del parámetro "smean" (smean = FALSE) en el lista "param".

El argumento "método" permite al usuario probar diferentes algoritmos para calcular la probabilidad logarítmica. Los métodos "rpf" y "sparse" utilizan algoritmos GLS rápidos basados ​​en factorización para evitar el cálculo de la inversa de la matriz de varianza-covarianza y su determinante involucrado en la estimación de log-verosimilitud. El enfoque "inverso" utiliza el cálculo explícito estándar "estable" de la inversa y el determinante de la matriz y, por lo tanto, es más lento. El método "pseudoinverso" utiliza un inverso generalizado que es más seguro para la matriz cercana a la singularidad pero que requiere mucho tiempo. El método "pic" utiliza un algoritmo muy rápido basado en contrastes independientes. Debe usarse con árboles estrictamente dicotómicos (es decir, sin politomías) y actualmente no está disponible para el modelo multivariado "BMM". Consulte? MvLL para obtener más detalles sobre estos métodos computacionales.

los "param" enumerar argumentos:

"restricción" - El argumento "restricción" en la lista "param" permite al usuario calcular la probabilidad conjunta para cada rasgo asumiendo que evolucionaron de forma independiente ( restricción = "diagonal", o restricción = "equaldiagonal"). Si restricción = "igual", los valores sigma están restringidos a ser los mismos para cada rasgo estudiado utilizando la descomposición restringida de Cholesky propuesta por Adams (2013) o una estrategia de separación basada en la parametrización esférica (cuando p & gt2) debido a un comportamiento inestable observado para el Cholesky restringido (Clavel et al. al.2015).

Este enfoque se extiende aquí al caso de tasas múltiples especificando que las tasas deben ser las mismas en diferentes partes del árbol (régimen selectivo común). También es posible restringir las matrices de tasas en el modelo "BMM" para compartir los mismos vectores propios (restricción = "compartido") la misma varianza pero diferentes covarianzas (restricción = "varianza") la misma correlación pero diferentes varianzas (restricción = "correlación") o para ajustar un modelo con matrices de tasas diferentes pero proporcionales (restricción = "proporcional").

Finalmente, los modelos restringidos definidos por el usuario se pueden especificar a través de una matriz numérica (cuadrada y simétrica) con valores enteros tomados como índices de los parámetros. Por ejemplo, para tres rasgos:

Las covarianzas restringidas a cero son introducidas por valores NA, por ejemplo,

La diferencia entre dos modelos ajustados anidados se puede evaluar mediante la función "LRT". Vea el ejemplo a continuación y? LRT.

"descomp" - Para el caso general (modelos no restringidos), la matriz sigma se parametriza mediante varios métodos para asegurar su definición positiva (Pinheiro y Bates, 1996). Estos métodos son las parametrizaciones "cholesky", "eigen +" y "esférica".

"mancha" - Establecido por defecto en TRUE. Si es FALSO, se estima el estado ancestral de cada régimen selectivo (por ejemplo, Thomas et al., 2006).

"tendencia" - Establecido por defecto en FALSO. Si es VERDADERO, se permite que el estado ancestral se desplace linealmente con el tiempo. Este modelo es identificable solo con árboles no ultramétricos. Tenga en cuenta que es posible proporcionar un vector de índices enteros para restringir las tendencias estimadas (consulte las viñetas).

"sigma" - Valores iniciales para la estimación de verosimilitud. De forma predeterminada, los valores teóricos esperados se utilizan como valores iniciales para la optimización de la probabilidad (para errores de medición, tasas múltiples). El usuario puede especificar valores iniciales con un objeto list () para el modelo "BMM" (por ejemplo, dos objetos en la lista para un análisis de dos regímenes), o un vector simple de valores para el modelo "BM1". La parametrización se realiza utilizando varias factorizaciones para matrices simétricas (por ejemplo, para el argumento "descomp" Pinheiro & amp Bates, 1996). Por lo tanto, debe proporcionar p * (p + 1) / 2 valores, con p el número de rasgos (por ejemplo, números aleatorios o los valores del factor de Cholesky de una matriz sigma definida positiva simétrica, vea el ejemplo a continuación). Si se utiliza un modelo restringido, el número de valores iniciales es (p * (p-1) / 2) +1.

Si no se especifica un régimen selectivo, la función solo funciona con el modelo "BM1".

N.B .: El mapeo de estados ancestrales se puede hacer usando las funciones "make.simmap", "make.era.map" o "paintSubTree" del paquete "phytools".


Ver el vídeo: Movimiento Browniano (Mayo 2022).