REGRESIÓN DE DIRICHLET

La regresión de Dirichlet se enfoca a la predicción de datos composicionales y puede ser usado en distintas áreas de estudio como ecología, salud y economía. Disponible en Excel usando el software de XLSTAT

Untitled (5).png

¿En qué se usa la regresión de Dirichlet?

La regresión de Dirichlet, así como la regresión lineal o la regresión logística, tienen como hacer predicciones basadas en una o varias variables explicativas. Sin embargo, a diferencia de muchos otros tipos de regresión, un modelo de regresión de Dirichlet no predice valores específicos de una variable explicada sino varias proporciones de datos composicionales. En este sentido, es una generalización de la regresión Beta, esta última solo nos permite predecir dos proporciones.

¿Cuándo usar la regresión de Dirichlet?

Por ejemplo, si sus variables de respuesta son proporciones de tipos de árboles, la regresión de Dirichlet le permite predecir la proporción de robles, manzanos y abedules dependiendo de variables como la temperatura promedio del aire y la humedad promedio en diferentes zonas geográficas.

¿Cómo funciona la regresión de Dirichlet en XLSTAT?

La función de regresión de Dirichlet desarrollada en XLSTAT-R llama a la función DirichReg del paquete DirichletReg en R (Marco Johannes Maier), que ofrece varias opciones que le permitirán obtener una visión profunda de sus datos:

  • Seleccione varias columnas que contengan las proporciones de cada variable a explicar
  • Seleccione varias variables cuantitativas explicativas
  • Incluya interacciones entre sus datos
  • Elija entre el modelo común y alternativo de media/dispersión
  • Visualice cómo se distribuyen sus datos con un diagrama ternario

¿Cuál es la diferencia entre las regresiones de Direchlet, Beta y lineal?

¿Qué es una regresión lineal?

A diferencia de la regresión de Dirichlet y la regresión Beta, la regresión lineal no predice proporciones. Consiste en predecir una variable cuantitativa en base a una o varias variables cuantitativas y asume que existe una relación lineal entre las variables. Aquí está la ecuación del modelo de regresión lineal:

Y=X*β + ε

donde Y es un vector de los valores de la variable explicada, X el vector (o matriz) de los valores de la(s) variable(s) explicativa(s), \beta es el vector de los coeficientes de regresión y \epsilon el error aleatorio. Si desea obtener más información sobre la regresión lineal en XLSTAT, no dude en consultar esta función.

¿Qué es una regresión beta?

La regresión beta se utiliza para predecir las probabilidades de que ocurra un evento (y su opuesto). Asume que la variable respuesta sigue una distribución Beta: Y~B(μ,φ) con μ es la media y Φ un parámetro de precisión tal que ρ = μφ es un parámetro de forma. Necesitamos estimar estos parámetros con nuestros datos. Para hacerlo, usamos para cada variable yt una función de enlace (link0) tal que g(μt)=X*β+ε y se aplica el método de regresión lineal anterior para identificar los valores g(μt) que permite estimar cada μt y φ antes de encontrar el parámetro de forma ρ.

¿Se pregunta cuándo usar la regresión Beta? Por ejemplo, supongamos que queremos predecir la probabilidad de que cada ciudadano francés esté sano o no en función de varios factores como fumar, beber y el promedio de horas de sueño. En este caso, el evento sería “sano”, su contrario sería “no saludable” y trataríamos de estimar la probabilidad de que el ciudadano esté sano.

 

¿Qué es una regresión Dirichlet?

La regresión de Dirichlet es una generalización de la regresión Beta. En lugar de predecir solo una probabilidad o proporción, puede predecir varias proporciones o probabilidades para más de dos resultados mediante un enfoque similar. Suponemos que la variable respuesta sigue una distribución de Dirichlet, que es similar a la distribución Beta pero tiene en cuenta más de un evento y su opuesto.

Puede usarse como se especificó anteriormente para predecir proporciones de diferentes especies, pero también podría extender el ejemplo de regresión Beta a un puntaje de salud en una escala de 1 a 5 en lugar de simplemente "saludable" o "no saludable".

Tutorial de cómo ejecutar una regresión de Dirichlet

Aquí está un ejemplo de cómo ejecutar una regresión de Dirichlet usando XLSTAT-R.

ternary diagramneural network diagram

analice sus datos con xlstat

prueba gratuita de 14 días