Correlaciones

Esta función ejecuta el cálculo de matrices de asociación para variables métricas, permitiendo identificar la intensidad y dirección de la relación entre pares de variables. El motor soporta coeficientes ponderados y proporciona pruebas de significación estadística para validar las hipótesis de correlación en la población.

📊 Estructura de resultados y salida

El reporte se divide en secciones que abarcan desde la matriz global hasta rankings de fuerza de asociación y representación visual.

1. Matriz de coeficientes de correlación

  • Coeficiente (r): Cuantifica la relación lineal entre dos variables. Los valores oscilan entre -1 y +1.
  • Direccionalidad: Un signo positivo indica una relación directamente proporcional; un signo negativo indica una relación inversamente proporcional.
  • Magnitud: Valores cercanos a la unidad indican una asociación fuerte, mientras que valores próximos a cero sugieren independencia lineal.

2. Matriz de significación (p-values)

  • Probabilidad (p): Indica la probabilidad de observar la correlación hallada asumiendo que la correlación poblacional es cero.
  • Contraste de hipótesis: Generalmente, un valor \(p < 0.05\) permite rechazar la hipótesis nula, confirmando que la relación es estadísticamente significativa.

3. Rankings de vínculos

  • Vínculos más fuertes: Listado ordenado por valor absoluto que identifica las asociaciones de mayor impacto o relevancia en el modelo, independientemente de su signo.
  • Vínculos más débiles: Identifica pares de variables con coeficientes cercanos a cero, señalando la ausencia de relación lineal.

4. Visualización de la matriz de correlación

  • Mapa de calor (Correlograma): Representación gráfica mediante círculos o colores donde la intensidad del tono y el tamaño del símbolo reflejan la magnitud del coeficiente.
  • Filtrado por significación: El gráfico oculta o marca las celdas cuyos coeficientes no alcanzan el nivel de confianza establecido, permitiendo al analista focalizarse únicamente en relaciones validadas.

💡 Notas

  • Métodos de cálculo: El sistema permite seleccionar entre Pearson (relación lineal paramétrica), Spearman o Kendall (basados en rangos para distribuciones no normales o relaciones no lineales).
  • Ponderación: Todos los coeficientes y sus respectivos niveles de significación se calculan integrando la variable de peso, asegurando que las correlaciones reflejen la estructura del universo muestral.
  • Exclusión de casos: El análisis aplica una eliminación por lista (listwise) o por parejas (pairwise) según la integridad de los datos en las variables seleccionadas para evitar sesgos por valores perdidos.

¿Continuamos con bw8outliers()?