Correlaciones
Esta función ejecuta el cálculo de matrices de asociación para variables métricas, permitiendo identificar la intensidad y dirección de la relación entre pares de variables. El motor soporta coeficientes ponderados y proporciona pruebas de significación estadística para validar las hipótesis de correlación en la población.
📊 Estructura de resultados y salida
El reporte se divide en secciones que abarcan desde la matriz global hasta rankings de fuerza de asociación y representación visual.
1. Matriz de coeficientes de correlación
- Coeficiente (r): Cuantifica la relación lineal entre dos variables. Los valores oscilan entre -1 y +1.
- Direccionalidad: Un signo positivo indica una relación directamente proporcional; un signo negativo indica una relación inversamente proporcional.
- Magnitud: Valores cercanos a la unidad indican una asociación fuerte, mientras que valores próximos a cero sugieren independencia lineal.
2. Matriz de significación (p-values)
- Probabilidad (p): Indica la probabilidad de observar la correlación hallada asumiendo que la correlación poblacional es cero.
- Contraste de hipótesis: Generalmente, un valor \(p < 0.05\) permite rechazar la hipótesis nula, confirmando que la relación es estadísticamente significativa.
3. Rankings de vínculos
- Vínculos más fuertes: Listado ordenado por valor absoluto que identifica las asociaciones de mayor impacto o relevancia en el modelo, independientemente de su signo.
- Vínculos más débiles: Identifica pares de variables con coeficientes cercanos a cero, señalando la ausencia de relación lineal.
4. Visualización de la matriz de correlación
- Mapa de calor (Correlograma): Representación gráfica mediante círculos o colores donde la intensidad del tono y el tamaño del símbolo reflejan la magnitud del coeficiente.
- Filtrado por significación: El gráfico oculta o marca las celdas cuyos coeficientes no alcanzan el nivel de confianza establecido, permitiendo al analista focalizarse únicamente en relaciones validadas.
💡 Notas
- Métodos de cálculo: El sistema permite seleccionar entre Pearson (relación lineal paramétrica), Spearman o Kendall (basados en rangos para distribuciones no normales o relaciones no lineales).
- Ponderación: Todos los coeficientes y sus respectivos niveles de significación se calculan integrando la variable de peso, asegurando que las correlaciones reflejen la estructura del universo muestral.
- Exclusión de casos: El análisis aplica una eliminación por lista (listwise) o por parejas (pairwise) según la integridad de los datos en las variables seleccionadas para evitar sesgos por valores perdidos.
¿Continuamos con bw8outliers()?