Componentes principales (PCA)

Esta función ejecuta un Análisis de Componentes Principales (PCA), una técnica multivariante de reducción de datos que permite transformar un conjunto de variables correlacionadas en un número menor de variables no correlacionadas denominadas componentes. El motor está diseñado bajo el estándar de salida de SPSS, proporcionando todas las métricas de adecuación, extracción y rotación necesarias para la interpretación de estructuras latentes (Grice 2001; Jolliffe 2002; Rencher 1992; Revelle in prep).

📊 Estructura de resultados y salida

El reporte se organiza siguiendo las fases lógicas del análisis factorial, desde la validación de la matriz de entrada hasta la exportación de puntuaciones individuales.

1. Pruebas de adecuación muestral

KMO (Kaiser-Meyer-Olkin): Índice que mide la idoneidad de los datos para ser factorizados. Valores superiores a 0.70 se consideran satisfactorios; valores por debajo de 0.50 indican que el análisis no es pertinente.
Prueba de esfericidad de Bartlett: Contrasta la hipótesis nula de que la matriz de correlaciones es una matriz identidad. Un valor de significación \(p < 0.05\) es imprescindible para proceder con el análisis.
Determinante de la matriz: Indica el grado de multicolinealidad. Un determinante muy cercano a cero sugiere que existen variables redundantes que podrían dificultar el cálculo matemático.
MSA (Measures of Sampling Adequacy): Evaluación individual de cada variable. Permite identificar qué ítems específicos no guardan relación con el resto y deberían ser excluidos del modelo.

2. Extracción de varianza total explicada

Autovalores (Eigenvalues): Representan la cantidad de varianza retenida por cada componente. Según el criterio de Kaiser, se suelen extraer aquellos componentes con un autovalor \(> 1\).
Porcentaje de varianza: Proporción de la información original que explica cada componente de forma individual y acumulada.
Comunalidades: Proporción de la varianza de cada variable original que es explicada por el conjunto de los componentes extraídos.

3. Matrices de componentes (Cargas factoriales)

Matriz directa: Muestra la relación inicial entre las variables y los componentes.
Matriz rotada: Resultado de la rotación (Varimax, Oblimin, etc.) para facilitar la interpretación. El motor ordena las variables por tamaño de carga, permitiendo identificar rápidamente qué variables “pesan” en cada factor.
Cargas factoriales: Coeficientes de correlación entre la variable y el componente. Generalmente, cargas \(> 0.40\) indican una asociación significativa para la interpretación del factor.

4. Diagnóstico visual

Gráfico de sedimentación (Scree plot): Representación de los autovalores que permite identificar visualmente el “punto de inflexión” para decidir el número óptimo de componentes a extraer.
Círculo de correlaciones: Representa las variables en un espacio bidimensional (Componente 1 y 2). La cercanía de los vectores indica una alta correlación entre variables, y su longitud indica la calidad de su representación en el plano.
Mapa de casos (Score plot): Posiciona a cada individuo en el nuevo espacio factorial, permitiendo detectar agrupaciones de casos o perfiles atípicos en función de sus puntuaciones.

💡 Notas

Rotación: El analista puede seleccionar métodos ortogonales (Varimax), que mantienen los factores independientes entre sí, o métodos oblicuos (Promax/Oblimin) si se asume que los factores pueden estar relacionados en la realidad.
Puntuaciones factoriales: La función permite generar y exportar nuevas variables (FAC1, FAC2…) que resumen la información de las variables originales, listas para ser usadas en análisis posteriores como segmentaciones o regresiones.
Interpretación de signos: El signo de las cargas factoriales es arbitrario; lo relevante es la relación de coincidencia o contraposición entre las variables que cargan en un mismo componente.

References

Grice, James W. 2001. “Computing and Evaluating Factor Scores.” Psychological Methods 6: 430–50.

Jolliffe, Ian T. 2002. Principal Component Analysis. 2nd ed. Springer.

Rencher, Alvin C. 1992. “Interpretation of Canonical Discriminant Functions, Canonical Variates, and Principal Components.” The American Statistician 46 (3): 217–25.

Revelle, William. in prep. “An Introduction to Psychometric Theory with Applications in R.” Unpublished manuscript. in prep.