Descriptivos
Esta función constituye el motor de cálculo para la exploración de variables de intervalo o razón. El algoritmo integra el tratamiento de etiquetas de metadatos (SPSS style) y la gestión de pesos muestrales para la obtención de estadísticos de tendencia central, dispersión y forma.
📊 Estructura de resultados y salida
El output se organiza en bloques de tablas interactivas (vía reactable) y permite la segmentación cruzada (banners) de forma nativa.
1. Sumatorios
- n real: Frecuencia absoluta de registros con datos válidos en la variable de cálculo.
- n pond: Sumatorio de los factores de expansión o pesos (
wtd.n). Es la base de referencia para el análisis de representatividad. - Suma Total: Agregado ponderado de los valores de la variable, fundamental para el cálculo de volúmenes de mercado o consumos totales.
2. Estadísticos de tendencia central
- Media Ponderada: Estimación puntual del promedio poblacional, calculada mediante la media pesada de Hmisc (
wtd.mean). - Mediana: Percentil 50 de la distribución ponderada. Actúa como estimador robusto de posición frente a distribuciones con sesgo elevado.
3. Métricas de dispersión y precisión
- Desviación Típica (SD): Raíz cuadrada de la varianza ponderada. Cuantifica la volatilidad o heterogeneidad de la muestra respecto a la media.
- Error Típico: Estimación de la desviación estándar de la distribución muestral de la media (\(SD / \sqrt{n_{real}}\)). Es el indicador crítico de la estabilidad del dato.
- Intervalo de Confianza (Límite Inf/Sup): Rango de estimación construido mediante la distribución t de Student. Define los márgenes de error aleatorio para el nivel de confianza seleccionado (habitualmente 95%).
4. Análisis de distribución y forma
- Asimetría (Skewness): Momento de tercer orden que indica la dirección y grado de desviación respecto a la simetría normal.
- Curtosis: Momento de cuarto orden que mide el apuntamiento de la distribución y la concentración en las colas (exceso de curtosis).
- IQR (Rango Intercuartílico): Diferencia entre el tercer y primer cuartil (Q3 - Q1), proporcionando una medida de dispersión libre de la influencia de outliers.
- Cuartiles y Deciles: Puntos de corte de la distribución acumulada ponderada. Permiten la segmentación de la muestra en grupos de igual tamaño (segmentos de valor, consumo, etc.).
💡 Notas
- Grupos combinados: Cuando se seleccionan múltiples variables de grupo, el motor genera automáticamente las combinaciones lógicas (celdas cruzadas), calculando los estadísticos de forma independiente para cada subsegmento.
- Tratamiento de missing: Los valores perdidos son excluidos en todos los cálculos internos para evitar la propagación de errores en el reporte.