Descriptivos

Esta función constituye el motor de cálculo para la exploración de variables de intervalo o razón. El algoritmo integra el tratamiento de etiquetas de metadatos (SPSS style) y la gestión de pesos muestrales para la obtención de estadísticos de tendencia central, dispersión y forma.

📊 Estructura de resultados y salida

El output se organiza en bloques de tablas interactivas (vía reactable) y permite la segmentación cruzada (banners) de forma nativa.

1. Sumatorios

  • n real: Frecuencia absoluta de registros con datos válidos en la variable de cálculo.
  • n pond: Sumatorio de los factores de expansión o pesos (wtd.n). Es la base de referencia para el análisis de representatividad.
  • Suma Total: Agregado ponderado de los valores de la variable, fundamental para el cálculo de volúmenes de mercado o consumos totales.

2. Estadísticos de tendencia central

  • Media Ponderada: Estimación puntual del promedio poblacional, calculada mediante la media pesada de Hmisc (wtd.mean).
  • Mediana: Percentil 50 de la distribución ponderada. Actúa como estimador robusto de posición frente a distribuciones con sesgo elevado.

3. Métricas de dispersión y precisión

  • Desviación Típica (SD): Raíz cuadrada de la varianza ponderada. Cuantifica la volatilidad o heterogeneidad de la muestra respecto a la media.
  • Error Típico: Estimación de la desviación estándar de la distribución muestral de la media (\(SD / \sqrt{n_{real}}\)). Es el indicador crítico de la estabilidad del dato.
  • Intervalo de Confianza (Límite Inf/Sup): Rango de estimación construido mediante la distribución t de Student. Define los márgenes de error aleatorio para el nivel de confianza seleccionado (habitualmente 95%).

4. Análisis de distribución y forma

  • Asimetría (Skewness): Momento de tercer orden que indica la dirección y grado de desviación respecto a la simetría normal.
  • Curtosis: Momento de cuarto orden que mide el apuntamiento de la distribución y la concentración en las colas (exceso de curtosis).
  • IQR (Rango Intercuartílico): Diferencia entre el tercer y primer cuartil (Q3 - Q1), proporcionando una medida de dispersión libre de la influencia de outliers.
  • Cuartiles y Deciles: Puntos de corte de la distribución acumulada ponderada. Permiten la segmentación de la muestra en grupos de igual tamaño (segmentos de valor, consumo, etc.).

💡 Notas

  • Grupos combinados: Cuando se seleccionan múltiples variables de grupo, el motor genera automáticamente las combinaciones lógicas (celdas cruzadas), calculando los estadísticos de forma independiente para cada subsegmento.
  • Tratamiento de missing: Los valores perdidos son excluidos en todos los cálculos internos para evitar la propagación de errores en el reporte.