EstdGrup: Estadísticas de campos agrupando los registros en función de los valores presentes en otros campos

Acceso directo de la ayuda en Internet: EstdGrup

Acceso a la aplicación desde el menú: "Herramientas | Bases de datos alfanuméricas | Estadísticas de grupos de registros"

Presentación y opciones	Caja de diálogo de la aplicación
Sintaxis

Presentación y opciones

Esta aplicació nrealiza cálculos estadísticos para uno o más campos de una base de datos (típicamente la relacionada con una capa vectorial estructurada), con la particularidad de que las variables estadísticas se calculan y clasifican según unas agrupaciones definidas por la persona usuaria.

Para definir la operación que realizará esta aplicación, los diferentes campos de la base de datos quedarán tipificados como campos agrupadores, campos calculados o simplemente campos no participantes.

Los campos agrupadores son aquellos que clasifican los resultados en función de los diferentes valores de cada uno de estos campos. Dado un campo agrupador, el programa determina cuántos y qué valores diferentes presenta la base de datos, organizada de forma relacional a partir de los identificadores de los objetos gráficos de la tabla principal; al conjunto de los diferentes valores de un campo encontrados se le llama proyección del campo. Para cada elemento de la proyección del campo agrupador, se calculan los valores estadísticos indicados para cada campo calculado.

Los campos calculados son aquellos campos de la base de datos de los que el usuario desea conocer determinados cálculos estadísticos. Sobre cada campo calculado el usuario puede escoger qué estadísticos desea calcular. En función del tratamiento que se de al campo (habitualmente cuantitativo para campos numéricos y categórico para el resto) el usuario podrá escoger entre los siguientes cálculos estadísticos:

Ambos tratamientos:
- Número de registros totales (incluye sindatos ⁽¹⁾)
- Número de registros con datos (sin incluir sindatos ⁽¹⁾)
- Número de valores de un elemento de la proyección respecto el número total, en porcentaje y sin considerar los sindatos ⁽¹⁾
- Número de valores de un elemento de la proyección respecto el número total, en porcentaje y considerando los sindatos ⁽¹⁾
Tratamiento categórico:
- Moda; en el caso de moda no única, será el primer valor ⁽²⁾
- Porcentaje de ocurrencia de la moda excluyendo los valores sindatos
- Índice de Shannon
- Primer valor ⁽²⁾
- Último valor ⁽²⁾
Tratamiento cuantitativo:
- Media
- Desviación estándar (dividiendo entre N)
- Variancia (dividiendo entre N)
- Sumatorio
- Rango (para enteros, 1+max-min)
- Mínimo
- Máximo
- Mediana
- Media de las desviaciones absolutas respecto de la mediana

(1) Sindatos para una base de datos incluye los valores sindatos explícitos, los registros vacíos y los registros en blanco.
(2) Para el tratamiento numérico la ordenación es la natural (1,2,3...), pero para el tratamiento categórico debe considerarse el tipo de ordenación utilizada; se usa una ordenación alfabética no estricta, basada en el orden de los códigos ASCII correspondientes a cada carácter. Esto implica que naturalmente A es anterior a B, pero en cambio a o á es posterior a B.

En los cálculos de cuantiles, como la mediana, puede indicarse, con el modificador /MEDIANA_EMPAT=, el tipo de desempate a usar para su cálculo cuando la posición del cuantil sea entre dos valores de la serie. Para más información se puede consultar sintaxis general.

El resultado del análisis estadístico puede presentarse en tres formatos:

HTM: Se genera un único fichero en formato HTML que muestra para cada nivel de agrupación definido, los resultados estadísticos en forma de tablas.
DBF: Para cada campo agrupador se genera una tabla DBF con tantos registros como valores tiene la proyección del campo agrupador y con la estadística de cada campo calculado como campos de esta tabla DBF.
CSV: Se genera una hoja de cálculo en formato texto con separador de listas (típicamente el carácter ;), que tiene la misma estructura que el formato HTM.

En función de los formatos de salida, el programa presenta los siguientes modos de operación:

EstdGrup HTM

EstdGrup DBF

EstdGrup CSV

Caja de diálogo de la aplicación

Caja de diálogo de EstdGrup

Sintaxis

Sintaxis:

EstdGrup Opción FicheroOrigen FicheroSalida [/GRP_#] [/ESTD_#] [/CAT_#] [/NUM_#] [/N_REG_TOTALS_#] [/N_REG_DADES_#] [/PRCNT_MODA_#] [/MODA_#] [/I_SHAN_#] [/MITJANA_#] [/DESV_STD_#] [/VAR_#] [/SUMA_#] [/MIN_#] [/MAX_#] [/PRCNT_GRUP_#] [/PRCNT_GRUP_NODATA_#] [/MEDIANA_#] [/DESV_MEDIANA_#] [/MEDIANA_EMPAT_#=] [/N_DECIMALS]
EstdGrup Opción FicheroOrigen DirectorioDestino [/GRP_#] [/ESTD_#] [/CAT_#] [/NUM_#] [/N_REG_TOTALS_#] [/N_REG_DADES_#] [/PRCNT_MODA_#] [/MODA_#] [/I_SHAN_#] [/MITJANA_#] [/DESV_STD_#] [/VAR_#] [/SUMA_#] [/MIN_#] [/MAX_#] [/PRCNT_GRUP_#] [/PRCNT_GRUP_NODATA_#] [/MEDIANA_#] [/DESV_MEDIANA_#] [/MEDIANA_EMPAT_#=] [/N_DECIMALS]
EstdGrup Opción FicheroOrigen FicheroSalida [/GRP_#] [/ESTD_#] [/CAT_#] [/NUM_#] [/N_REG_TOTALS_#] [/N_REG_DADES_#] [/PRCNT_MODA_#] [/MODA_#] [/I_SHAN_#] [/MITJANA_#] [/DESV_STD_#] [/VAR_#] [/SUMA_#] [/MIN_#] [/MAX_#] [/PRCNT_GRUP_#] [/PRCNT_GRUP_NODATA_#] [/MEDIANA_#] [/DESV_MEDIANA_#] [/MEDIANA_EMPAT_#=] [/N_DECIMALS]

Opciones:

HTM (o 1): Se genera un informe del resultado de los cálculos estadísticos en formato HTML.
DBF (o 2): Se generan tantas tablas en formato DBF como campos agrupadores en el directorio de destino. Cada tabla contiene los resultados estadísticos del correspondiente campo agrupador.
CSV (o 3): Se genera una hoja de cálculo en formato CSV (que delimita los campos por un separador de listas) con el resultado de los cálculos estadísticos.

Parámetros:

FicheroOrigen (Fichero Origen - Parámetro de entrada): Fichero REL correspondiente a la base de datos de una capa vectorial estructurada, o tabla DBF, a partir de la cual se realizarán los cálculos estadísticos seleccionados.
FicheroSalida (Fichero Salida - Parámetro de salida): Para las opciones HTM (1) y CSV (3) es el fichero que contendrá los resultados de los cálculos estadísticos indicados.

DirectorioDestino (Directorio Destino - Parámetro de salida): Es el directorio donde se escribirán los resultados en las correspondientes tablas DBF generadas para cada campo agrupador.

Modificadores:

GRP_#

sintaxis general

ESTD_#

CAT_#

NUM_#

N_REG_TOTALS_#

N_REG_DADES_#

PRCNT_MODA_#

MODA_#

I_SHAN_#

MITJANA_#

DESV_STD_#

VAR_#

SUMA_#

MIN_#

MAX_#

PRCNT_GRUP_#

PRCNT_GRUP_NODATA_#

MEDIANA_#

DESV_MEDIANA_#

MEDIANA_EMPAT_#=

sintaxis general

N_DECIMALS