-
EstdGrup: Estadístiques de camps agrupant els registres en funció dels valors presents en altres camps
Accés directe de l'ajuda a Internet: EstdGrup
Accés a l'aplicació des del menú: "Eines | Bases de dades alfanumèriques | Estadístiques de grups de registres"
Presentació i opcions
Per a definir l'operació que realitzarà aquesta aplicació, els diferents camps de la base de dades quedaran tipificats com camps agrupadors, camps calculats o simplement camps no participants.
Els camps agrupadors són aquells que classifiquen els resultats en funció dels diferents valors de cadascun d'aquests camps. Donat un camp agrupador, el programa determina quants i quins valors diferents presenta la seva base de dades, organitzada de forma relacional a partir dels identificadors dels objectes gràfics de la taula principal; el conjunt de tots els diferents valors d'un camp que es troben en la base de dades, s'anomena projecció del camp. Per a cada element de la projecció del camp agrupador es calculen els valors dels estadístics indicats per a cada camp calculat.
Els camps calculats són aquells camps de la base de dades dels quals l'usuari desitja conèixer determinats càlculs estadístics. Sobre cada camp calculat l'usuari pot escollir quins estadístics desitja calcular. En funció del tractament que hom doni al camp (habitualment quantitatiu per a camps numèrics i categòric per la resta de camps) l'usuari podrà escollir algun o tots dels següents càlculs estadístics:
-
Ambdós tractaments:
- Nombre de registres totals (inclou sensedades (1))
- Nombre de registres amb dades (sense incloure sensedades
(1))
- Nombre de valors d'un element de la projecció respecte el
nombre total, en percentatge i sense tenir en compte els sensedades
(1)
- Nombre de valors d'un element de la projecció respecte el
nombre total, en percentatge i tenint en compte els sensedades
(1)
-
Tractament categòric:
- Moda; en el cas de moda no única, serà el primer valor
(2)
- Percentatge d'ocurrència de la moda excloent els valors
sensedades
- Índex de Shannon
- Primer valor (2)
- Últim valor (2)
-
Tractament quantitatiu:
- Mitjana
- Desviació estàndard (dividint entre N)
- Variància (dividint entre N)
- Sumatori
- Rang (per a enters, 1+max-min)
- Mínim
- Màxim
- Mediana
- Mitjana de les desviacions absolutes respecte de la mediana
(1) Sensedades per a una base de dades inclou els valors sensedades explícits, els registres buits i els registres en blanc.
(2) Per al tractament numèric l'ordenació és la natural (1,2,3...), però per al tractament categòric cal tenir en compte el tipus d'ordenació utilitzada; s'usa una ordenació alfabètica no-estricta, basada en l'ordre dels codis ASCII corresponents a cada caràcter. Això implica que naturalment A és anterior a B, però en canvi a o à és posterior a B.
En els càlculs de quantils, com la mediana, es pot indicar, amb el modificador /MEDIANA_EMPAT=, el tipus de desempat a usar per al seu càlcul quan la posició del quantil sigui entre dos valors de la sèrie. Per a més informació es pot consultar sintaxi general.
El resultat de l'anàlisi estadística pot presentar-se en tres formats:
- HTM: Es genera un únic fitxer en format HTML que mostra per a cada nivell d'agrupació definit, els resultats estadístics en forma de taules.
- DBF: Per a cada camp agrupador es genera una taula DBF amb tants registres com valors té la projecció del camp agrupador i amb els estadístics de cada camp calculat com a camps d'aquesta taula DBF.
- CSV: Es genera un full de càlcul en format text amb separador de llistes (típicament el caràcter ;), que té la mateixa estructura que el format HTM.
En funció dels formats de sortida, el programa presenta els següents modes d'operació:
EstdGrup HTM:
Aquesta opció realitza càlculs estadístics per a un o més camps d'una base de dades (típicament la relacionada amb una capa vectorial estructurada), amb la particularitat de que aquests estadístics es calculen i es classifiquen segons unes agrupacions definides per l'usuari. Els resultats dels càlculs estadístics es desen en un fitxer en format HTML.
EstdGrup DBF:
Aquesta opció realitza càlculs estadístics per a un o més camps d'una base de dades (típicament la relacionada amb una capa vectorial estructurada), amb la particularitat de que aquests estadístics es calculen i es classifiquen segons unes agrupacions definides per l'usuari. Els resultats dels càlculs estadístics es desen en format DBF en el directori de destí.
EstdGrup CSV:
Aquesta opció realitza càlculs estadístics per a un o més camps d'una base de dades (típicament la relacionada amb una capa vectorial estructurada), amb la particularitat de que aquests estadístics es calculen i es classifiquen segons unes agrupacions definides per l'usuari. Els resultats dels càlculs estadístics es desen en un fitxer en format CSV.

Caixa de diàleg de l'aplicació
|
Caixa de diàleg del EstdGrup |

Sintaxi
Sintaxi:
- EstdGrup Opció FitxerOrigen FitxerSortida [/GRP_#] [/ESTD_#] [/CAT_#] [/NUM_#] [/N_REG_TOTALS_#] [/N_REG_DADES_#] [/PRCNT_MODA_#] [/MODA_#] [/I_SHAN_#] [/MITJANA_#] [/DESV_STD_#] [/VAR_#] [/SUMA_#] [/MIN_#] [/MAX_#] [/PRCNT_GRUP_#] [/PRCNT_GRUP_NODATA_#] [/MEDIANA_#] [/DESV_MEDIANA_#] [/MEDIANA_EMPAT_#=] [/N_DECIMALS]
- EstdGrup Opció FitxerOrigen DirectoriDestí [/GRP_#] [/ESTD_#] [/CAT_#] [/NUM_#] [/N_REG_TOTALS_#] [/N_REG_DADES_#] [/PRCNT_MODA_#] [/MODA_#] [/I_SHAN_#] [/MITJANA_#] [/DESV_STD_#] [/VAR_#] [/SUMA_#] [/MIN_#] [/MAX_#] [/PRCNT_GRUP_#] [/PRCNT_GRUP_NODATA_#] [/MEDIANA_#] [/DESV_MEDIANA_#] [/MEDIANA_EMPAT_#=] [/N_DECIMALS]
- EstdGrup Opció FitxerOrigen FitxerSortida [/GRP_#] [/ESTD_#] [/CAT_#] [/NUM_#] [/N_REG_TOTALS_#] [/N_REG_DADES_#] [/PRCNT_MODA_#] [/MODA_#] [/I_SHAN_#] [/MITJANA_#] [/DESV_STD_#] [/VAR_#] [/SUMA_#] [/MIN_#] [/MAX_#] [/PRCNT_GRUP_#] [/PRCNT_GRUP_NODATA_#] [/MEDIANA_#] [/DESV_MEDIANA_#] [/MEDIANA_EMPAT_#=] [/N_DECIMALS]
Opcions:
- HTM (o 1): Es genera un informe del resultat dels càlculs estadístics en format HTML.
- DBF (o 2): Es generen tantes taules en format DBF com camps agrupadors en el directori de destí. Cada taula té els resultats estadístics del seu corresponent camp agrupador.
- CSV (o 3): Es genera un full de càlcul en format CSV (que delimita els camps per un separador de llistes) amb el resultat dels càlculs estadístics.
Paràmetres:
- FitxerOrigen
(Fitxer Origen -
Paràmetre d'entrada): Fitxer REL corresponent a la base de dades d'una capa vectorial estructurada, o taula DBF, a partir de la qual es realitzaran els càlculs estadístics seleccionats.
- FitxerSortida
(Fitxer Sortida -
Paràmetre de sortida): Per a les opcions HTM (1) i CSV (3) és el fitxer que contindrà els resultats del càlculs estadístics indicats.
- DirectoriDestí
(Directori Destí -
Paràmetre de sortida): És el directori on s'escriuran els resultats en les corresponents taules DBF generades per a cada camp agrupador.
Modificadors:
/GRP_#= (Camp Agrupador #) Nom del camp que actua com agrupador amb ordre de prioritat #. El valor d'aquesta variable contindrà un text alfanumèric construït a partir del nom del camp i les seves relacions des de la taula principal. Es poden usar N camps agrupadors (GRP_#), on # és el número de camp agrupador (GRP_1, GRP_2,...). L'ordre de prioritat comença pel valor 1, que indica el nivell d'agrupació més general. Podeu veure més consideracions a sintaxi general. (Paràmetre d'entrada) /ESTD_#= (Camp estadístiques #) Nom del camp sobre el que es realitzen diferents càlculs estadístics identificats per l'índex #, que només té el significat d'ordre en què es mostren els diferents camps calculats. Es poden fer estadístiques sobre N camps. El seu valor es construeix de la mateixa manera que /GRP_#. (Paràmetre d'entrada) /CAT_# (Tractament categòric) Indica tractament categòric del camp identificat per /ESTD_#. (Paràmetre d'entrada) /NUM_# (Tractament quantitatiu) Indica tractament quantitatiu del camp identificat per /ESTD_#. (Paràmetre d'entrada) /N_REG_TOTALS_# (Registres totals) Pel camp identificat per /ESTD_# es desitja conèixer quin és el nombre de registres totals (inclou registres buits, blancs o sensedades). (Paràmetre d'entrada) /N_REG_DADES_# (Nombre de registres amb dades) Pel camp identificat per /ESTD_# es desitja conèixer quin és el nombre de registres amb dades (sense incloure registres buits, blancs o sensedades). (Paràmetre d'entrada) /PRCNT_MODA_# (Percentatge Moda) Indica que es desitja conèixer el percentatge d'ocurrència del valor modal pel camp identificat per /ESTD_# en un tractament categòric. (Paràmetre d'entrada) /MODA_# (Càlcul Moda) Indica que es desitja el càlcul de la moda pel camp identificat per /ESTD_# en un tractament categòric. (Paràmetre d'entrada) /I_SHAN_# (Índex de Shannon) Indica que es desitja el càlcul de l'índex de Shannon pel camp identificat per /ESTD_# en un tractament categòric. (Paràmetre d'entrada) /MITJANA_# (Càlcul mitjana) Indica que es desitja el càlcul de la mitjana pel camp identificat per /ESTD_# en un tractament quantitatiu. (Paràmetre d'entrada) /DESV_STD_# (Desviació estàndard) Indica que es desitja el càlcul de la desviació estàndard pel camp identificat per /ESTD_# en un tractament quantitatiu. (Paràmetre d'entrada) /VAR_# (Variància) Indica que es desitja el càlcul de la variància pel camp identificat per /ESTD_# en un tractament quantitatiu. (Paràmetre d'entrada) /SUMA_# (Sumatori) Indica que es desitja conèixer el sumatori de tots els valors pel camp identificat per /ESTD_# en un tractament quantitatiu. (Paràmetre d'entrada) /MIN_# (Mínim) Indica que es desitja conèixer el valor mínim pel camp identificat per /ESTD_# en un tractament quantitatiu, o el primer valor en una ordenació alfabètica ascendent pel tractament categòric. (Paràmetre d'entrada) /MAX_# (Màxim) Indica que es desitja conèixer el valor màxim pel camp identificat per /ESTD_# en un tractament quantitatiu, o l'últim valor en una ordenació alfabètica ascendent pel tractament categòric. (Paràmetre d'entrada) /PRCNT_GRUP_# (Nombre de valors vàlids) Indica que es desitja conèixer el nombre de valors d'un element de la projecció respecte el nombre total de valors pel camp identificat per /ESTD_# . En aquest càlcul no es tenen en compte els valors sensedades. (Paràmetre d'entrada) /PRCNT_GRUP_NODATA_# (Nombre de valors tenint en compte el sensedades) Indica que es desitja conèixer el percentatge del valor respecte el nombre de valors totals de la projecció pel camp identificat per /ESTD_# . En aquest càlcul sí es tenen en compte els valors sensedades. (Paràmetre d'entrada) /MEDIANA_# (Mediana) Indica que es desitja conèixer la mediana de tots els valors pel camp identificat per /ESTD_# en un tractament quantitatiu. (Paràmetre d'entrada) /DESV_MEDIANA_# (Mitjana de les desviacions absolutes respecte de la mediana) Indica que es desitja conèixer la mitjana de les desviacions absolutes respecte de la mediana de tots els valors pel camp identificat per /ESTD_# en un tractament quantitatiu. (Paràmetre d'entrada) /MEDIANA_EMPAT_#= (Desempat de la mediana) Si s'ha sol·licitat el càlcul d'algun quantil (com ara la mediana, un quartil o un percentil), indica el criteri de desempat a usar per al seu càlcul. Per a saber més sobre els valors d'aquest paràmetre es pot consultar les consideracions del document de sintaxi general. (Paràmetre d'entrada) /N_DECIMALS= (Nombre de dígits decimals) És el nombre de xifres decimals pels resultats de les estadístiques que corresponguin a un valor numèric no-enter. Si no s'especifica, s'usa el valor definit en el fitxer de configuració MiraMon.par (Paràmetre d'entrada)
