IsoMM: Classificació no supervisada

Aquesta aplicació realitza una classificació no supervisada d'una imatge inspirat en el mètode clàssic IsoData de Duda i Hart:Duda, RO, PE Hart (1973) "Pattern Classification and Scene Analysis", John Wiley and Sons, New York, [cap. 6, "Unsupervised Learning and Clustering", pp. 226-227].

En la implementació del classificador al MiraMon (IsoMM), l'aplicació comença per un cert nombre de categories clústers suggerit per la persona usuària. La ubicació inicial d'aquestes categories es distribueix inicialment seguint quatre criteris (es poden utilitzar ubicacions amb diversos criteris):

Al llarg de la diagonal multivariant de les dades, repartides de forma equidistant. Es pot restringir el rang en cada variable utilitzant un criteri basat en les dades més properes a la mitjana de cada banda. La persona usuària ha de definir aquest rang a partir de quants cops (n) admet la desviació al voltant de la mitjana; amb aquesta finalitat, de cada una de les bandes (variables) originals es calcula la seva mitjana (M) i desviació estàndard (D) i es defineix l'interval així: (M-n*D, M+n*D). Finalment, l'interval és dividit en tantes parts com categories s'hagi demanat. Si s'indica n=0, es pren tot el rang en cada variable. (NClusterInicialDiagonal)
Aleatòriament en tot l'espai multivariant. Aquest criteri és poc útil quan el nombre de variables és molt elevat. (NClusterInicialAleatori)
A partir d'un mostreig sobre la imatge, de nombre/resolució configurable. (NClusterInicialMostreig)
A partir d'un cert nombre de signatures espectrals proporcionades en un fitxer llista (/FITXER_SIGNATURES=). Les adreces dels fitxers de signatures poden ser relatives al fitxer llista.

Es poden demanar entre 0 i 32767 categories de cada criteri, però la suma de totes les categories inicials seguint tots els criteris no pot excedir 32767. Si es produeix desbordament degut a un mostreig excessiu, l'aplicació reduirà la densitat de mostreig; en qualsevol cas, en el criteri 3 la densitat de mostreig és adaptada per l'aplicació a un múltiple del costat de píxel. Alhora, és obligatori que la suma del nombre de categories per tots els criteris sigui si més no 1.

En imatges grans s'aconsella utilitzar un nombre de, per ex., 250 categories del criteri 1 i de nbandes*50 del criteri 2, tot i que el criteri 2 es pot deixar a zero si s'indica una certa densitat de mostreig sistemàtic, que sol funcionar millor. Quan el nombre de variables (bandes) proporcionat és molt gran, el criteri 2 resulta pràcticament mancat d'utilitat. Una altra estratègia que sol donar bons resultats és demanar 0 o poques categories en el criteri 1, 0 en el criteri 2, i un mostreig que impliqui obtenir entre 250 i 500 categories ("N300", per exemple, ampliat si gran part de la imatge conté sensedades [per exemple, mar]). En qualsevol cas, un nombre molt elevat de categories sol donar bons resultats però sol implicar una primera iteració molt lenta.
Cal notar que augmentant el paràmetre "Mínima similitud entre classes" es pot obtenir una fusió de les classes més properes en successives iteracions. Aquest paràmetre, però, només està implementat en les classes que provinguin del criteri NClusterInicialMostreig.

Totes aquestes categories formaran els clústers inicials. Per a cadascun dels píxels multivariables, es mesura la distància a cada un dels centres de clúster i s'assigna el píxel al clúster més proper. L'aplicació ofereix la possibilitat de calcular la distància amb els següents criteris:

Distància euclidiana
Distància de l'Eixample (o de Manhattan)

Una vegada s'han assignat tots els píxels de la imatge es recalculen els centres de clúster, tot establint el seu centre de gravetat en l'espai multidimensional format per les diferents variables (bandes) utilitzades. D'una forma iterativa es torna a repetir el procés d'assignació dels píxels als centres de clúster, i es torna a calcular els centres de clúster. Aquesta iteració es duu a terme un cert nombre de vegades que la persona usuària estableix, llevat que el procés s'aturi abans en arribar a una situació de molt poc canvi dels centres de clúster entre iteracions (llindar de convergència). Després de cada iteració es mira si algun dels clústers està compost per un nombre de píxels més petit que un mínim donat per la persona usuària; si és així, el clúster és eliminat, i els seus píxels són reassignats al clúster més proper.

En cada iteració també s'analitza si existeixen classes que es consideri que tenen una distància estadística massa propera per a ser considerades diferents i, en aquest cas, es tracten com una de sola.

La imatge de sortida manté en valor 0 els píxels amb sensedades en totes les bandes originals, o en un nombre de bandes més gran o igual a MaxBandesNODATA, i els documenta com a tals. Si el nombre de categories finals és superior a 255, la imatge de sortida és integer, mentre que serà byte en cas contrari. En qualsevol dels dos casos la imatge de sortida està comprimida amb l'algorisme RLE. El classificador pot treballar amb imatges de qualsevol tipus (byte, integer, real, etc), comprimides o no.

Les característiques estadístiques (signatures) de cada categoria obtinguda s'emmagatzemen en un directori de nom SGN_aaaammdd_hhmmss (signatures obtingudes l'any-mes-dia a l'hora-minut-segon). Aquest directori es crea en el mateix directori que la imatge classificada.

Es permet classificar els píxels encara que presentin sensedades en algunes variables (bandes). Això es governa amb el paràmetre MaxBandesNODATA, que indica el nombre de variables amb valors sensedades que es tolerarà abans de marcar el píxel com a no classificat. Aquest valor pot oscil·lar entre 0 i n_bandes-1:

0: Valor equivalent al que es feia en les versions anteriors a la 4.5: només que una variable sigui sensedades el píxel es considera no classificat. Genera imatges amb més píxels sense classificar.
n_bandes-1: Aquesta és la situació més tolerant, i un píxel es classifica només que tingui una variable diferent a sensedades. Es pot escriure MAX en aquest paràmetre i l'aplicació calcularà directament "n_bandes-1".

Amb independència del valor de MaxBandesNODATA, les classes (i les signatures) es defineixen en funció de tots els píxels. En els individus incomplets (els píxels que no presenten informació a totes les bandes) la classificació només té en compte les bandes en què hi ha dades i les classes es recalculen en funció de totes les dades disponibles en cada banda.

Per tal d'interpretar els valors de distància que utilitza aquest classificador, es recomana llegir l'apartat "Orientació sobre el significat de les distàncies emprades en els processos de classificació" en l'ajuda de l'aplicació ClasSup.

Per defecte aquesta aplicació carrega totes les imatges en memòria, el que li permet realitzar els processos de manera més àgil. Tanmateix, en ordinadors amb pocs recursos respecte de la grandària de les imatges aquesta estratègia pot no ser viable. És per això que l'opció "No carregar les imatges a classificar en memòria" permet indicar a l'aplicació que en els processos mantingui en memòria només aquelles dades que necessita en cada moment, ni que això impliqui un alentiment de l'execució. L'aplicació commuta automàticament a aquest mode si no té prou memòria disponible, per la qual cosa habitualment no cal activar-lo expressament.

Aquesta aplicació està paral·lelitzat, tant en les versions de 32 com de 64 bits, amb la qual cosa és possible que distribueixi la feina entre els nuclis de processador disponibles en l'ordinador on s'executa. Si, per exemple, es disposa d'un ordinador amb dos processadors de 20 nuclis cadascun, es pot arribar a dividir gairebé entre 40 el temps necessari per a obtenir els resultats, utilitzant tots els nuclis disponibles, cosa que es pot fer amb el paràmetre corresponent en un valor indicat per "MAX"; quan s'indica que el nombre de nuclis a emprar és MAX, l'aplicació utilitza tots els nuclis. Tanmateix, de vegades es pot preferir no comprometre tota la capacitat de càlcul de l'ordinador i indicar SUB_MAX (deixarà un processador lliure per a altres tasques que s'estiguin fent) o indicar un valor numèric inferior, en tots els casos a través de l'opció "Nombre de nuclis de processador a utilitzar". Demanar més nuclis que els realment disponibles és possible, creant-ne de virtuals, però això no accelera el processat, sinó el contrari. L'Administrador de tasques del Windows permet conèixer de quin nombre total de nuclis disposa l'ordinador, i també pot saber-se executant l'aplicació en mode MAX, ja que indicarà per pantalla quants nuclis està utilitzant. A les versions més recents de la interfície de l'aplicació, un botó d'informació també permet obtenir aquesta dada.

Sintaxi:

IsoMM NumBandes Llista FitxerClass NClusterInicialDiagonal NClusterInicialAleatori NClusterInicialMostreig LlindarConvergencia MaxIter MinCluster [MinSimil] [NODATA] [NDesvStd] [TDist] [MaxBandesNODATA] Resultat [/FITXER_SIGNATURES] [/N_PROCES] [/DISC]

Paràmetres:

NumBandes (Nombre de bandes - Paràmetre d'entrada): Nombre de bandes de la imatge a utilitzar (màxim 250).
Llista (Paràmetre d'entrada): Fitxer de text on hi ha els noms de les diferents bandes (amb ruta o path [pot ser relativa] si no estan al mateix directori; amb extensió o s'assumirà .img).
FitxerClass (Fitxer resultat - Paràmetre d'entrada): Fitxer resultat de la classificació.
NClusterInicialDiagonal (Nombre de centres de clúster inicial a la diagonal - Paràmetre d'entrada): Nombre de centres de clúster inicial a la diagonal multivariant que seran utilitzats en la classificació.
NClusterInicialAleatori (Nombre de centres de clúster inicial aleatori - Paràmetre d'entrada): Nombre de centres de clúster inicial aleatòriament repartits en l'espai multivariant, que seran utilitzats en la classificació.
NClusterInicialMostreig (Nombre de centres de clúster inicial mostreig - Paràmetre d'entrada): Distància mínima, en unitats terreny, entre les mostres que s'usaran com a centres de clúster inicials (per exemple "D1000.5"), o nombre d'aquestes mostres (p. ex. "N300"). Cal indicar "D0" o "N0" si no es vol fer ús d'aquest criteri..
LlindarConvergencia (Llindar de convergència - Paràmetre d'entrada): Quan el % de píxels que canvien de clúster entre dues iteracions queda per sota d'aquest llindar de convergència, el procés finalitza.
MaxIter (Màxim iteracions - Paràmetre d'entrada): Nombre d'iteracions que realitzarà l'aplicació si no s'assoleix abans el llindar de convergència.
MinCluster (Mínim clúster - Paràmetre d'entrada): Mínim nombre de píxels que han de formar un clúster.
MinSimil (Mínima similitud - Paràmetre d'entrada): Mínima similitud entre classes (per banda, >=0, nombre real). Nota: només està implementat en les classes que provinguin del criteri 3 (NClusterInicialMostreig).
NODATA (Sensedades - Paràmetre d'entrada): Valor de fons a ignorar:
- 0 en general (usa sensedades, si està definit).
- 1 si existeix un valor de fons 0, però no està correctament documentat com a sensedades.
NDesvStd (Nombre desviacions estàndard - Paràmetre d'entrada): Nombre de desviacions estàndard que se sumaran i restaran al valor mitjà per a calcular on es disposaran els centres de classe inicials en la diagonal multivariant; si es proporciona un valor zero s'agafarà el rang de valors de tota la imatge.
TDist (Tipus de distància - Paràmetre d'entrada):
- 1 (Euclidiana)
- 2 (Eixample)
MaxBandesNODATA (Màxim nombre de bandes sensedades - Paràmetre d'entrada): Màxim nombre de bandes amb sensedades: 0,1,2,... MAX.
Resultat (Paràmetre de sortida): Nom de la imatge de sortida (sense extensió).

Modificadors:

FITXER_SIGNATURES

N_PROCES

DISC