Presentació i opcions Caixa de diàleg de l'aplicació
Sintaxi

Presentació i opcions

Aquesta aplicació permet generar un model explicatiu i predictiu d'una variable espacial dicotòmica Y en funció de n variables espacials independents Xn quantitatives.

La variable dependent Y sempre serà dicotòmica i, per tant, els valors numèrics que prendrà seran 1 o 0 (presència/absència, si/no, èxit/fracàs...). El propòsit de l'anàlisi és predir la probabilitat que la variable Y prengui valor 1 en funció dels valors de les variables explicatives, P(Y=1|X), i avaluar la relació o efecte d'aquestes sobre la variable dependent.

L'anàlisi està fonamentada en el model de regressió logística binària multivariant el qual assumeix que la probabilitat que la variable Y prengui valor 1 segueix la distribució logística i, per tant, el seu valor pot ser estimat segons la fórmula següent, anomenada funció logística:

on:


són les variables independents,

és la constant del model o terme independent,

són els coeficients de les variables independents.

Aquesta funció és contínua i pren valors en el rang [0,1].

El vector de coeficients s'estima mitjançant el mètode de màxima versemblança, és a dir, els coeficients són ajustats de manera que es maximitza la funció de versemblança.

Donat que una variable dependent dicotòmica segueix una distribució binomial, la funció de versemblança per a una mostra aleatòria de N observacions s'expressa per:

on:


és el valor observat (1 o 0) de la variable dependent per la mostra i
és el valor predit de la variable dependent per la mostra i, .

Els coeficients que maximitzin L(B) també maximitzaran la seva transformació logarítmica. Per maximitzar el logaritme de la funció de versemblança cal trobar la solució del següent sistema d'equacions no lineals:

on:
és el valor observat de la variable independent per a la mostra i.

En l'aplicació s'ha implementat l'algoritme iteratiu de Newton-Raphson per resoldre'l.

Així doncs, per determinar els coeficients de la regressió és necessari proporcionar un conjunt de mostres on és coneguda tant la variable dependent (1 o 0) en localitzacions concretes (puntuals) com el conjunt de les possibles variables independents. Aquestes mostres es proporcionaran o bé en un fitxer de punts estructurat PNT o en una taula en format DBF o bé en una taula en qualsevol altre format accessibles mitjançant un driver ODBC (Open DataBase Connectivity). Les variables independents caldrà que siguin proporcionades com a ràsters en format IMG del mateix àmbit geogràfic i costat de píxel. El resultat predictiu serà també un ràster en format IMG.

El procediment de regressió és, de fet, un procés iteratiu d'ajust de totes les regressions possibles: des de la regressió amb totes les variables independents inicialment introduïdes fins a les regressions amb una única variable independent. Analitzant els paràmetres estadístics de cada regressió i en funció del criteri escollit (menor coeficient AIC, menor estadístic Deviance o millor coeficient R2 de Naglekerke, s'obté la que es considera millor regressió de totes.

Per a més informació del model de regressió logística, del mètode de màxima versemblança i de l'algoritme iteratiu Newton-Raphson es pot consultar la següent referència:

Czepiel, S.A. (2002) Maximum Likelihood Estimation of Logistic Regression Models: Theory and Implementation https://czep.net/stat/mlelr.pdf.


Caixa de diàleg de l'aplicació


Caixa de diàleg del RegLog


Sintaxi

Sintaxi:

Paràmetres:

Modificadors: