To cite this paper / Pentru a cita lucrarea:
Petrisor AI (2000), GIS, statistica spatiala si testul DAC, Catedra UNESCO-Cousteau de ecologie sistemica si managementul mediului, Facultatea de biologie, Universitatea Bucuresti (cursul "Biostatistica", titular: conf. dr. Liviu Dragomirescu), Bucuresti, Romania, 28 mai 2000


GIS, statistica spatiala si testul DAC

Curs

Mai 2000

Asistent universitar Alexandru I. Petrisor
Master īn sanatate publica, Doctorand īn ecologie

Universitatea din Carolina de Sud

1. Ce este si cum functioneaza GIS?


GIS: abrevierea provine de la "Geographic Information System" (Sistem de informatii geografice), definit ca un pachet de programe pentru a cartografia si analiza obiecte si evenimente de pe Terra. Tehnologia GIS īncorporeaza operatii specifice bazelor de date (cautare sau analiza statistica), precum si analiza geografica si beneficiile reprezentarilor cartografice, constituind un instrument valoros pentru a explica evenimente, a prezice rezultate sau a elabora planuri si strategii de actiune.

GIS integreaza cinci componente-cheie: (1) computerul ("hardware"), (2) programele ("software"), (3) datele, (4) componenta umana si (5) metodele specifice.

GIS integreaza nivele (denumite si "straturi"- layers, īn literatura anglo-saxona) de informatii privind diferite aspecte ale problemei investigate.

2. Statistica spatiala si testul DAC


Statistica spatiala are numeroase aplicatii, dintre care pot fi amintite:
- Identificarea "punctelor fierbinti", numite īn literatura anglo-saxona "clusters" (pe care le vom numi īn continuare clustere.
- In biologia populatiilor, permite studiul raspāndirii spatiale a populatiilor

Testul DAC (Drane-Aldrrich-Creanga) a fost introdus īn literatura de specialitatea prin studiul efectuat de Drane, Creanga, Aldrich si Hudson īn 1995. Scopul introducerii acestui test a fost de a oferi un instrument pentru detectarea clusterelor spatiale. Calculul testului se bazeaza pe distributia de frecvente cumulate, definite astfel:
Fn(x1, x2) = m(x1, x2) / n
unde m(x1, x2) este numarul de elemente ale esantionului de volum n care satisfac conditia:
x1i mai mic decāt x1 si x2j mai mic decāt x2
(x1, x2) ia valorile (0, 0), ..., (max x1, max x2), iar m(x1, x2) acopera intervalul [0, n].
In mod analog, pentru cazuri se defineste Fm(x1, x2).
Testul DAC este:
, pentru toate valorile posibile (x1, x2).

Exemplu:
Setul de date care sta la baza acestui exemplu provine din regiunea Spartanburg, din Carolina de Sud. Datele provin din certificatele de nastere si contin 6434 observatii referitoare la urmatoarele variabile:
- numarul curent (1-6434)
- latitudinea si longitudinea
- greutatea copilului la nastere - īn acest sens, nasterile au fost clasificate ca:
a. normale - peste 2500 g.
b. subponderale - sub 2500 g.

Se poate observa ca zonele cu densitate ridicata a populatiei sau a cazurilor corespund centrului regiunii, mai exact oraselor Spartanburg, Saxon, Valley Falls, Boiling Springs si Pacolet. Evident, simpla suprapunere a unor harti (de altfel, o tehnica foarte comuna utilizatorilor GIS) nu ofera prea multe informatii īn acest caz, mai exact nu se poate sti daca acumularea cazurilor īn regiunea respectiva nu se datoreaza doar faptului ca avem de-a face cu o zona īn care densitatea populatiei este ridicata, si nu unor alte cauze.

In acest moment se poate formula urmatoarea īntrebare: se acumuleaza īn aceste zone mai multe cazuri decāt nasteri normale, sau, altfel spus, avem de-a face cu un cluster de nasteri subponderale? La o prima vedere, distributiile pentru cazuri si pentru īntreaga populatie pot parea identice. In realitate, īntre ele exista diferente, masurate de testul DAC, care indica īn mod evident faptul ca īn zona oraselor Spartanburg, Saxon, Valley Falls, Boiling Springs si Pacolet rata de acumulare a cazurilor este mai mare decāt rata de acumulare a populatiei de baza. Desigur, urmatoarea etapa este descoperirea cazurilor care determina acest fenomen.

In cadrul tezei mele de master, "Distributii spatiale empirice si testul DAC", am studiat dependenta acestui test fata de pozitia originii si orientarea axelor de coordonate, descoperind ca nu este influentat de pozitia originii, dar depinde de orientarea axelor de coordonate.

Bibliografie


1. Aldrich T.E., Krautheim K., Kinee E., Drane J.W., Tibara D. 1997. Statistical Methods for Space-Time Cluster Analysis. Proceedings of the International Symposium on Computer Mapping in Epidemiology and Environmental Health. 226-236
2. Drane J.W., Creanga D.L., Aldrich T.E., Hudson M.B. 1995. Detecting Adverse Health Events via Empirical Spatial Distributions (Abstract). Symposium on Statistical Methods 1995, U.S.D.H.H.S., P.H.S., C.D.C., Atlanta, GA, January 24-26, 1995
3. Petrisor A.-I. 2000. Empirical Spatial Distributions and the DAC Statistic. University of South Carolina
4. **** Environmental Systems Research Institute, Inc. 1998. How GIS Works, publicat pe Internet la adresa: http://www.esri.com/library/gis/abtgis/gis_wrk.html