La autocorrelación espacial

 

 

La autocorrelación espacial puede definirse de varias maneras. Upton y Fingleton[1] la definen como la “propiedad de un conjunto de datos situados en un mapa geográfico que muestran un patrón de organización”.

 

Sin embargo, esta definición no está exenta de una cierta subjetividad, ya que la expresión “patrón de organización” puede recibir diversas interpretaciones. Los propios autores tratan de acotar el concepto a través de las siguientes aproximaciones al concepto: “la variación espacial sistemática de los valores leídos a lo largo de un mapa”, o “patrones en los valores registrados en diferentes localizaciones”. Si valores relativamente altos (bajos) de la magnitud elegida en una determinada localización vienen acompañados de valores relativamente altos (bajos) de la misma magnitud en las localizaciones vecinas, puede hablarse de la existencia de autocorrelación positiva. Si, por el contrario, valores relativamente altos (bajos) van alternándose geográficamente con valores relativamente bajos (altos) de la misma magnitud en localizaciones adyacentes, la autocorrelación será negativa[2].

 

Ante la mencionada dificultad de concreción del concepto de autocorrelación espacial, Upton y Fingleton definen con exactitud la ausencia de autocorrelación, de la siguiente manera: “ausencia de toda conexión entre las variables (xi, xj) entre cualquier par de regiones (i,j) en el área de estudio”. En otras palabras, la ausencia de autocorrelación espacial se daría en un conjunto de datos cuya localización geográfica no fuera significativamente distinta de una localización resultante de una asignación aleatoria para cada lugar i posible del mapa.

 

Cliff y Ord[3] se refieren a la autocorrelación espacial como la característica según la cual la presencia de una determinada cantidad o calidad de la variable estudiada en un determinada zona o región haga más o menos probable su presencia en las zonas o regiones vecinas[4]. Sokal y Oden[5] afirman que los test de autocorrelación espacial verifican si el valor observado de una variable en una localización determinada es independiente de los valores de esta variable en las localizaciones vecinas. Refleja, en último término, la primera ley de la geografía de Tobler[6]: “todo está relacionado con todo, pero las cosas próximas están más relacionadas que las distantes”[7].

 

Por lo tanto, la autocorrelación espacial tiene que ver tanto con la localización geográfica como con los valores hallados de la variable[8] que se esté estudiando. Para determinar si el patrón de distribución espacial dista del meramente aleatorio, debe utilizarse un índice de comparación[9].

 

Todos los índices dedicados a la medida de la autocorrelación espacial poseen una raíz común: la “matriz de producto cruzado”, o “estadístico general de producto cruzado”[10].

 

 

Donde la matriz Wij recibe el nombre de matriz de conexión, de contigüidad o de peso espacial. Sus valores representan una forma de medición de la contigüidad en los datos originales. La matriz Cij, por su parte, es una medida de la proximidad de los valores i, j, en otra dimensión (por ejemplo, distancia euclídea, distancia esférica, distancia de Manhattan, etc.).

 

La matriz Wij se compone de ceros y unos, según se considere la existencia de contigüidad, o no, entre localizaciones geográficas. Tras la presentación de los 3 criterios principalmente utilizados por los geógrafos, incluidos en el software informático de análisis geográfico más extendido[11], introduciré el que va a ser utilizado en este estudio debido a las diferencias en la obtención de datos respecto del análisis geográfico habitual.

 

En general, los datos geográficos se presentan en un mapa continuo, como en el siguiente ejemplo de tan sólo nueve localizaciones próximas:

 

a

b

c

d

e

f

g

h

i

 

La contigüidad respecto de la localización central puede entonces definirse de tres maneras principales:

 

Rooks                                                 Bishops                                        Queen’s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

En el caso de Rooks, el más utilizado, se consideran adyacentes a la localización “e” las b, d, f, h; la contigüidad de Bishops, por el contrario, analiza las relaciones de proximidad en relación diagonal, y consideraría vecinas a la localización “e” las a, c, g, i; el criterio de Queen’s combina los dos anteriores.

 

Las matrices Wij de contigüidad quedarían de la siguiente manera, en función del criterio de vecindad elegido:

 

En la matriz de contigüidad-Rooks, por ejemplo, corresponde un “1” en las casillas de intersección de la celda “e” con las b, d, f , h, y un “0” ” en las casillas de intersección de la celda “e” con el resto. La celda “a” es considerada contigua a las celdas b y d, por lo que asignaríamos sendos “1” en los citados puntos de intersección, y ceros en las casillas correspondientes a la relación de la localización “a” con las restantes. Por convención, una localización no se considera adyacente a sí misma. Sólo se estudian sus posibles relaciones con las localizaciones vecinas. Procediendo según lo descrito, pueden construirse las siguientes 3 matrices posibles de peso espacial:


 

 

a

b

c

d

e

f

g

h

i

a

0

1

0

1

0

0

0

0

0

b

1

0

1

0

1

0

0

0

0

c

0

1

0

0

0

1

0

0

0

d

1

0

0

0

1

0

1

0

0

e

0

1

0

1

0

1

0

1

0

f

0

0

1

0

1

0

0

0

1

g

0

0

0

1

0

0

0

1

0

h

0

0

0

0

1

0

1

0

1

i

0

0

0

0

0

1

0

1

0

Matriz de contigüidad-Rooks                                       

 

 

a

b

c

d

e

f

g

h

i

a

0

0

0

0

1

0

0

0

0

b

0

0

0

1

0

1

0

0

0

c

0

0

0

0

1

0

0

0

0

d

0

1

0

0

0

0

0

1

0

e

1

0

1

0

0

0

1

0

1

f

0

1

0

0

0

0

0

1

0

g

0

0

0

0

1

0

0

0

0

h

0

0

0

1

0

1

0

0

0

i

0

0

0

0

1

0

0

0

0

Matriz de contigüidad-Bishops

 

 

 

a

b

c

d

e

f

g

h

i

a

0

1

0

1

1

0

0

0

0

b

1

0

1

1

1

1

0

0

0

c

0

1

0

0

1

1

0

0

0

d

1

1

0

0

1

0

1

1

0

e

1

1

1

1

0

1

1

1

1

f

0

1

1

0

1

0

0

1

1

g

0

0

0

1

1

0

0

1

0

h

0

0

0

1

1

1

1

0

1

i

0

0

0

0

1

1

0

1

0

Matriz de contigüidad-Queen’s

 

 

Este enfoque geográfico relativo a datos continuos presenta una limitación importante para el análisis de este trabajo: como ha sido explicado, el número de localizaciones vecinas queda limitado a 4 (criterios de contigüidad de Rooks y Bishops) o a 8 (criterio de Queen’s). En el caso del presente análisis, va a otorgarse el valor 1 correspondiente a vecindad si existe una frontera común entre las regiones analizadas, y valor cero, si no existe ningún tramo fronterizo común. No se puede sistematizar a 4 o a 8 el número de regiones vecinas a cada región dada, por lo que no puede utilizarse directamente el mencionado software informático diseñado por los geógrafos. Los cálculos preliminares se desarrollaran entonces en la hoja de cálculo Microsoft Excel y a través del programa SpaceStat 1.90[12], según la descripción que se detalla en los próximos párrafos.

 

El índice utilizado es una adaptación del I de Moran[13], la primera medida de la autocorrelación espacial en el estudio de fenómenos estocásticos distribuidos en un espacio de dos o más dimensiones. Para cada año t, este estadístico se escribe:

 

 

 

Donde Wij es la matriz binaria de contigüidad, tal que wij=1 si las regiones i y j tienen una frontera común, y wij=0 si no disponen de ella[14]; xit es el logaritmo neperiano del PIB per cápita medido en términos reales de la región i en el año t ; es la media, para el año t, de los logaritmos neperianos del PIB per cápita, medido en términos reales, del conjunto de las regiones estudiadas; y n es el número de regiones.

 

Este índice resulta análogo al coeficiente de correlación convencional, ya que su numerador se interpreta como la covarianza entre unidades contiguas[15], y sus valores oscilan entre +1 (significando fuerte correlación espacial positiva) y  –1 (significando fuerte correlación espacial negativa).

 

La significatividad estadística del índice I de Moran puede ser obtenida a través de dos procedimientos: en primer lugar, mediante un proceso de contraste cuya hipótesis nula propone que los datos analizados no son sino una muestra aleatoriamente obtenida a partir de una de las n! posibles distribuciones espaciales de las variables estudiadas entre las n localizaciones. Y, en segundo lugar, a partir de la utilización de estadísticos diseñados para la autocorrelación espacial basados en la aproximación normal[16].

 

Griffith demuestra que el valor esperado del I de Moran es , valor que tiende a cero conforme aumenta n, el número de regiones analizadas; la varianza del I de Moran viene dada, a su vez, por la siguiente expresión:

 

donde:

n = número de observaciones

 

    suma de la matriz de peso espacial

 

  

si la matriz de peso espacial es simétrica, entonces

suma de (la columna i + la fila i)2 de la matriz de peso espacial.

 

si la matriz de peso espacial es simétrica, entonces 

 

La desviación típica y los valores z correspondientes a una distribución normal N(0,1) vienen dados por:

 

 

 


 


[1] Upton, G.J. y B. Fingleton,  Spatial data analysis by example, volume 1: Point pattern and quantitative data, (Toronto: Wiley), 1985.

 

[2] Como en un tablero de ajedrez: cuadros blancos rodeados de cuadros negros.

 

[3] Cliff, A.D. y J.K. Ord, Spatial Autocorrelation (Londres: Pion), 1973.

 

[4] La autocorrelación sería positiva si existe mayor probabilidad de presencia en términos similares en las regiones adyacentes, y, negativa, en caso contrario. Si la probabilidad de presencia en un determinado lugar de la variable estudiada no varía por el hecho de darse su presencia en las regiones vecinas, estaríamos ante el caso de ausencia de autocorrelación espacial.

 

[5] Sokal, R.R. y N.L. Oden, “Spatial autocorrelation in biology 1. Methodology”, Biological Journal of the Linnean Society, 1978, pp. 10-199.

 

[6] Tobler, W., “Cellular geography”, en Gale, S. y G. Olsson (eds.): Philosophy in Geography, (Dordrecht: Reidel), 1979, pp. 379-386.

 

[7] “Everything is related to everything else, but closer things more so. ”

 

[8] Moran inició los estudios de autocorrelación espacial referidos a la fertilidad del suelo y a la velocidad en puntos diferentes en un fluido en turbulencia.

 

Moran, P.A.P., “Notes on continuous stochastic phenomena”, Biometrika, 1950, pp.37-77.

 

[9] Griffith, D.A., Spatial Autocorrelation: A primer, NY: Association of American Geographers, 1987.

 

[10] Hubert, L.J., R.G. Golledge y C.M. Constanzo, “Generalized procedures for evaluating spatial autocorrelation”, Geographical Analysis, 1981, pp. 13-225.

 

Upton, G.J. y B. Fingleton, Spatial data analysis by example, volume 1: Point pattern and quantitative data. Toronto: Wiley, 1985.

 

[11] Arcview 3.0 for Windows.

Rooks Case v0.9, plug-in para Microsoft Excel para Windows.

[12] http://www.spacestat.com

 

[13] Moran, P.A.P., “Notes on continuous stochastic phenomena”, Biometrika, 1950, pp. 37-77.

[14] Por convención, no se considera a las regiones adyacentes a sí mismas, por lo que la diagonal de la matriz estará compuesta de ceros.

 

[15] Sokal, R.R. y N.L. Oden, “ Spatial autocorrelation in biology 1. Methodology”, Biological Journal of the Linnean Society, 1978, pp. 10-199.

 

[16] Griffith, op. cit., 1987, Appendix E.

 

 

Este texto forma parte de la tesis doctoral "El factor espacial en la convergencia de las regiones de la Unión Europea", de Mª Amparo Toral Arto, cuyos datos y texto completo son accesibles desde la
FICHA DE LA TESIS

 

Google


En la web
En eumed.net