El análisis de datos espaciales consiste en observar datos disponibles en el espacio y intentar, de alguna forma, através de métodos y modelado, describir y explicar el comportamiento del proceso espacial y sus relaciones con algún otro fenómeno espacial.
En el caso de análisis de "Patrones Puntuales" los datos son puntos relacionados a algún evento. Por ejemplo, ocurrencia de dolencias, centros de cráteres volcánicos células biológicas.
En análisis de Patrones de puntos, solamente la localización de los puntos es considerada, al contrario de la geoestadística, donde los atributos relacionados a la muestra, punto, son importantes.
En el área de ecología, suponga que se quiera analizar a distribución espacial de plantas dentro de pequeñas áreas( figura abajo).
El dato muestra la localización de 62 simientes germinadas, distribuidas en una
región de 23m2. Del punto de vista ecológico, esperase alguna evidencia
de agrupamientos en torno de simientes de una misma especie.
Imagine que epidemiologistas recolecten datos de ocurrencia de una dolencia. Analizando y visualizando los datos, se verifica que son mas densos cerca de un pozo que abastece aquella región. Esa evidencia de agrupamiento puede indicar que el pozo está contaminado?
El objetivo básico da análisis de Patrones Puntuales es verificar si los eventos observados en una dada región de estudio muestran comportamiento sistemático, como por ejemplo, agrupamiento, regularidad o aleatoriedad.
Cualquier análisis espacial de datos envuelve un conjunto de métodos de análisis que pueden ser divididos entre, métodos que están relacionados a la visualización de los datos, métodos llamados exploratorios y aquellos centralizados en la especificación del modelo estadístico y la estimativa de parámetros.
El SPRING muestra, en esta versión, dos procedimientos para el análisis de Patrones Puntuales univariados , el método da distancia al vecino mas próximo y el de la Función L . Estos dos métodos analizan propiedades de los datos, conocidas como de segunda orden o dependencia espacial. El componente de segunda orden es responsable por los desvíos estocásticos en relación a la media y, al contrario de asumir esos desvíos espacialmente independientes se puede considerar una estructura de covariancia espacial o dependencia espacial en el proceso. esa componente de segunda orden é modelada como un proceso espacial estacionario e isotrópico.
Un proceso espacial { Y(s), s Î R} es estacionario u homogéneo si sus propiedades estadísticas, media y variancia, son constantes en la región R y, por tanto, no dependen de la localización, s. Estacionariedad además de eso sugiere que la matriz de covariancia , entre valores de cualquiera de los lugares si y sj ,depende exclusivamente de la dirección y distancia entre ellos y no de sus valores absolutos. Se además de eso la matriz de covariancia del proceso fuere independiente de la dirección, entonces se tiene un proceso estacionario isotrópico.
En un proceso isotrópico, existe una relación estrecha entre la distribución de las distancias entre eventos y las propiedades de segundo orden.
La distancia al vecino mas próximo es una medida que lleva en consideración propiedades de segundo orden. una manera de verificar el grado de dependencia espacial en un padrón de puntos y observar el comportamiento de laa distribución acumulada de esas distancias.
Vecino mas Próximo – El método del vecino mas próximo considera la estimativa de G(w), como la distribución acumulada da distancia entre cualquier evento escogido aleatoriamente y el evento vecino mas próximo. Para a análisis univariada, la estimativa del vecino mas próximo es reducida a:
Donde:
# = número de
n = es el número de eventos en esta área
wi = distancia medida entre eventos
w = distancia de comparación escogida por el usuario
Los gráficos de los resultados empíricos de G(w) versus "w" pueden ser utilizados como método para inferir si hay alguna evidencia de interacción entre los eventos. Si el gráfico muestra una función con brusca elevación en el inicio, puede sugerir un agrupamiento en la escala considerada. Si la elevación ocurre a intervalos de distancias mayores, mas hacia el final de la curva, se sugiere repulsión en la regularidad entre los eventos
El vecino mas próximo puede ser usado como método formal para comparación estadística da distribución observada de los eventos, como sería esperado bajo la hipótesis de Aleatoriedad Espacial Completa (CSR). Este caso corresponde a la opción de Vecino mas próximo con simulación.
El modelo espacial padrón para Aleatoriedad Espacial Completa es aquel en que los eventos siguen un proceso homogéneo de Poisson en la región de estudio. Esto significa que en el proceso espacial puntual descrito, se considera- Y(Ai) y Y(Aj) variables aleatorias independientes para cualquier elección de Ai y Aj y que la distribución de probabilidad de Y(A) obedece a la distribución de Poisson con media l A, donde A es el área de A y l el número medio de eventos por unidad de área. Además de eso, considerando el número total de eventos en R, eventos son independientes y uniformemente distribuidos en R. Esto significa que cualquier evento tiene la misma probabilidad de ocurrir en cualquier posición y que la posición de cualquier evento es independiente da posición del otro, no hay interacción entre eventos.
Se puede entonces simular 'n' eventos con distribución uniforme dentro da región, y formular la hipótesis para probar si los Patrones observados están agrupados, aleatorios o regulares.
El método consiste en simular "sobres" para la distribución CSR
para evaluar la significación de los datos de salida. La simulación estimada
para G(w) bajo la hipótesis CSR es (w) =
,donde
i (w), i=1,...n
son las funciones distribución estimadas sin corrección de borde. Cada una de
las 'n' funciones estimadas corresponde a una simulación y para cada simulación
son generados 'm' eventos independientes con distribución uniforme. los sobres
superior y inferior son definidos como:
U(w) = max{
(w)} y L(w) = min
{
(w)}
Si los datos son compatibles con CSR el resultado a ser obtenido cuando se
grafica la función simulada (w) versus la función acumulada adquirida a partir de
las observaciones,
(w),
deberá ser una función próxima de una linear a 45 grados. Si existe agrupamiento,
la función observada
(w) deberá estar arriba de la recta de 45 grados y, la presencia de regularidad
(w) quedará
debajo de la recta.
El método del vecino mas próximo se basa en distancias a los eventos mas próximos y, por lo tanto, consideran las escalas menores del padrón. Para obtener informaciones mas efectivas de un padrón espacial incluyendo grandes intervalos de escala, el mejor método es la función K, que será descrita a seguir.
Función L – proporciona una descripción mas efectiva da dependencia espacial en un intervalo mas largo de escalas y está relacionada con propiedades de segundo orden de un proceso isotrópico. Por lo tanto, suponiendo el proceso isotrópico en toda la región, la Función L es definida para un proceso univariado como:
lK(h) = E(# de eventos da distancia h de un evento arbitrário), onde:
# = número de
E( ) = es el operador esperanza
l = es la intensidad o número medio de eventos por unidad de área, en una región asumida como constante.
A Función L puede ser estimada por K(h) =
Para entender esa función imaginase que cada evento es visitado y a su alrededor
se construyen círculos concéntricos espaciados. El número acumulado de
eventos dentro de cada uno de esos círculos es contado. Todos los eventos son visitados y el número
de eventos que caen dentro de una distancia h de todos los eventos es calculado
y pasa a ser a estimativa de la Función L, cuando ponderada por , ignorando efecto de bordea (
).
En el caso de un proceso homogéneo sin dependencia espacial, K(h) = p h2 . Por lo tanto, bajo agrupamiento, espera-se que K(h) >= p h2 y , en el caso de regularidad, K(h) <= p h2 .
A fin de facilitar a interpretación gráfica de la Función L, que es menos
intuitiva que la del vecino mas próximo, se utiliza una fórmula simplificada =
- h . en el gráfico de
contra h, picos
positivos indican atracción espacial o agrupamiento y picos negativos indican
repulsión o regularidad.
El método de la Función L tiene, por lo tanto, ventajas en relación al abordaje del vecino mas próximo. Muestra
información en diversas escalas de Patrones, envuelve el uso de la localización
precisa del evento e incluye todas las distancias evento-evento. Otro motivo
para su uso es que la forma teórica de K(h) es conocida para varios modelos de puntos.
Por lo tanto, , no
es utilizado apenas para explorar la dependencia espacial mas en la sugestión
de modelos que representen esa dependencia y en la estimativa de parámetros del
modelo.
En el caso de laa Función L con simulación , así como en el caso
anterior, son construidos sobres superiores e inferiores para 'm' simulaciones
de 'n' eventos en la región, bajo hipótesis de aleatoriedad espacial completa,
CSR, y las estimativas asociadas de . los sobres son incluidos en el gráfico da Función L
versus h. La significación de los picos y depresiones puede ser considerada con
base en la
Pr(>
U(h)) = Pr (
<
L(h)) =
, que
provee el valor de m a ser usado , o sea,
cuantas simulaciones deben ser hechas para detectar la no aleatoriedad a un nivel
de significación específico. en el ejemplo abajo, se verifica que a suposición
de agrupamiento verificada por la Función L, es confirmada en esta prueba padrón
ya que la curva
,
está situada arriba del sobre superior. los sobres simulados superior y inferior
son calculados pelas fórmulas
Algunos gráficos que son generados por el SPRING y que fueran mencionados en el texto son mostrados e interpretados.
d. Función L con simulación - Gráfico de la función estimada L y sobres versus Distancia: Extremos positivos da función L, arriba de los sobres, indican agregación y extremos negativos, abajo de los sobres, representan regularidad para las respectivas distancias.
Ejecutando el
Análisis Espacial de Puntos:
Consulte también:
Análisis Geográfico en el SPRING