Geoestadística

Esta página presenta los principales conceptos para la comprensión de la manipulación del módulo de geoestadística de SPRING. Los tópicos presentados aquí son:


Las definiciones y convenciones aquí adoptadas siguen los padrones de la geoestadística, es decir, funciones y las variables aleatorias son denotadas con caracteres maiyúsculos (ejemplo: Z(x) y Z), los valores observados son representados por caracteres minúsculos (ejemplo: valor de la variable aleatoría Z medido en la posición xk es z(xk) ) y los vectores son realzados en negrita (ejemplo: {z(xi), i = 1, ..., n}, donde xi identifica una posición en dos dimensiones representada por los pares de coordenadas (xi , yi) ).


Vea como ejecutar:

Secuencia de Procedimientos en SPRING

Consulte también:
Análisis Espacial en SPRING
Modelaje Numérica del Terreno
Edición vectorial



VARIABLES REGIONALIZADAS

La variabilidad espacial de algunas características del suelo viene siendo una de las preocupaciones de investigadores practicamente desde inicio de siglo. Smith (1910) estudio la disposición de parcelas en el campo de experimentos de rendimiento de variedades de maiz, en una tentativa de eliminar el efecto de variaciones del suelo. Montgomery (1913), preocupado con el efecto del nitrógeno en el rendimiento del trigo, hizo un experimento en 224 parcelas, midiendo el rendimiento de granos. Varios otros autores, como Waynick y Sharp (1919), también estudiaron variaciones de nitrogeno y carbono en el suelo.

Los procedimientos usados en la época se basaban en la estadística clásica y utilizavan grandes cantidades de datos de mostra, pretendiendo caracterizar la descripción de la distribución espacial de la característica en estudio. Por estadística clásica se entiende aquella que se utiliza de parámetros como média y desvio padrón para representar un fenómeno y se basa en la hipótesis principal de que las variaciones de un local para otro son aleatorias.

Krige (1951), trabajando con datos de concentración de oro, concluyó que solamente la información dada por la varianza sería insuficiente para explicar el fenómeno en estudio. Para tal, sería necesario llevar en consideración la distancia entre las observaciones. A partir de ahí surge el concepto de la geoestadística, que lleva en consideración la localización geográfica y la dependencia espacial.

Matheron (1963, 1971), basado en las observaciones de Krige, desenvolvio la teoría de las variables regionalizadas, a partir de los fundamentos de la geoestadística.

Segundo Blais y Carlier (1968), citados por Olea (1975), una variable regionalizada es una función numérica con distribución espacial, que varía de un punto a otro con continuidad aparente, pero cuyas variaciones no pueden ser representadas por una función matemática simple.

La teoría de las variables regionalizadas presupone que la variación de una variable puede ser expresada por la suma de tres componentes (Burrough, 1987): a) una componente estrutural, asociada a un valor médio constante o a una tendencia constante; b) una componente aleatoría, espacialmente correlacionada; y c) un ruído aleatório o error residual.

Si x representa una posición en una, dos o tres dimensiones, entonces el valor de la variable Z, en x, es dada por (Burrough, 1987):

Z(x) = m(x) + e ¢ (x) + e ² (2.1)

donde:

Si x representa una posición en una, dos o tres dimensiones, entonces el valor de la variable Z, en x, es dada por (Burrough, 1987):

Z(x) = m(x) + e ¢ (x) + e ² (1)

donde:

La Figura inferior ilustra las tres componentes principales de la variación espacial. La parte (a) presenta una componente determinística que varía abruptamente, mientras la componente determinística en la parte (b) presenta una tendencia constante.



Figs. (a) y (b) - Principales componentes de la variación espacial.
FUENTE: Modificada de Burrough (1987), p. 155.


HIPÓTESIS CONSIDERADAS

Diferente de los métodos convencionales de estimación, KRIGING está fundamentado en la teoría de las variables regionalizadas. El primer paso en KRIGING es definir una función apropriada para la componente determinística m(x). Para esto, algunas hipóteses son necesárías (Burrough, 1987 y David, 1977):

Sob esta hipótesis, se admite que la componente determinística, m(x), es constante (no tiene tendencias en la región). Entonces, m(x) es igual al valor esperado de la variable aleatoría Z en la posición x, y la diferencia media entre los valores observados en, x y x+h, separados por un vector de distancia h (módulo y dirección) es nula.

E[Z(x) - Z(x+h)] = 0 el E[Z(x)] = E[Z(x+h)] = m(x) = m (2)

donde

y representa el operador esperanza matemática.

También se admite que la covarianza entre los pares Z(x) y Z(x+h),

separados por un vector distancia h, existe y depende solamente de h. Entonces:

C(h) = Cov [Z(x), Z(x+h)] =

= E[(Z(x)-m).(Z(x+h)- m)] = E[Z(x).Z(x+h)]-m2, " x; (3)

donde

Cov [Z(x), Z(x+h)] es la covarianza entre Z(x) y Z(x+h).

En la Ecuación (3), estacionariedad de la covarianza implica la estacionariedad de la varianza:

Var[Z(x)] = E{[Z(x)- m]2} = E[Z2(x)] - 2.E[Z(x)].m + m2 =

= E[Z(x).Z(x+0)] - 2m2 + m2 =

= E[Z(x).Z(x+0)] - m2 = C(0), " x. (4)

donde

Var es el operador varianza.

La estacionariedad de la covarianza también afecta la estacionariedad del

variograma , definido por:

2g (h) = E{[Z(x)-Z(x+h)]2} (5)

La Ecuación (5) puede ser desarrollada como:

2g (h) = E{Z2(x) - 2 Z(x)Z(x+h) + Z2(x+h)}

= E[Z2(x)] - 2E[Z(x)Z(x+h)] + E[Z2(x+h)] (6)

De la Ecuación (3) se obtiene:

E[Z(x)Z(x+h)] = C(h) + m2 (7)

De manera análoga, de la Ecuación (4) se obtiene:

E[Z(x).Z(x+0)] = E[Z2(x)] = C(0) + m2 (8)

Substituyendo las equaciones (7) y (8) en la Ecuación (6), se obtiene:

2g (h) = C(0) + m2 - 2 (C(h) + m2) + C(0) + m2 =

= 2 C(0) - 2 C(h) (9)

Simplificando la Ecuación (9), se obtiene:

g (h) = C(0) - C(h) (10)

donde:

g (h) representa una función conecida en la teoría de las variables regionalizadas como semivariograma, que es mitad del variograma. Vea discusión sobre variograma.

La relación en (10) indica que sobre la hipótesis de estacionariedad de 2a orden, la covarianza y el semivariograma son formas alternativas de caracterizar la autocorrelación de los pares Z(x) y Z(x+h) separados por el vector h.

La hipótesis de estacionariedad de 2a orden supone la existencia de una covarianza y, entonces, de una varianza finita (Ecuación 4). Sobre esta condición, el correlograma, r (h), puede ser definido. Dividiendo a ambos lados de la Ecuación (10) por C(0), se tiene:

r (h) = = 1- (11)

Las restriciones impuestas a la estacionariedad de 2a Orden, es decir, admitida $ C(h) Þ $ Var[Z(x)] = C(0) y también Þ $ g (h), pueden no ser satisfechas para algunos fenómenos físicos que presentan una capacidad infinita de dispersión (David, 1977). Capacidad infinita de dispersión Þ C(h), Var[Z(x)]; aunque, puede existir g (h). Para tales situaciones, una hipótesis menos restrictiva, la hipótesis intrínseca, puede ser aplicable.

De modo análogo la hipótesis anterior, se admite que E[Z(x)] = m(x) = m,

" x. Además de eso, se admite que la varianza de las diferencias depende solamente

del vector distancia h, es decir:

Var[Z(x) - Z(x+h)] = E{[Z(x)-Z(x+h)]2} = 2g (h) , (12)

donde

2g (h) es tal y como presentado anteriormente.

Según David (1977), esta hipótesis es la más frecuente en geoestadística, principalmente por ser la menos restrictiva. Es decir, requiere apenas la existencia y estacionariedad del variograma, sin ninguna restricción respecto a la existencia de varianza finita.

Uma consideración adicional, que transcende el alcance de este trabajo, se refiere a las hipótesis de KRIGING Universal (David, 1977). En este caso, m(x) es el "drift" (tendencia principal) y se supone que C(h) y g (h) poseen estacionariedad dentro de una vecindad de tamaño restricto. Además de eso, se supone que E[Z(x)] = m(x), la qual no es más estacionaria, varía de modo regular dentro de tal vecindad. Según David (1977), no solamente la covarianza y el variograma son definidos a partir de valores experimentales, sinó también el tamaño de la vecindad donde las hipóteses se mantienen válidas. Trabajos en este asunto pueden ser encontrados en Olea (1975, 1977) y un ejemplo de aplicación puede ser visto en Burges y Webster (1980c).

En este trabajo se presupone la estacionariedad de 2a orden (Þ hipótesis intrínseca), la cual es suficiente para la utilización de los métodos de estimación de KRIGING simple (KS) y KRIGING ordinaria (KO), que son descritos.

CARACTERÍSTICAS DE LAS VARIABLES REGIONALIZADAS

Según Olea (1975, 1977), las principales características de una variable regionalizada son:

TABLA - PORCENTAJE DE H2O EN DOS MOSTRAS DISTINTAS A y B.

A

5

10

15

20

25

20

15

10

5

% H2O

B

10

25

15

10

20

5

15

5

20

% H2O

En esta tabla, los valores individuales en las dos muestras son exactamente los mismos. Por tanto la media y la varianza muestral, así como el histograma de frecuencia de la variable observada en las muestras A y B, son rigorosamente idénticos. Cualquier análisis que no lleve en consideración otras estadísticas además de la media, varianza y histograma no diferenciará las dos séries. Este ejemplo enfatiza la importancia de la medida de la continuidad espacial de la variable regionalizada. Así, se vuelve necesário considerar la posición espacial relativa de cada una de las observaciones en las dos muestras, para que las mismas sean diferenciadas. La continuidad espacial de la variable regionalizada puede ser analizada a partir del variograma, tal y como se describe a continuación.



Consulte también:
Variograma
KRIGING