Esta página presenta los principales conceptos para la comprensión de
la manipulación del módulo de geoestadística de SPRING. Los tópicos
presentados aquí son:
Las definiciones y convenciones aquí adoptadas siguen los padrones de
la geoestadística, es decir, funciones y las variables aleatorias son
denotadas con caracteres maiyúsculos (ejemplo: Z(x) y Z), los
valores observados son representados por caracteres minúsculos (ejemplo:
valor de la variable aleatoría Z medido en la posición xk
es z(xk) ) y los vectores son realzados en negrita
(ejemplo: {z(xi), i = 1, ..., n}, donde xi
identifica una posición en dos dimensiones representada por los pares
de coordenadas (xi , yi) ).
Vea como ejecutar:
Secuencia de Procedimientos en SPRING
Análisis Exploratoría
Análisis Espacial por Semivariograma
Ajuste del Semivariograma
Validación del Modelo
KRIGING
Consulte también:
Análisis Espacial en SPRING
Modelaje Numérica del Terreno
Edición vectorial
La variabilidad espacial de algunas características del suelo viene siendo una de las preocupaciones de investigadores practicamente desde inicio de siglo. Smith (1910) estudio la disposición de parcelas en el campo de experimentos de rendimiento de variedades de maiz, en una tentativa de eliminar el efecto de variaciones del suelo. Montgomery (1913), preocupado con el efecto del nitrógeno en el rendimiento del trigo, hizo un experimento en 224 parcelas, midiendo el rendimiento de granos. Varios otros autores, como Waynick y Sharp (1919), también estudiaron variaciones de nitrogeno y carbono en el suelo.
Los procedimientos usados en la época se basaban en la estadística clásica y utilizavan grandes cantidades de datos de mostra, pretendiendo caracterizar la descripción de la distribución espacial de la característica en estudio. Por estadística clásica se entiende aquella que se utiliza de parámetros como média y desvio padrón para representar un fenómeno y se basa en la hipótesis principal de que las variaciones de un local para otro son aleatorias.
Krige (1951), trabajando con datos de concentración de oro, concluyó que solamente la información dada por la varianza sería insuficiente para explicar el fenómeno en estudio. Para tal, sería necesario llevar en consideración la distancia entre las observaciones. A partir de ahí surge el concepto de la geoestadística, que lleva en consideración la localización geográfica y la dependencia espacial.
Matheron (1963, 1971), basado en las observaciones de Krige, desenvolvio la teoría de las variables regionalizadas, a partir de los fundamentos de la geoestadística.
Segundo Blais y Carlier (1968), citados por Olea (1975), una variable regionalizada es una función numérica con distribución espacial, que varía de un punto a otro con continuidad aparente, pero cuyas variaciones no pueden ser representadas por una función matemática simple.
La teoría de las variables regionalizadas presupone que la variación de una variable puede ser expresada por la suma de tres componentes (Burrough, 1987): a) una componente estrutural, asociada a un valor médio constante o a una tendencia constante; b) una componente aleatoría, espacialmente correlacionada; y c) un ruído aleatório o error residual.
Si x representa una posición en una, dos o tres dimensiones, entonces el valor de la variable Z, en x, es dada por (Burrough, 1987):
Z(x) = m(x) + e ¢ (x) + e ² (2.1)
donde:
Si x representa una posición en una, dos o tres dimensiones, entonces el valor de la variable Z, en x, es dada por (Burrough, 1987):
Z(x) = m(x) + e ¢ (x) + e ² (1)
donde:
La Figura inferior ilustra las tres componentes principales de la variación espacial. La parte (a) presenta una componente determinística que varía abruptamente, mientras la componente determinística en la parte (b) presenta una tendencia constante.
Diferente de los métodos convencionales de estimación, KRIGING está fundamentado en la teoría de las variables regionalizadas. El primer paso en KRIGING es definir una función apropriada para la componente determinística m(x). Para esto, algunas hipóteses son necesárías (Burrough, 1987 y David, 1977):
Sob esta hipótesis, se admite que la componente determinística, m(x), es constante (no tiene tendencias en la región). Entonces, m(x) es igual al valor esperado de la variable aleatoría Z en la posición x, y la diferencia media entre los valores observados en, x y x+h, separados por un vector de distancia h (módulo y dirección) es nula.
E[Z(x) - Z(x+h)] = 0 el E[Z(x)] = E[Z(x+h)] = m(x) = m (2)
donde
y representa el operador esperanza matemática.
También se admite que la covarianza entre los pares Z(x) y Z(x+h),
separados por un vector distancia h, existe y depende solamente de h. Entonces:
C(h) = Cov [Z(x), Z(x+h)] =
= E[(Z(x)-m).(Z(x+h)- m)] = E[Z(x).Z(x+h)]-m2, " x; (3)
donde
Cov [Z(x), Z(x+h)] es la covarianza entre Z(x) y Z(x+h).
En la Ecuación (3), estacionariedad de la covarianza implica la estacionariedad de la varianza:
Var[Z(x)] = E{[Z(x)- m]2} = E[Z2(x)] - 2.E[Z(x)].m + m2 =
= E[Z(x).Z(x+0)] - 2m2 + m2 =
= E[Z(x).Z(x+0)] - m2 = C(0), " x. (4)
donde
Var es el operador varianza.
La estacionariedad de la covarianza también afecta la estacionariedad del
variograma , definido por:
2g (h) = E{[Z(x)-Z(x+h)]2} (5)
La Ecuación (5) puede ser desarrollada como:
2g (h) = E{Z2(x) - 2 Z(x)Z(x+h) + Z2(x+h)}
= E[Z2(x)] - 2E[Z(x)Z(x+h)] + E[Z2(x+h)] (6)
De la Ecuación (3) se obtiene:
E[Z(x)Z(x+h)] = C(h) + m2 (7)
De manera análoga, de la Ecuación (4) se obtiene:
E[Z(x).Z(x+0)] = E[Z2(x)] = C(0) + m2 (8)
Substituyendo las equaciones (7) y (8) en la Ecuación (6), se obtiene:
2g (h) = C(0) + m2 - 2 (C(h) + m2) + C(0) + m2 =
= 2 C(0) - 2 C(h) (9)
Simplificando la Ecuación (9), se obtiene:
g (h) = C(0) - C(h) (10)
donde:
g (h) representa una función conecida en la teoría de las variables regionalizadas como semivariograma, que es mitad del variograma. Vea discusión sobre variograma.
La relación en (10) indica que sobre la hipótesis de estacionariedad de 2a orden, la covarianza y el semivariograma son formas alternativas de caracterizar la autocorrelación de los pares Z(x) y Z(x+h) separados por el vector h.
La hipótesis de estacionariedad de 2a orden supone la existencia de una covarianza y, entonces, de una varianza finita (Ecuación 4). Sobre esta condición, el correlograma, r (h), puede ser definido. Dividiendo a ambos lados de la Ecuación (10) por C(0), se tiene:
r
(h) = = 1-
(11)
Las restriciones impuestas a la estacionariedad de 2a
Orden, es decir, admitida $ C(h) Þ
$ Var[Z(x)] = C(0) y también
Þ $ g
(h), pueden no ser satisfechas para algunos fenómenos físicos
que presentan una capacidad infinita de dispersión (David, 1977). Capacidad
infinita de dispersión Þ
C(h),
Var[Z(x)];
aunque, puede existir g (h). Para tales
situaciones, una hipótesis menos restrictiva, la hipótesis intrínseca,
puede ser aplicable.
De modo análogo la hipótesis anterior, se admite que E[Z(x)] = m(x) = m,
" x. Además de eso, se admite que la varianza de las diferencias depende solamente
del vector distancia h, es decir:
Var[Z(x) - Z(x+h)] = E{[Z(x)-Z(x+h)]2} = 2g (h) , (12)
donde
2g (h) es tal y como presentado anteriormente.
Según David (1977), esta hipótesis es la más frecuente en geoestadística, principalmente por ser la menos restrictiva. Es decir, requiere apenas la existencia y estacionariedad del variograma, sin ninguna restricción respecto a la existencia de varianza finita.
Uma consideración adicional, que transcende el alcance de este trabajo, se refiere a las hipótesis de KRIGING Universal (David, 1977). En este caso, m(x) es el "drift" (tendencia principal) y se supone que C(h) y g (h) poseen estacionariedad dentro de una vecindad de tamaño restricto. Además de eso, se supone que E[Z(x)] = m(x), la qual no es más estacionaria, varía de modo regular dentro de tal vecindad. Según David (1977), no solamente la covarianza y el variograma son definidos a partir de valores experimentales, sinó también el tamaño de la vecindad donde las hipóteses se mantienen válidas. Trabajos en este asunto pueden ser encontrados en Olea (1975, 1977) y un ejemplo de aplicación puede ser visto en Burges y Webster (1980c).
En este trabajo se presupone la estacionariedad de 2a orden (Þ hipótesis intrínseca), la cual es suficiente para la utilización de los métodos de estimación de KRIGING simple (KS) y KRIGING ordinaria (KO), que son descritos.
Según Olea (1975, 1977), las principales características de una variable regionalizada son:
TABLA - PORCENTAJE DE H2O EN DOS MOSTRAS DISTINTAS A y B.
A |
5 |
10 |
15 |
20 |
25 |
20 |
15 |
10 |
5 |
% H2O |
B |
10 |
25 |
15 |
10 |
20 |
5 |
15 |
5 |
20 |
% H2O |
En esta tabla, los valores individuales en las dos muestras son exactamente los mismos. Por tanto la media y la varianza muestral, así como el histograma de frecuencia de la variable observada en las muestras A y B, son rigorosamente idénticos. Cualquier análisis que no lleve en consideración otras estadísticas además de la media, varianza y histograma no diferenciará las dos séries. Este ejemplo enfatiza la importancia de la medida de la continuidad espacial de la variable regionalizada. Así, se vuelve necesário considerar la posición espacial relativa de cada una de las observaciones en las dos muestras, para que las mismas sean diferenciadas. La continuidad espacial de la variable regionalizada puede ser analizada a partir del variograma, tal y como se describe a continuación.
Consulte también:
Variograma
KRIGING