Esta página apresenta os principais conceitos para compreensão a manipulação do módulo de geoestatística do SPRING. Os tópicos apresentados aqui são:
As definições e convenções aqui adotadas seguem os padrões da geoestatística, isto é, funções e variáveis aleatórias são denotadas com caracteres maiúsculos (exemplo: Z(x) e Z), valores observados são representados por caracteres minúsculos (exemplo: valor da variável aleatória Z medido na posição xk é z(xk) ) e vetores são realçados em negrito (exemplo: {z(xi), i = 1, ..., n}, onde xi identifica uma posição em duas dimensões representada pelos pares de coordenadas (xi , yi) ).
Veja como executar:
Sequência de Procedimentos no SPRING
Análise Exploratória
Análise Espacial por Semivariograma
Ajuste do Semivariograma
Validação do Modelo
Krigeagem
Consulte também:
Análise Espacial no SPRING
Modelagem Numérica de Terreno
Edição vetorial
A variabilidade espacial de algumas características do solo vem sendo uma das preocupações de pesquisadores praticamente desde o início do século. Smith (1910) estudou a disposição de parcelas no campo em experimentos de rendimento de variedades de milho, numa tentativa de eliminar o efeito de variações do solo. Montgomery (1913), preocupado com o efeito do nitrogênio no rendimento do trigo, fez um experimento em 224 parcelas, medindo o rendimento de grãos. Vários outros autores, como Waynick e Sharp (1919), também estudaram variações de nitrogênio e o carbono no solo.
Os procedimentos usados na época baseavam-se na estatística clássica e utilizavam grandes quantidades de dados amostrais, visando caracterizar ou descrever a distribuição espacial da característica em estudo. Por estatística clássica entende-se aquela que se utiliza de parâmetros como média e desvio padrão para representar um fenômeno e se baseia na hipótese principal de que as variações de um local para outro são aleatórias.
Krige (1951), trabalhando com dados de concentração de ouro, concluiu que somente a informação dada pela variância seria insuficiente para explicar o fenômeno em estudo. Para tal, seria necessário levar em consideração a distância entre as observações. A partir daí surge o conceito da geoestatística, que leva em consideração a localização geográfica e a dependência espacial.
Matheron (1963, 1971), baseado nas observações de Krige, desenvolveu a teoria das variáveis regionalizadas, a partir dos fundamentos da geoestatística.
Segundo Blais e Carlier (1968), citados por Olea (1975), uma variável regionalizada é uma função numérica com distribuição espacial, que varia de um ponto a outro com continuidade aparente, mas cujas variações não podem ser representadas por uma função matemática simples.
A teoria das variáveis regionalizadas pressupõe que a variação de uma variável pode ser expressa pela soma de três componentes (Burrough, 1987): a) uma componente estrutural, associada a um valor médio constante ou a uma tendência constante; b) uma componente aleatória, espacialmente correlacionada; e c) um ruído aleatório ou erro residual.
Se x representa uma posição em uma, duas ou três dimensões, então o valor da variável Z, em x, é dada por (Burrough, 1987):
Z(x) = m(x) + e ¢ (x) + e ² (2.1)
onde:
Se x representa uma posição em uma, duas ou três dimensões, então o valor da variável Z, em x, é dada por (Burrough, 1987):
Z(x) = m(x) + e ¢ (x) + e ² (1)
onde:
A Figura abaixo ilustra as três componentes principais da variação espacial. A parte (a) apresenta uma componente determinística que varia abruptamente, enquanto a componente determinística na parte (b) apresenta uma tendência constante.

Diferente dos métodos convencionais de estimação, a krigeagem está fundamentada na teoria das variáveis regionalizadas. O primeiro passo na krigeagem é definir uma função apropriada para a componente determinística m(x). Para tanto, algumas hipóteses são necessárias (Burrough, 1987 e David, 1977):
Sob esta hipótese, admite-se que a componente determinística, m(x), é constante (não há tendências na região). Então, m(x) é igual ao valor esperado da variável aleatória Z na posição x, e a diferença média entre os valores observados em, x e x+h, separados por um vetor de distância h (módulo e direção) é nula.
E[Z(x) - Z(x+h)] = 0 ou E[Z(x)] = E[Z(x+h)] = m(x) = m (2)
onde
E representa o operador esperança matemática.
Admite-se também que a covariância entre os pares Z(x) e Z(x+h),
separados por um vetor distância h, existe e depende somente de h. Então:
C(h) = Cov [Z(x), Z(x+h)] =
= E[(Z(x)-m).(Z(x+h)- m)] = E[Z(x).Z(x+h)]-m2, " x; (3)
onde
Cov [Z(x), Z(x+h)] é a covariância entre Z(x) e Z(x+h).
Na Equação (3), estacionariedade da covariância implica na estacionariedade da variância:
Var[Z(x)] = E{[Z(x)- m]2} = E[Z2(x)] - 2.E[Z(x)].m + m2 =
= E[Z(x).Z(x+0)] - 2m2 + m2 =
= E[Z(x).Z(x+0)] - m2 = C(0), " x. (4)
onde
Var é o operador variância.
A estacionariedade da covariância também implica na estacionariedade do
variograma , definido por:
2g (h) = E{[Z(x)-Z(x+h)]2} (5)
A Equação (5) pode ser desenvolvida em:
2g (h) = E{Z2(x) - 2 Z(x)Z(x+h) + Z2(x+h)}
= E[Z2(x)] - 2E[Z(x)Z(x+h)] + E[Z2(x+h)] (6)
Da Equação (3) obtem-se:
E[Z(x)Z(x+h)] = C(h) + m2 (7)
De maneira análoga, da Equação (4) obtem-se:
E[Z(x).Z(x+0)] = E[Z2(x)] = C(0) + m2 (8)
Substituindo as equações (7) e (8) na Equação (6), obtem-se:
2g (h) = C(0) + m2 - 2 (C(h) + m2) + C(0) + m2 =
= 2 C(0) - 2 C(h) (9)
Simplificando a Equação (9), obtem-se:
g (h) = C(0) - C(h) (10)
onde:
g (h) representa uma função conhecida na teoria das variáveis regionalizadas como semivariograma, que é metade do variograma. Veja discusão sobre variograma.
A relação em (10) indica que sob a hipótese de estacionariedade de 2a ordem, a covariância e o semivariograma são formas alternativas de caracterizar a autocorrelação dos pares Z(x) e Z(x+h) separados pelo vetor h.
A hipótese de estacionariedade de 2a ordem supõe a existência de uma covariância e, então, de uma variância finita (Equação 4). Sob esta condição, o correlograma, r (h), pode ser definido. Dividindo ambos os lados da Equação (10) por C(0), tem-se:
r
(h) =
= 1-
(11)
As restrições impostas à estacionariedade de 2a Ordem, isto é, admitida $
C(h) Þ
$
Var[Z(x)] = C(0) e também Þ
$
g
(h), podem não ser satisfeitas para alguns fenômenos físicos que apresentam uma capacidade infinita de dispersão (David, 1977). Capacidade infinita de dispersão Þ
C(h),
Var[Z(x)]; porém, pode existir g
(h). Para tais situações, uma hipótese menos restritiva, a hipótese intrínseca, pode ser aplicável.
De modo análogo à hipótese anterior, admite-se que E[Z(x)] = m(x) = m,
" x. Além disso, admite-se que a variância das diferenças depende somente
do vetor distância h, isto é:
Var[Z(x) - Z(x+h)] = E{[Z(x)-Z(x+h)]2} = 2g (h) , (12)
onde
2g (h) é conforme apresentado anteriormente.
Segundo David (1977), esta hipótese é a mais freqüente em geoestatística, principalmente por ser a menos restritiva. Isto é, requer apenas a existência e estacionariedade do variograma, sem nenhuma restrição quanto à existência de variância finita.
Uma consideração adicional, que transcende a abrangência deste trabalho, refere-se às hipóteses da Krigeagem Universal (David, 1977). Neste caso, m(x) é o "drift" (tendência principal) e supõe-se que C(h) e g (h) possuem estacionariedade dentro de uma vizinhança de tamanho restrito. Além disso, supõe-se que E[Z(x)] = m(x), a qual não é mais estacionária, varia de modo regular dentro de tal vizinhança. Segundo David (1977), não somente a covariância e o variograma são definidos a partir de valores experimentais, mas também o tamanho da vizinhança onde as hipóteses se mantem válidas. Trabalhos neste assunto podem ser encontrados em Olea (1975, 1977) e um exemplo de aplicação pode ser visto em Burgess e Webster (1980c).
Neste trabalho pressupõe-se a estacionariedade de 2a ordem (Þ hipótese intrínseca), a qual é suficiente para a utilização dos métodos de estimação de krigeagem simples (KS) e krigeagem ordinária (KO), a serem descritos nas respectivamente.
Segundo Olea (1975, 1977), as principais características de uma variável regionalizada são:
TABELA - PERCENTAGEM DE H2O EM DUAS AMOSTRAS DISTINTAS A E B.
|
A |
5 |
10 |
15 |
20 |
25 |
20 |
15 |
10 |
5 |
% H2O |
|
B |
10 |
25 |
15 |
10 |
20 |
5 |
15 |
5 |
20 |
% H2O |
Nesta tabela, os valores individuais nas duas amostras são exatamente os mesmos. Portanto a média e a variância amostral, assim como o histograma de frequência da variável observada nas amostras A e B, são rigorosamente idênticos. Qualquer análise que não leve em consideração outras estatísticas além da média, variância e histograma não diferenciará as duas séries. Este exemplo enfatiza a importância da medida da continuidade espacial da variável regionalizada. Assim, torna-se necessário considerar a posição espacial relativa de cada uma das observações nas duas amostras, para que as mesmas sejam diferenciadas. A continuidade espacial da variável regionalizada pode ser analizada a partir do variograma, conforme descrito a seguir.
Consulte também:
Variograma
Krigeagem