Simulação - Geoestatística

Esta página apresenta os principais conceitos relacionados com a função de simulação por indicação disponibilizada no módulo de geoestatística do SPRING.


SIMULAÇÃO ESTOCÁSTICA CONDICIONAL

Uma simulação estocástica é um processo de obtenção de realizações, igualmente prováveis, a partir dos modelos de distribuição de probabilidades de VA. Dada uma VA Z(u), cada realização l dessa VA é denotada por z(l)(u). Uma simulação condicional é uma simulação condicionada ao conjunto de n dados amostrais. Neste caso as realizações honram os valores do atributo nas posições dos dados amostrais, ou seja, z(l)(ua ) = z(ua ), " l.

Este texto apresenta conceitos relacionados com simulação estocástica condicional que serão descritos nas seções seguintes.


SIMULAÇÃO SEQUENCIAL POR INDICAÇÃO (IS)

A geoestatística modela os valores de um atributo, dentro de uma região A da superfície terrestre, como uma função aleatória. Para cada posição u Î A o valor do atributo de um dado espacial é modelado como uma variável aleatória (VA) Z(u). Isto significa que, na posição u, a VA Z(u) pode assumir diferente valores desse atributo, cada valor com uma probabilidade de ocorrência associada. Nas n posições amostradas, ua , a =1,2,...,n, os valores z(ua ) são considerados determinísticos, ou ainda, podem ser considerados VA’s cujo valor medido tem uma probabilidade de 100% de ocorrência. A função de distribuição de Z(u) condicionada aos dados amostrado, F(u; z|(n)), é definida por:

F(u; z|(n)) = Prob{Z(u) £ z|(n)} quando o atributo é numérico

e,

F(u; z|(n)) = Prob{Z(u) = z|(n)} quando o atributo é temático

A F(u; z|(n)) modela a incerteza sobre os valores de z(u), em posições u não amostradas, considerando-se as n amostras. Essa função pode ser inferida a partir do procedimento de inferência chamado de Krigeagem por Indicação. Ela é uma técnica de inferência estatística não linear pois é aplicada sobre os valores do atributo transformados por um mapeamento não linear, a codificação por indicação.

A codificação por indicação da VA Z(u=ua ), em um valor de corte z = zk, gera a VA I(u=ua ; zk) utilizando a seguinte função de mapeamento não linear:

      para atributos numéricos e,

         para atributos temáticos

Os valores de corte, zk, k=1,2...,K, são definidos em função do número de amostras. É necessário que a quantidade de amostras codificadas com valor 1 seja suficiente para se definir, com sucesso, um modelo de variografia para cada valor de corte (Journel, 1983).

A esperança condicional da VA por indicação I(u; zk) é calculada por:

A equação acima representa um resultado muito importante no que diz respeito a inferência da distribuição de probabilidade de uma variável aleatória: "A esperança condicional de I(u; zk) fornece, para o valor de corte z = zk , uma estimativa do valor da função de distribuição condicionada, fdc, de Z(u) no caso de atributos temáticos e uma estimativa da função de distribuição acumulada condicionada, fdac, para atributos numéricos".

Deutsch, 1998, apresenta uma metodologia chamada simulação sequencial por indicação que utiliza aproximações locais de fdac´s para obtenção de realizações de uma VA Z(u). Essa simulação pode ser usada para criar representações matriciais de atributos contínuos e categóricos. Para isso, uma fdac univariada é definida para cada nó grade que é visitado em sequência aleatória. Para assegurar reprodução do modelo de covariância, cada fdac univariada é condicionada as amostras e também aos nós da grade previamente simulados (Goovaerts, 1997).

As realizações são obtidas a partir de valores de probabilidades, de um modelo de distribuição uniforme, que são mapeados para valores z segundo a fdac da VA que representa o atributo considerado. A Figura 1 ilustra esse processo.

Esse processo é utilizado para a geração campos aleatórios, representados como grades regulares, que representam realizações da superfície do atributo numérico na região de interesse.

 

Figura 1: Ilustração do processo de obtenção de realizações a partir da fdac de uma VA.

 

Estimativa de parâmetros da fdac a partir de realizações da VA

O conjunto de realizações, obtidas para um determinado nó dos campos aleatórios, pode ser usado para se determinar parâmetros estatísticos da fdac local na posição do nó.

A média m da fdac é calculada a partir da média simples de todas as realizações obtidas para o nó. A variância e o desvio padrão s da fdac são facilmente obtidos a partir de sua média m e dos valores realizados.

A mediana q.5 é determinada a partir da ordenação dos valores realizados z(u) e posterior definição de um valor do atributo que divide o conjunto ordenado em dois subconjuntos de igual cardinalidade. Valores aproximadamente iguais da média e da mediana indicam similaridade da função de distribuição de probabilidade da VA. A mediana é um estimador mais robusto para distribuições de probabilidade não simétricas (Isaaks, 1989). O conjunto de realizações ordenado serve, ainda, para a determinação de outros quantis associados a da distribuição da VA.

A média e a mediana são tipicamente utilizados como valores estimados de atributos numéricos representados como variáveis aleatórias.


Veja como executar:

Sequência de Procedimentos no SPRING

Análise Exploratória
Análise Espacial por Semivariograma
Ajuste do Semivariograma
Validação do Modelo
Krigeagem, Krigeagem por Indicação ou Simulação por Indicação

 Consulte também:
Variáveis regionalizadas
Variograma
Análise Espacial no SPRING
Modelagem Numérica de Terreno
Edição vetorial