Estimador por Kernel

    Observando-se um padrão de pontos como, por exemplo, ocorrência de crime ou doença, pode-se verificar uma intensidade maior ou menor de ocorrências; o que fornece algum tipo de informação. Muitas vezes, olhar os eventos dessa forma não é muito esclarecedor e uma operação de suavização poderia melhorar a informação de tendência do fenômeno. O objetivo do Kernel é justamente, através da aplicação de uma função "interpoladora", estimar valores onde não existem amostras e, com isso, proporcionar ao usuário uma forma  mais suave de observar o fenômeno.

    Estimar a intensidade de um padrão de pontos é como estimar uma densidade de probabilidade. Utiliza-se neste aplicativo um Kernel Quártico. A figura abaixo é uma tentativa de elucidar a operação. Tem-se um plano com as ocorrências dos eventos e, para cada localização, como S, onde se quer estimar a intensidade, sobrepõe-se uma função como a representada no desenho. Observa-se que os pontos que estão no interior da função contribuem para o cálculo do valor de intensidade em S.  A contribuição de cada ponto é proporcional ao valor da  distância do ponto à S. 

p1.gif (4982 bytes)

Pode-se, então, imaginar uma grade retangular sobreposta ao plano. Para cada célula da grade, aplica-se a função e estima-se um valor. O valor seria uma medida da influência das amostras na célula. A partir da grade pode-se gerar uma imagem ou efetuar um fatiamento para observar como a densidade de pontos está se distribuindo.

p2.bmp (361014 bytes)

 

Suponha que s represente uma localização em uma região R e s1,.....,sn são localizações de n eventos

p3.bmp (222230 bytes)

observados. Então, a intensidade, na localização s, (ponto vermelho da figura) é estimada segundo a fórmula , onde hi é a distância entre o ponto s e a localização do evento observado si , e a soma só acorre para os pontos que estão à uma localização hi que não ultrapasse t (pontos dentro do círculo azul).

A região de influência dentro da qual os eventos contribuem para o cálculo da intensidade é um círculo de raio t com centro em s. Observando a fórmula verifica-se que na localização s, a uma distância zero, o peso é . Esse peso cai para o valor zero quando a distância é t.

A escolha do raio t, denominado nesse aplicativo de  largura de banda, define superfícies suaves ou não. Para grandes larguras t, a intensidade estimada é suave e para pequenas larguras a intensidade tende a  picos centrados em s.

p7.jpg (202014 bytes)

A operação descrita leva em consideração apenas a localização do evento e nos informa, por exemplo, a tendência da criminalidade ou o espalhamento de uma epidemia. Quais são as regiões mais "perigosas"? Onde procurar os focos de doenças?

Pode-se incluir também uma operação que além da localização considera também os atributos do ponto. Nesse caso estaríamos lidando, por exemplo, com estimativa do teor de carbono em uma determinada localização, a partir de um conjunto de dados conhecidos. Tanto a localização quanto o atributo são considerados. Portanto, algumas operações além da descrita acima são permitidas.

A função pode ou não considerar os atributos do ponto. No caso mais simples, em que cada ponto corresponde apenas à ocorrência do evento, trata-se de um estimador de intensidade e está relacionado ao número de "eventos por unidade de área". Caso exista um valor associado ao ponto, por exemplo, teor de argila, pode-se utilizar a fórmula

p9.jpg (2482 bytes)

que representa a "quantidade do atributo por unidade de área". Se, por exemplo, quisermos um estimador do "valor médio do atributo" pode-se dividir esse valor pelo número de eventos por unidade de área e obtemos.

No caso de se trabalhar com polígonos, pode-se e associar ao polígono o seu centróide. O conjunto dos centróides forma um padrão de pontos e assim pode-se  utilizar as ferramentas acima.               

Suponha que se queira estimar "eventos por unidade de população". Basta dividir "número de eventos por área" pela "população por área" ou densidade populacional, obtendo:

Outra aplicação seria utilizar como população outro processo espacial bem representativo dessa população conhecido como processo de controle. Um exemplo seria, casos de câncer de laringe onde os casos de câncer de pulmão, na mesma área, poderiam ser usados como população. Este caso seria uma razão entre dois processos e poderia ser representado pela fórmula:

                                                                                 

Nas fórmulas acima o valor de k() está geral. No caso em que k() é escolhido como Kernel Quártico deve-se substituir pelo valor:

  p10.jpg (1904 bytes)

Observa-se que em alguns casos a largura da banda é considerada igual no numerador e denominador . Caso o usuário pretenda utilizar bandas diferentes, deve evitar escolher largura de bandas,  para o denominador, mais estreitas do que a denominador. Este cuidado evita problemas no cálculo da razão.

NOTA: Esse módulo permite diversas possibilidades e o usuário deve   responsabilizar-se pela coerência das operações.  Antes de descrever a execução vamos apresentar um breve resumo das operações possíveis. Pode-se fazer uma operação simples ou razão.

Uma operação simples consiste, por exemplo, no número de observações por unidade de área, onde somente a localização dos pontos é considerada. Outra operação simples seria a quantidade de um atributo por unidade de área. Pode-se verificar na interface que existe a opção de considerar ou não o atributo e assim, consequentemente, fazer uma das operações descritas. Observa-se que no caso da operação simples, somente a metade esquerda da janela fica visível. Outra observação importante é que, no caso do plano escolhido conter polígonos, o usuário deverá optar por área, e não ponto que é o default. Na opção área, o programa se encarrega de calcular os centróides de cada polígono e , a partir daí, trabalharcomo se fossem pontos.

A operação de razão é necessária quando se deseja calcular, por exemplo, o valor médio do atributo. Quando se escolhe essa operação a segunda metade da tela também é ativada. Para que se calcule o valor médio do atributo faz-se   necessário o cálculo da quantidade de atributo por área, o numerador da fração, lado esquerdo da janela, e o cálculo de eventos por área, denominador da fração, metade da direita da janela. O programa então calcula a média realizando a razão entre os dois. Portanto, devido à quantidade de operações, o usuário deve cuidar para fazer as escolhas corretas, optando por trabalhar com área ou ponto, com ou sem atributo, verificar o modelo correto etc..

Durante a operação, dependendo da categoria que pertence o PI, algumas opções disponíveis nas janelas são desativadas. No caso da categoria ser do modelo Temático, se o ponto ou polígono foi classificado, as geoclasses são apresentadas para escolha. No caso de um Cadastral, deve-se escolher o geo_objeto e o atributo associado. Quando o modelo for Digital, a única opção de escolha, que também está disponível para os outros modelos, é  considerar ou não os atributos. O default é sempre o de não considerar o atributo.

A saida desse aplicativo é uma grade de valores. O usuário deverá criar uma categoria do modelo temático com as classes de intensidade e cores correspondentes para que a grade possa ser fatiada e o efeito observado. É interessante também criar uma categoria tipo imagem para que se possa gerar uma imagem a partir da grade. Essa imagem também é uma forma de se visualizar o efeito da distribuição. No caso de uma operação de razão, a grade terá valores difíceis de serem fatiados. O ideal seria ter um histograma da grade para saber como os valores estão distribuídos. Normalmente, neste caso, uma porcentagem dos valores extremos é desprezada e fatia-se o restante em intervalos  iguais. O Spring ainda não possui esse recurso. Uma alternativa que se pode utilizar é a de gerar uma imagem, a partir dessa grade, e utilizar a ferramenta de fatiamento da imagem, na função de Contraste.

NOTA1: Essa função opera sobre pontos e, portanto, somente as categorias Cadastral, Temática e MNT são válidas.

Executando a função Kernel no SPRING:

 

Consulte também:

Análise Espacial