O que é classificação?
- Classificação é o processo
de extração de informação em imagens
para reconhecer padrões e objetos homogêneos e são
utilizados em Sensoriamento Remoto para mapear áreas da
superfície terrestre que correspondem aos temas de interesse.
- A informação espectral de uma cena
pode ser representada por uma imagem espectral, na qual cada "pixel"
tem coordenadas espaciais x, y e uma espectral L,
que representa a radiância do alvo em todas as bandas espectrais,
ou seja para uma imagem de K bandas, existem K níveis de
cinza associados a cada "pixel" sendo um para cada banda
espectral. O conjunto de características espectrais de
um "pixel" é denotado pelo termo atributos espectrais.
- Os classificadores podem ser divididos em classificadores
"pixel a pixel" e classificadores por regiões.
- Classificadores "pixel a pixel":
Utilizam apenas a informação espectral de cada pixel
para achar regiões homogêneas. Estes classificadores
podem ser separados em métodos estatísticos (utilizam
regras da teoria de probabilidade) e determinísticos (não
utilizam probabilidade).
- Classificadores por regiões:
Utilizam, além de informação espectral de
cada "pixel", a informação espacial que
envolve a relação com seus vizinhos. Procuram simular
o comportamento de um foto-intérprete, reconhecendo áreas
homogêneas de imagens, baseados nas propriedades espectrais
e espaciais de imagens. A informação de borda é
utilizada inicialmente para separar regiões e as propriedades
espaciais e espectrais irão unir áreas com mesma
textura.
- O resultado da classificação digital
é apresentado por meio de classes espectrais (áreas
que possuem características espectrais semelhantes), uma
vez que um alvo dificilmente é caracterizado por uma única
assinatura espectral. É constituído por um mapa
de "pixels" classificados, representados por símbolos
gráficos ou cores, ou seja, o processo de classificação
digital transforma um grande número de níveis de
cinza em cada banda espectral em um pequeno número de classes
em uma única imagem.
- As técnicas de classificação
aplicadas apenas a um canal espectral (banda da imagem) são
conhecidas como classificações unidimensionais.
Quando o critério de decisão depende da distribuição
de níveis de cinza em vários canais espectrais as
técnicas são definidas como de classificação
multiespectral.
- O primeiro passo em um processo de classificação
multiespectral é o treinamento. Treinamento é o
reconhecimento da assinatura espectral das classes. Existem basicamente
duas formas de treinamento: supervisionado e não-supervisionado.
- Quando existem regiões da imagem em que
o usuário dispõe de informações que
permitem a identificação de uma classe de interesse,
o treinamento é dito supervisionado. Para um treinamento
supervisionado o usuário deve identificar na imagem uma
área representativa de cada classe. É importante
que a área de treinamento seja uma amostra homogênea
da classe respectiva, mas ao mesmo tempo deve-se incluir toda
a variabilidade dos níveis de cinza. Recomenda-se que o
usuário adquira mais de uma área de treinamento,
utilizando o maior número de informações
disponíveis, como trabalhos de campo, mapas, etc. Para
a obtenção de classes estatisticamente confiáveis,
são necessários de 10 a 100 "pixels" de
treinamento por classe. O número de "pixels"
de treinamento necessário para a precisão do reconhecimento
de uma classe aumenta com o aumento da variabilidade entre as
classes.
Exemplo de seleção de áreas
no treinamento supervisionado.
Quando o usuário utiliza algoritmos para reconhecer
as classes presentes na imagem, o treinamento é dito não-supervisionado.
Ao definir áreas para o treinamento não-supervisionado,
o usuário não deve se preocupar com a homogeneidade
das classes. As áreas escolhidas devem ser heterogêneas
para assegurar que todas as possíveis classes e suas variabilidades
sejam incluídas. Os "pixels" dentro de uma área
de treinamento são submetidos a um algoritmo de agrupamento
("clustering") que determina o agrupamento do dado,
numa feição espacial de dimensão igual ao
número de bandas presentes. Este algoritmo assume que cada
grupo ("cluster") representa a distribuição
de probabilidade de uma classe.
Exemplo de seleção de áreas
no treinamento não-supervisionado.
- As técnicas de classificação
multiespectral "pixel a pixel" mais comuns são:
máxima verossimilhança (MAXVER), distância
mínima e método do paralelepípedo.
- MAXVER é o
método de classificação, que considera a
ponderação das distâncias entre médias
dos níveis digitais das classes, utilizando parâmetros
estatísticos.
- Os conjuntos de treinamento definem o diagrama
de dispersão das classes e suas distribuições
de probabilidade, considerando a distribuição de
probabilidade normal para cada classe do treinamento.
- Para duas classes (1 e 2) com distribuição
de probabilidade distintas, as distribuições representam
a probabilidade de um "pixel" pertencer a uma ou outra
classe, dependendo da posição do "pixel"
em relação a esta distribuição. Ocorre
uma região onde as duas curvas sobrepõem-se, indicando
que um determinado "pixel" tem igual probabilidade de
pertencer às duas classes. Nesta situação
estabelece-se um critério de decisão a partir da
definição de limiares.
Exemplo de limite de aceitação de uma
classificação, no ponto onde as duas distribuições
se cruzam. Um "pixel" localizado na área sombreada,
apesar de pertencer à classe 2, será classificado
como classe 1.
- O limiar de aceitação indica a
% de "pixels" da distribuição de probabilidade
de uma classe que será classificada como pertencente a
esta classe. Um limite de 99%, por exemplo, engloba 99% dos "pixels",
sendo que 1% serão ignorados (os de menor probabilidade),
compensando a possibilidade de alguns "pixels" terem
sido introduzidos no treinamento por engano, nesta classe, ou
estarem no limite entre duas classes. Um limiar de 100% resultará
em uma imagem classificada sem rejeição, ou seja,
todos os "pixels" serão classificados.
- Para diminuir a confusão entre as classes,
ou seja, reduzir a sobreposição entre as distribuições
de probabilidades das classes, aconselha-se a aquisição
de amostras significativas de alvos distintos e a avaliação
da matriz de classificação das amostras.
- A matriz de classificação apresenta
a distribuição de porcentagem de "pixels"
classificados correta e erroneamente. No exemplo a seguir, apresenta-se
uma matriz de classificação com as porcentagens
de 4 classes definidas na aquisição de amostras,
os valores de desempenho médio, abstenção
(quanto não foi classificado) e confusão média.
| N | 1
| 2 | 3
| 4 |
| 1 | 4.7
| 94.3 | 0.0
| 0.0 | 0.9
|
| 2 | 1.1
| 0.0 | 82.3
| 0.0 | 16.6
|
| 3 | 0.0
| 13.3 | 0.0
| 86.7 | 0.0
|
| 4 | 3.8
| 0.0 | 4.7
| 0.0 | 91.5
|
- Desempenho médio: 89.37
- Abstenção média: 3.15
- Confusão média: 7.48
- O valor de N representa a quantidade de cada classe (porcentagem
de "pixels") que não foi classificada.
- A classe 1 corresponde à floresta, a classe 2 ao cerrado,
a classe 3 ao rio e a classe 4 ao desmatamento.
- Uma matriz de classificação ideal deve apresentar
os valores da diagonal principal próximos a 100%, indicando
que não houve confusão entre as classes. Contudo
esta é uma situação difícil em imagens
com alvos de características espectrais semelhantes.
- O valor fora da diagonal principal, por exemplo 13.3 (classe
linha 3 e coluna 1), significa que 13.3% da área da classe
"rio" amostrada foi classificada como classe 1 (floresta).
O mesmo raciocínio deve ser adotado para os outros valores.
- Para diminuir a confusão entre as classes, aconselha-se
a análise das amostras.
| | Amostras
|
| Classes | 1
| 2 | 3
| |
| Floresta | 90
| 50 | 87
| |
| Cerrado | 5
| 50 | 0
| |
| Rio | 5
| 0 | 0
| |
| Desmatamento | 0
| 0 | 10
| |
- Os valores em porcentagem indicam que na amostra 1, 90% dos
"pixels" são classificados como floresta, 5%
como cerrado e 5% como rio, o que resulta em uma amostra confiável.
Por sua vez, a amostra 2 apresentou uma confusão de 50%
entre as classes floresta e cerrado, indicando que esta deve ser
eliminada.
O que é o classificador MAXVER-ICM?
- Enquanto o classificador MAXVER associa classes
considerando pontos individuais da imagem, o classificador MAXVER-ICM
(Interated Conditional Modes) considera também a dependência
espacial na classificação.
- Em uma primeira fase, a imagem é classificada
pelo algoritmo MAXVER atribuindo classes aos "pixels",
considerando os valores de níveis digitais. Na fase seguinte,
leva-se em conta a informação contextual da imagem,
ou seja a classe atribuída depende tanto do valor observado
nesse "pixel", quanto das classes atribuídas
aos seus vizinhos.
- O algoritmo atribui classes a um determinado
"pixel", considerando a vizinhança interativamente.
Este processo é finalizado quando a % de mudança
(porcentagem de "pixels" que são reclassificados)
definida pelo usuário é satisfeita. O SPRING fornece
ao usuário as opções de 5%, 1% e 0.5% para
valores de porcentagem de mudanças. Um valor 5% significa
que a reatribuição de classes aos "pixels"
é interrompida quando apenas 5% ou menos do total de "pixels"
da imagem foi alterado.
O que é classificação
por distância euclidiana?
- O método de classificação
por distância Euclidiana é um procedimento de classificação
supervisionada que utiliza esta distância para associar
um "pixel" a uma determinada classe.
- No treinamento supervisionado, definem-se os
agrupamentos que representam as classes. Na classificação,
cada "pixel" será incorporado a um agrupamento,
através da análise da medida de similaridade de
distância Euclidiana, que é dada por:
d (x,m) = (x2 - m2) 1/2
onde:
- x = "pixel" que está sendo testado
- m = média de um agrupamento
- N = número de bandas espectrais
- O classificador compara a distância Euclidiana
do "pixel" à média de cada agrupamento.
O "pixel" será incorporado ao agrupamento que
apresenta a menor distância Euclidiana. Este procedimento
é repetido até que toda a imagem seja classificada.
O que é pós-classificação?
- Aplica-se este procedimento em uma imagem classificada,
com o objetivo de uniformizar os temas, ou seja, eliminar pontos
isolados, classificados diferentemente de sua vizinhança.
Com isto, Gera-se um imagem classificada com aparência menos
ruidosa.
- Em uma janela de 3 x 3 "pixels", o
ponto central é avaliado quanto à freqüência
das classes (temas), em sua vizinhança. De acordo com os
valores de peso e limiar definidos pelo usuário, este ponto
central terá ou não sua classe substituída
pela classe de maior freqüência na vizinhança.
- O peso varia de 1 a 7 e define o número
de vezes que será considerada a freqüência do
ponto central.
- O limiar varia também de 1 a 7
e é o valor de freqüência acima do qual o ponto
central é modificado.
Por exemplo, para a janela de uma imagem classificada
será avaliado o "pixel" central pertencente à
classe 2. Considera-se um peso e um limiar iguais a 3.
- Obtém-se a seguinte freqüência de classes:
| Classe | 1 | 2
| 3 | 5 |
| Freqüência | 1
| 3 | 3 | 4 |
- A tabela acima indica que a classe 1 ocorre uma vez; a classe
3 ocorre três vezes e a classe 5, quatro vezes. A freqüência
da classe 2 é considerada 3, pelo fato do peso definido
ser 3. O limiar igual a 3 fará com que o ponto central
(de classe 2) seja atribuído à classe 5, cuja freqüência
(4) é maior que o limiar definido.
- A janela classificada com seus temas uniformizados torna-se:
- A definição de peso e limiar dependerá
da experiência do usuário e das características
da imagem classificada. Quanto menor o peso e menor o limiar,
maior o número de substituições que serão
realizadas.
O que é a segmentação de Imagens
- A classificação estatística
é o procedimento convencional de análise digital
de imagens. Constitui um processo de análise de pixels
de forma isolada. Esta abordagem apresenta a limitação
da análise pontual ser baseada unicamente em atributos
espectrais. Para superar estas limitações, propõe-se
o uso de segmentação de imagem, anterior à
fase de classificação, onde se extraem os objetos
relevantes para a aplicação desejada.
- Neste processo, divide-se a imagem em regiões
que devem corresponder às áreas de interesse da
aplicação. Entende-se por regiões um conjunto
de "pixels" contíguos, que se espalham bidirecionalmente
e que apresentam uniformidade.
- A divisão em porções consiste
basicamente em um processo de crescimento de regiões, de
detecção de bordas ou de detecção
de bacias.
O que é crescimento de regiões?
- É uma técnica de agrupamento de
dados, na qual somente as regiões adjacentes, espacialmente,
podem ser agrupadas.
- Inicialmente, este processo de segmentação
rotula cada "pixel" como uma região distinta.
Calcula-se um critério de similaridade para cada par de
região adjacente espacialmente. O critério de similaridade
baseia-se em um teste de hipótese estatístico que
testa a média entre as regiões. A seguir, divide-se
a imagem em um conjunto de sub-imagens e então realiza-se
a união entre elas, segundo um limiar de agregação
definido.
- Para a união de duas regiões A
e B vizinhas, deve-se adotar o seguinte critério:
- A e B são similares (teste das médias);
- a similaridade satisfaz o limiar estabelecido;
- A e B são mutuamente próximas (dentre
os vizinhos de A, B é a mais próxima, e dentre os
vizinhos de B, A é a mais próxima).
- Caso as regiões A e B satisfaçam
estes critérios, estas regiões são agregadas,
caso contrário o sistema reinicia o processo de teste de
agregação.
O que é detecção de bacias?
- A classificação por detecção
de bacias é feita sobre uma imagem resultante da extração
de bordas.
- A extração de bordas é realizada
por um algoritmo de detecção de bordas, ou seja
pelo filtro de Sobel. Este algoritmo considera os gradientes de
nível de cinza da imagem original, para gerar uma imagem
gradiente ou imagem de intensidade de borda.
- O algoritmo calcula um limiar para a perseguição
de bordas. Quando ele encontra um "pixel" com valor
superior ao limiar estabelecido, tem-se início o processo
de perseguição da borda. Observa-se a vizinhança
para identificar o próximo "pixel" de maior valor
de nível digital e segue-se nesta direção
até que se encontre outra borda ou a fronteira da imagem.
Deste processo gera-se uma imagem binária com os valores
de 1 referentes às bordas e 0, a regiões de não-bordas.
- A imagem binária será rotulada
de modo que as porções da imagem com valores 0 constituirão
regiões limitadas pelos valores 1 da imagem, constituindo
a imagem rotulada.
- O procedimento de segmentação por
detecção de bacias pressupõe uma representação
topográfica para a imagem, ou seja, para uma dada imagem
gradiente, o valor de nível digital de cada "pixel"
equivale a um valor de elevação naquele ponto. A
imagem equivaleria a uma superfície topográfica
com feições de relevo ou uma região com bacias
de diferentes profundidades.
- O crescimento de uma região equivaleria
à imersão da superfície topográfica
em um lago. Define-se um altura inicial (nível digital)
para o preenchimento das bacias (limiar). A "água"
preencherá progressivamente as diferentes bacias da imagem
até um limiar definido pela topografia (valor de nível
digital). Ao alcançar o limite, define-se uma barreira
entre duas regiões. O processo de preenchimento continua
em outra direção até atingir um novo limite
topográfico, definindo-se mais uma barreira, e assim sucessivamente
até que todas as barreiras tenham sido definidas.
- O resultado é uma imagem rotulada, cada
região apresentando um rótulo (valor de nível
digital), que devem ser classificadas por classificadores de região.
Como classificar imagens segmentadas?
- O classificador Isoseg é o algoritmo disponível
no Spring para classificar regiões de uma imagem segmentada.
É um algoritmo de agrupamento de dados não-supervisionado,
aplicado sobre o conjunto de regiões, que por sua vez são
caracterizadas por seus atributos estatísticos de média
e matriz de covariância, e também pela área.
- Um algoritmo de "clustering" não
assume nenhum conhecimento prévio da distribuição
de densidade de probabilidade dos temas, como ocorre no algoritmo
de máxima verossimilhança. É uma técnica
para classificação que procura agrupar regiões,
a partir de uma medida de similaridade entre elas. A medida de
similaridade utilizada consiste na distância de Mahalanobis
entre a classe e as regiões candidatas a relação
de pertinência com esta classe.
- O Isoseg utiliza os atributos estatísticos
das regiões: a matriz de covariância e o vetor de
média, para estimar o valor central de cada classe. Este
algoritmo resume-se em três etapas, descritas a seguir.
- (1ª) Definição do limiar:
o usuário define um limiar de aceitação,
dado em percentagem. Este limiar por sua vez define uma distância
de Mahalanobis, de forma que todas regiões pertencentes
a uma dada classe estão distantes da classe por uma distância
inferior a esta. Quanto maior o limiar, maior esta distância
e consequentemente maior será o número de classes
detectadas pelo algoritmo.
- (2ª) Detecção das classes:
as regiões são ordenadas em ordem decrescente de
área e inicia-se o procedimento para agrupá-las
em classes. Serão tomados como parâmetros estatísticos
de uma classe (média e matriz de covariância), os
parâmetros estatísticos da região de maior
área que ainda não tenha sido associada a classe
alguma. Em seguida, associa-se a esta classe todas regiões
cuja distância de Mahalanobis for inferior a distância
definida pelo limiar de aceitação. Assim, a primeira
classe terá como parâmetros estatísticos aquelas
regiões com maior área. As classes seguintes terão
parâmetros estatísticos de média das regiões
de maior área, que não tenham sido associada a nenhuma
das classes previamente detectadas. Esta fase repete-se até
que todas regiões tenham sido associadas a alguma classe.
- (3ª) Competição entre classes:
as regiões são reclassificadas, considerando-se
os novos parâmetros estatísticos das classes, definidos
na etapa anterior.
- A fase 2 consiste basicamente na detecção
de classes, sendo um processo seqüencial que pode favorecer
as classes que são detectadas em primeiro lugar. Com vista
a eliminar este favorecimento", procede-se a "competição
entre classes. Esta competição consiste em reclassificar
todas as regiões. O parâmetro estatístico
(média de cada classe é então recalculado.
O processo repete-se até que a média das classes
não se altere (convergência).
- Ao término, todas regiões estarão
associadas a uma classe definida pelo algoritmo. O usuário
deverá então associar estas classes (denominadas
temas, no Spring) às classes por ele definidas no banco
de dados, na opção Arquivo-Esquema Conceitual, descrito
no capítulo 5, volume1.
- Portanto o usuário deve seguir os seguintes
passos para gerar uma classificação a partir de
uma imagem segmentada, observe que os passos de 2 a 9 foram descritos
anteriormente:
- Criar uma imagem segmentada
- gerar uma imagem, separada em regiões com base na análise
dos níveis de cinza.
- Criar o arquivo de Contexto
- este arquivo armazena quais as bandas farão parte do
processo de classificação por regiões.
- Executar o treinamento
- deve ser feita amostragens sobre uma imagem na área de
desenho;
- Analisar as amostras
- permite verificar a validade das amostras coletadas;
- Extração de regiões:
neste procedimento o algoritmo extrai as informações
estatísticas de média e variável de cada
região, considerando as bandas indicadas no contexto;
- Classificação - para
a realizar a classificação de uma imagem
segmentada deve-se usar o classificador por regiões;
- Executar a Classificação
- de posse da amostras e das bandas escolhidas a imagem é
classificada;
- Executar uma Pós-classificação
- processo de extração de pixels isolados em função
de um limiar e um peso fornecidos pelo usuário;
- Executar o Mapeamento para Classes
- permite transformar a imagem classificada (categoria Imagem)
para um mapa temático raster (categoria Temático).