Classificação

Os tópicos apresentados aqui são


Veja como executar uma Classificação no SPRING.


Consulte também:
Outras técnicas de Processamento de Imagem.
Como executar uma Classificação.
Opções no menu Imagens do SPRING


Introdução à Classificação


Classificação é o processo de extração de informação em imagens para reconhecer padrões e objetos homogêneos.

Os métodos de classificação são usados para mapear áreas da superfície terrestre que apresentam um mesmo significado em imagens digitais.

A informação espectral de uma cena pode ser representada por uma imagem espectral, onde cada "pixel" tem as coordenadas espaciais x, y e a coordenada espectral L, que representa a radiância de um alvo no intervalo de comprimento de onda de uma banda espectral. Cada "pixel" de uma banda possui uma correspondência espacial com um outro "pixel", em todas as outras bandas, ou seja para uma imagem de K bandas, existem K níveis de cinza associados à cada "pixel", sendo um para cada banda espectral.

O conjunto de características espectrais de um "pixel" é denotado pelo termo "atributos espectrais".

Conforme o processo de classificação empregado, os classificadores podem ser divididos em classificadores "pixel a pixel" e classificadores por regiões.

Representa-se o resultado de uma classificação digital por classes espectrais (áreas que possuem características espectrais semelhantes). Exemplo: o mapeamento de uso do solo urbano através de imagem multiespectral.

O usuário pode ter interesse em mapear áreas, residencial e industrial, e estas classes dificilmente são caracterizadas por uma única assinatura espectral (representa um vetor de dimensão igual ao número de bandas, cujas coordenadas são medidas de radiância do alvo), devido aos diferentes tipos de alvos presentes, como vegetação, prédios, pavimentação etc.

Diante desta dificuldade, em uma classificação, o usuário deve considerar a relação entre a resposta espectral dos alvos e a classe que deseja mapear.

O resultado final de um processo de classificação é uma imagem digital que constitue um mapa de "pixels" classificados, representados por símbolos gráficos ou cores.

O processo de classificação digital transforma um grande número de níveis de cinza, em cada banda espectral, em um pequeno número de classes em uma única imagem.

As técnicas de classificação que podem ser aplicadas apenas a um canal espectral (banda da imagem) sendo conhecidas como classificações unidimensionais.

As técnicas em que o critério de decisão depende da distribuição de níveis de cinza, em vários canais espectrais, são definidas como técnicas de classificação multiespectral.

As técnicas de classificação multiespectral ,"pixel a pixel", mais comuns são: máxima verossimilhança (MAXVER), distância mínima e método do paralelepípedo (não implementado nesta versão do SPRING).

O primeiro passo em um processo de classificação multiespectral é o treinamento. Treinamento é o reconhecimento da assinatura espectral das classes.

Existem basicamente duas formas de treinamento: supervisionado e não-supervisionado.

Quando existem regiões da imagem em que o usuário dispõe de informações que permitem a identificação de uma classe de interesse, o treinamento é dito supervisionado.

Para um treinamento supervisionado o usuário deve identificar na imagem uma área representativa de cada classe. É importante que a área de treinamento seja uma amostra homogênea da classe respectiva, mas ao mesmo tempo deve-se incluir toda a variabilidade dos níveis de cinza do tema em questão.

Recomenda-se que o usuário adquira mais de uma área de treinamento, utilizando o maior número de informações disponíveis, como trabalhos de campo, mapas etc.

Para a obtenção de classes estatisticamente confiáveis, são necessários de 10 a 100 "pixels" de treinamento por classe. O número de "pixels" de treinamento necessário para a precisão do reconhecimento de uma classe aumenta com o aumento da variabilidade entre as classes.

A figura a seguir ilustra como o usuário deve selecionar as áreas, no treinamento supervisionado.

Quando o usuário utiliza algorítmos para reconhecer as classes presentes na imagem, o treinamento é dito não-supervisionado. Ao definir áreas para o treinamento não-supervisionado, o usuário não deve se preocupar com a homogeneidade das classes. As áreas escolhidas devem ser heterogêneas para assegurar que todas as possíveis classes e suas variabilidades sejam incluídas.

A figura a seguir ilustra como o usuário deve selecionar as áreas, no treinamento não-supervisionado.

Os "pixels" dentro de uma área de treinamento são submetidos a um algoritmo de agrupamento ("clustering") que determina o agrupamento do dado, numa feição espacial de dimensão igual ao número de bandas presentes. Este algorítmo assume que cada grupo ("cluster") representa a distribuição de probabilidade de uma classe.



Tópicos de Classificação


Classificadores "Pixel a Pixel"

O Spring dispõe de três classificadores do tipo pixel a pixel, que serão apresentados a seguir:

MAXVER

MAXVER , vem do método estatístico de Máxima Verossimilhança, e é o método de classificação "pixel a pixel" mais comum. Considera a ponderação das distâncias entre médias dos níveis digitais das classes, utilizando parâmetros estatísticos.

Para que a classificação por máxima verossimilhança seja precisa o suficiente, é necessário um número razoavelmente elevado de "pixels", para cada conjunto de treinamento.

Os conjuntos de treinamento definem o diagrama de dispersão das classes e suas distribuições de probabilidade, considerando a distribuição de probabilidade normal para cada classe do treinamento.

Apresentam-se duas classes (1 e 2) com distribuição de probabilidade distintas. Estas distribuições de probabilidade representam a probabilidade de um "pixel" pertencer à uma ou outra classe, dependendo da posição do "pixel" em relação à esta distribuição.

Observa-se uma região onde as duas curvas sobrepõem-se, indicando que um determinado "pixel" tem igual probabilidade de pertencer às duas classes. Nesta situação estabelece-se um critério de decisão a partir da definição de limiares.

Os limites de classificação são definidos a partir de pontos de mesma probabilidade de classificação de uma e de outra classe.

A figura a seguir apresenta o limite de aceitação de uma classificação, no ponto onde as duas distribuições se cruzam. Desta forma, um "pixel" localizado na região sombreada, apesar de pertencer à classe 2, será classificado como classe 1, pelo limite de aceitação estabelecido.

O limiar de aceitação indica a % de "pixels" da distribuição de probabilidade de uma classe que será classificada como pertencente à esta classe. Um limite de 99%, por exemplo, engloba 99% dos "pixels", sendo que 1% serão ignorados (os de menor probabilidade), compensando a possibilidade de alguns "pixels" terem sido introduzidos no treinamento por engano, nesta classe, ou estarem no limite entre duas classes. Um limiar de 100% resultará em uma imagem classificada sem rejeição, ou seja, todos os "pixels" serão classificados.

Para diminuir a confusão entre as classes, ou seja, reduzir a sobreposição entre as distribuições de probabilidades das classes, aconselha-se a aquisição de amostras significativas de alvos distintos e a avaliação da matriz de classificação das amostras.

A matriz de classificação apresenta a distribuição de porcentagem de "pixels" classificados correta e erroneamente. No exemplo a seguir, apresenta-se uma matriz de classificação com as porcentagens de 4 classes definidas na aquisição de amostras, os valores de desempenho médio, abstenção (quanto não foi classificado) e confusão média.

O valor de N representa a quantidade de cada classe (porcentagem de "pixels") que não foi classificada.

A classe 1 corresponde à floresta, a classe 2 ao cerrado, a classe 3 ao rio e a classe 4 ao desmatamento.

  N 1 2 3 4
1 4.7 94.3 0 0 0.9
2 1.1 0 82.3 0 16.6
3 0 13.3 0 86.7 0
4 3.8 0 4.7 0 91.5

Desempenho médio: 89.37
Abstenção média: 3.15
Confusão média: 7.48

Uma matriz de classificação ideal deve apresentar os valores da diagonal principal próximos a 100%, indicando que não houve confusão entre as classes. Contudo, esta é uma situação difícil em imagens com alvos de características espectrais semelhantes.

O valor fora da diagonal principal, por exemplo 13.3 (classe linha 3 e coluna 1), significa que 13.3% da área da classe "rio" amostrada, foi classificada como pertencente à classe 1 (floresta). O mesmo raciocínio deve ser adotado para os outros valores.

Para diminuir a confusão entre as classes, aconselha-se a análise das amostras.

A tabela a seguir apresenta a análise das amostras adquiridas para a classe floresta.

  Amostras 1 2 3
Classes        
Floresta   90 50 87
Cerrado   5 50 0
Rio   5 0 0
Desmatamento   0 0 10

Os valores em porcentagem indicam que na amostra, '1. 90%' dos "pixels" são classificados como floresta, '5%' como cerrado e '5%' como rio, o que resulta em uma amostra confiável. Por sua vez, a amostra 2 apresentou uma confusão de '50%' entre as classes floresta e cerrado, indicando que esta deve ser eliminada.

Tópicos de Classificação


MAXVER-ICM

Enquanto o classificador MAXVER associa classes considerando pontos individuais da imagem, o classificador MAXVER-ICM (Interated Conditional Modes) considera também a dependência espacial na classificação.

Em uma primeira fase, a imagem é classificada pelo algorítmo MAXVER atribuindo classes aos "pixels", considerando os valores de níveis digitais. Na fase seguinte, leva-se em conta a informação contextual da imagem, ou seja, a classe atribuída depende tanto do valor observado nesse "pixel", quanto das classes atribuídas aos seus vizinhos.

O algorítmo atribui classes a um determinado "pixel", considerando a vizinhança interativamente. Este processo é finalizado quando a '%' de mudança (porcentagem de "pixels"  reclassificados), definida pelo usuário é satisfeita.

O SPRING fornece ao usuário as opções de 5%, 1% e 0.5% para valores de porcentagem de mudanças. Um valor 5% significa que a reatribuição de classes aos "pixels" é interrompida quando apenas 5% ou menos do total de "pixels" da imagem foi alterado.



Tópicos de Classificação


Distância Euclidiana

O método de classificação por distância Euclidiana é um procedimento de classificação supervisionada, que utiliza esta distância para associar um "pixel" á uma determinada classe.

No treinamento supervisionado, definem-se os agrupamentos que representam as classes.

Na classificação, cada "pixel" será incorporado a um agrupamento, através da análise da medida de similaridade de distância Euclidiana, que é dada por:

d (x,m) = (x2 - m2) 1/2

onde:
x = "pixel" que está sendo testado
m = média de um agrupamento
N = número de bandas espectrais


O classificador compara a distância Euclidiana do "pixel" à média de cada agrupamento.

O "pixel" será incorporado ao agrupamento que apresenta a menor distância Euclidiana. Este procedimento é repetido até que toda a imagem seja classificada.

Tópicos de Classificação


Classificação de Imagens Segmentadas - Classificadores por regiões

Isoseg

O classificador Isoseg é um dos algoritmos disponíveis no Spring para classificar regiões de uma imagem segmentada. É um algoritmo de agrupamento de dados não-supervisionado, aplicado sobre o conjunto de regiões, que por sua vez são caracterizadas por seus atributos estatísticos de média, matriz de covariância, e também pela área.

Um algoritmo de "clustering" não supõe nenhum conhecimento prévio da distribuição de densidade de probabilidade dos temas, como ocorre no algoritmo de máxima verossimilhança. É uma técnica para classificação que procura agrupar regiões, a partir de uma medida de similaridade entre elas. A medida de similaridade utilizada consiste na distância de Mahalanobis entre a classe e as regiões candidatas a relação de pertinência com esta classe.

O Isoseg utiliza os atributos estatísticos das regiões: a matriz de covariância e o vetor de média, para estimar o valor central de cada classe. Este algoritmo resume-se em tres etapas, descritas a seguir.

(1ª) Definição do limiar: o usuário define um limiar de aceitação, dado em percentagem. Este limiar por sua vez define uma distância de Mahalanobis, de forma que todas regiões pertencentes a uma dada classe estão distantes da classe por uma distância inferior a esta. Quanto maior o limiar, maior esta distância e consequentemente menor será o número de classes detectadas pelo algoritmo.

(2ª) Detecção das classes: as regiões são ordenadas em ordem decrescente de área e inicia-se o procedimento para agrupá-las em classes. Serão tomados como parâmetros estatísticos de uma classe (média e matriz de covariância), os parâmetros estatísticos da região de maior área que ainda não tenha sido associada a classe alguma. Em seguida, associa-se a esta classe todas regiões cuja distância de Mahalanobis for inferior a distância definida pelo limiar de aceitação.

Assim, a primeira classe terá como parâmetros estatísticos aquelas regiões com maior área. As classes seguintes terão parâmetros estatísticos de média das regiões de maior área, que não tenham sido associada a nenhuma das classes previamente detectadas. Esta fase repete-se até que todas regiões tenham sido associadas a alguma classe.

(3ª) Competição entre classes: as regiões são reclassificadas, considerando-se os novos parâmetros estatísticos das classes, definidos na etapa anterior.

A fase 2 consiste basicamente na detecção de classes, sendo um processo seqüencial que pode favorecer as classes que são detectadas em primeiro lugar. Com vista a eliminar este favorecimento", procede-se a "competição entre classes. Esta competição consiste em reclassificar todas as regiões. O parâmetro estatístico (média de cada classe é então recalculado. O processo repete-se até que a média das classes não se altere (convergência).

Ao término, todas regiões estarão associadas á uma classe definida pelo algoritmo. O usuário deverá então associar estas classes (denominadas temas, no Spring) às classes por ele definidas no banco de dados, na opção Arquivo-Esquema Conceitual.

Battacharya

A medida da distância de Battacharya é usada neste classficador por regiões, para medir a separabilidade estatística entre um par de classes espectrais. Ou seja, mede a distância média entre as distribuições de probabilidades de classes espectrais.

O princípio é análogo ao utilizado para o classificador Isoseg, porém a medida de distância usada é a distãncia de Battacharya. (ver mais detalhes em Paul M. Mather, 1993).

O classificador Battacharya, ao contrário do Isoseg que é automático, requer interação do usuário, através do treinamento. Neste caso, as amostras serão as regiões formadas na segmentação de imagens.


ClaTex

O classificador ClaTex é um algoritmo supervisionado que utiliza atributos texturais das regiões de uma imagem segmentada para efetuar a classificação por regiões. A classificação é realizada pela técnica de agrupamento de regiões a partir de uma medida de similaridade entre elas. E a medida de similaridade utilizada consiste na distância de Mahalanobis entre a classe de interesse e as regiões candidatas à relação de pertinência com esta classe. Portanto, cada região será classificada a uma dada classe de interesse baseada na minimização da distância de Mahalanobis.

O conjunto de medidas texturais que pode ser utilizado por este classificador é dividido em 5 (cinco) grupos:

  1. Medidas Gerais: este grupo inclui a média, a variância, o desvio padrão, a curtoses, a assimetria e o coeficiente de variação;
  2. Medidas em histograma: este grupo inclui a mediana, a desvio médio absoluto, a entropia e a energia;
  3. Medidas Logarítmicas: neste grupo se encontram os logaritmos da média, da variância, do desvio e da textura (definida por: (definida por: , onde é a média amostral da variável ;
  4. Medidas de Autocorrelação: as medidas de autocorrelação espacial bidimensional podem ser definidas para os "lags" que variam entre -4 e 4 e ainda pode-se definir a razão entre duas medidas de autocorrelação;
  5. Medidas de Haralick: as medidas deste grupo são baseadas na matriz de co-ocorrência de Haralick ("Gray Level Co-occurrence Matrix" - GLCM). As dezoito medidas que compõem este grupo são a entropia, o contraste, a energia, a homogeneidade, a dissimilaridade, a correlação, o qui-quadrado, o "cluster shade", o "cluster prominence", e a média, a variância, a energia e a entropia dos vetores soma e diferença e o contraste do vetor diferença.

As etapas a serem seguidas para a realização de uma classificação com o algoritmo ClaTex são similares àquelas apresentadas para um classificador supervisionado. Entretanto, existem duas diferenças básicas acrescidas ao ClaTex que podem ser resumidas como segue:

E por fim realiza-se a etapa de classificação propriamente dita, baseada na distância de Mahalanobis, gerando-se uma imagem classificada.


Para Executar uma Classificação Supervisionada

Antes de apresentarmos os procedimentos para executar uma classificação, descreve-se a seguir a seqüência lógica de operações:


Sequência para executar uma classificação a partir de uma imagem segmentada

O usuário deve seguir os seguintes passos para gerar uma classificação a partir de uma imagem segmentada:


Pós Classificação

Aplica-se este procedimento em uma imagem classificada, com o objetivo de uniformizar os temas, ou seja, eliminar pontos isolados, classificados diferentemente de sua vizinhança. Com isto, gera-se um imagem classificada com aparência menos ruidosa.

Em uma janela de 3 x 3 "pixels", o ponto central é avaliado quanto à freqüência das classes (temas), em sua vizinhança. De acordo com os valores de peso e limiar, definidos pelo usuário, este ponto central terá ou não sua classe substituída pela classe de maior freqüência na vizinhança.

O peso varia de 1 a 7, e define o número de vezes que será considerada a freqüência do ponto central.

O limiar varia também de 1 a 7, e é o valor de freqüência acima do qual o ponto central é modificado.

Por exemplo, para a janela de uma imagem classificada como o exemplo a seguir (cada número representa uma cor de uma classe), será avaliado o "pixel" central pertencente à classe 2:

3 3 1
5 2 3
5 5 5

Considera-se um peso e um limiar iguais a 3 e obtém-se a seguinte freqüência de classes:

Classe 1 2 3 5
Freqüência 1 3 3 4

A tabela acima indica que a classe 1 ocorre uma vez; a classe 3 ocorre três vezes e a classe 5, quatro vezes. A freqüência da classe 2 é considerada 3, pelo fato do peso definido ser 3.

O limiar igual a 3 fará com que o ponto central (de classe 2) seja atribuído à classe 5, cuja freqüência (4) é maior que o limiar definido.

A janela classificada com seus temas uniformizados torna-se:

3 3 1
5 5 3
5 5 5

A definição de peso e limiar dependerá da experiência do usuário e das características da imagem classificada. Quanto menor o peso e menor o limiar, maior o número de substituições que serão realizadas.

Tópicos de Classificação



Consulte também:
Outras técnicas de Processamento de Imagem.
Como executar uma Classificação.