Clasificación

Os tópicos mostrados aquí son

·         Post-Clasificación (eliminar pixels aislados)


Vea como ejecutar una Clasificación en SPRING.


Consulte también:
Otras técnicas de Procesamiento de Imagen.
Como ejecutar una Clasificación.
Opciones en el menu Imágenes de SPRING


Introducción a Clasificación


Una clasificación es el proceso de extracción de información en imágenes para reconocer patrones y objetos homogéneos.

Los métodos de clasificación se utilizan para mapear áreas de la superficie terrestre que presentan un significado igual en imágenes digitales.

Una información espectral de una escena puede ser representada por una imagen espectral, donde cada "pixel" tiene las coordenadas espaciales x, y además de la coordenada espectral L, que representa la radiancia de un albo en el intervalo de longitud de onda de una banda espectral. Cada "pixel" de una banda posee una correspondencia espacial con otro "pixel", en todas las otras bandas, o sea, para una imagen de K bandas, existen K niveles de gris asociados a cada "pixel" siendo uno para cada banda espectral.

 

El conjunto de características espectrales de un "pixel" es denotado por el término atributos espectrales.

Conforme el proceso de clasificación utilizado, los clasificadores pueden ser divididos en clasificadores "pixel a pixel" y clasificadores por regiones.

Clasificadores "pixel a pixel" utilizan sólo la información espectral aislada de cada pixel para encontrar regiones homogéneas. Estos clasificadores pueden ser divididos en métodos estadísticos (que utilizan reglas de la teoría de probabilidad) y métodos determinísticos.

 

Clasificadores por regiones utilizan, además de la información espectral de cada "pixel", la información espacial que envuelve la relación entre los "pixels" y sus vecinos. Estos clasificadores buscan simular el comportamiento de un fotointérprete, al reconocer áreas homogéneas en imágenes, basados en las propiedades espectrales y espaciales de dichas imágenes. La información de bordes es utilizada inicialmente para separar regiones, las propiedades espaciales y espectrales servirán para unir áreas con la misma textura.

El resultado de una clasificación digital se representa por clases espectrales (áreas que poseen características espectrales semejantes), por ejemplo: la cartografía de uso del suelo urbano a través de una imagen multiespectral. El usuario puede tener interés en mapear áreas, residenciales e industriales y estas clases difícilmente son caracterizadas por una única firma espectral (representa un vector de dimensión igual al número de bandas, cuyas coordenadas son medidas de radiancia), debido a los diferentes tipos de albos presentes como vegetación, construcciones, pavimento, entre otros.

Frente a esta dificultad, en una clasificación, el usuario debe considerar la relación entre la respuesta espectral de los albos y la clase que desea mapear.

El resultado final de un proceso de clasificación es una imagen digital que constituye un mapa de "pixels" clasificados, representados por símbolos gráficos o colores.

El proceso de clasificación digital transforma un gran número de niveles de gris en cada banda espectral en un pequeño número de clases en una única banda.

Las técnicas de clasificación que pueden ser aplicadas a un sólo canal espectral (banda de la imagen), son conocidas como clasificaciones unidimensionales.

 

Las técnicas en las que el criterio de decisión depende de la distribución de niveles de gris en varios canales espectrales son definidas como técnicas de clasificación multiespectral.

Las técnicas de clasificación multiespectral "pixel a pixel" más comunes son: máxima verosimilitud (MAXVER), distancia mínima y método del paralelepípedo (no implementado en esta versión del SPRING).

El primer paso en un proceso de clasificación multiespectral es el entrenamiento. Se entiende por entrenamiento el reconocimiento de la firma espectral de las clases.

Existen básicamente dos formas de entrenamiento: supervisado y no supervisado.

 

Cuando existen regiones de la imagen en las que el usuario dispone de informaciones que permiten la identificación de una clase de interés, el entrenamiento es denominado supervisado.

Para un entrenamiento supervisado el usuario debe identificar en la imagen un área representativa de cada clase. Es importante que el área de entrenamiento sea una muestra homogénea de la respectiva clase, pero al mismo tiempo se deben incluir todas las variabilidades de los niveles de gris.

Se recomienda que el usuario adquiera más de un área de entrenamiento, utilizando el mayor número de informaciones disponibles, como trabajos de campo, mapas, entre otros.

Para la obtención de clases estadísticamente confiables, son necesarios de 10 a 100 "pixels" de entrenamiento por cada clase. El número de "pixels" de entrenamiento necesario para la precisión del reconocimiento de una clase, aumenta en función de la variabilidad entre las clases.

La figura a seguir ilustra como el usuario debe seleccionar las áreas, en el entrenamiento supervisado.

 

Cuando el usuario utiliza algoritmos para reconocer las clases presentes en la imagen, el entrenamiento es denominado no supervisado. Al definir áreas para el entrenamiento no supervisado, el usuario no se debe preocupar con la homogeneidad de las clases. Las áreas seleccionadas deben ser heterogéneas para asegurar que todas las posibles clases y sus variaciones sean incluidas.

La figura a continuación ilustra la forma como el usuario debe seleccionar las áreas, en el entrenamiento no supervisado.

 

Los "pixels" dentro de un área de entrenamiento son sometidos a un algoritmo de agrupamiento ("clustering") que determina el grupo al cual pertenece el dato, en un espacio de dimensión igual al número de bandas presentes. Este algoritmo asume que cada grupo ("cluster") representa la distribución de probabilidad de una clase.



Tópicos de Clasificación


Clasificadores "Pixel a Pixel"

El Spring dispone de tres clasificadores del tipo pixel a pixel, que serán mostrados a continuación:

MAXVER

MAXVER , viene del método estadístico de Máxima Verosimilitud, y es el método de clasificación "pixel a pixel" más común. Considera la ponderación de las distancias entre medias de los niveles digitales de las clases, utilizando parámetros estadísticos.

Para que la clasificación por máxima verosimilitud sea suficientemente precisa, es necesario un número razonablemente elevado de "pixels", para cada conjunto de entrenamiento.

Los conjuntos de entrenamiento definen el diagrama de dispersión de las clases y sus distribuciones de probabilidad, considerando cada clase del entrenamiento como una distribución de probabilidad normal.

Se presentan dos clases (1 y 2) con distribución de probabilidad distintas. Estas distribuciones representan la probabilidad de un "pixel" de pertenecer a una u otra clase, dependiendo de la posición del "pixel" con relación a cada distribución.

Se observa una región donde las dos curvas se sobreponen, indicando que un determinado "pixel" tiene igual probabilidad de pertenecer a las dos clases. En esta situación se establece un criterio de decisión a partir de la definición de umbrales.

Los límites de clasificación son definidos a partir de puntos de igual probabilidad de clasificación de una y de otra clase.

La figura a seguir presenta el límite de aceptación de una clasificación, en el punto donde las dos distribuciones se cruzan. De esta forma, un "pixel" localizado en la región sombreada, a pesar de pertenecer a la clase 2, será clasificado como perteneciente a la clase 1, por el limite de aceptación establecido.

El umbral de aceptación indica el porcentaje de "pixels" de la distribución de probabilidad de una clase, que será clasificado como perteneciente a dicha clase. Un umbral de 99%, por ejemplo, engloba 99% de los "pixels", (el 1% de los pixel que tengan menor probabilidad serán ignorados), compensando la posibilidad de algunos "pixels" haber sido introducidos durante el entrenamiento por engaño en esta clase, o están en el límite entre dos clases. Un umbral de 100% resultará en una imagen clasificada sin rechazos, o sea, todos los "pixels" serán clasificados.

Para disminuir la confusión entre las clases, o sea, reducir la superposición entre las distribuciones de probabilidads de las clases, se aconseja la adquisición de muestras significativas de albos distintos y la evaluación de la matriz de clasificación de las muestras.

La matriz de clasificación presenta la distribución del porcentaje de "pixels" clasificados correcta e incorrectamente. En el ejemplo a seguir, se presenta una matriz de clasificación con los porcentajes de 4 clases definidas en la adquisición de muestras, los valores de desempeño medio, abstención (aún sin ser clasificado) y confusión media.

El valor de N representa la cantidad de cada clase (en porcentaje de "pixels") que no fue clasificada.

La clase 1 corresponde a bosque, la clase 2 a sabana, la clase 3 a río y la clase 4 a deforestación.

 

N

1

2

3

4

1

4.7

94.3

0

0

0.9

2

1.1

0

82.3

0

16.6

3

0

13.3

0

86.7

0

4

3.8

0

4.7

0

91.5

Desempeño medio: 89,37
Abstención media: 3,15
Confusión media: 7,48

Una matriz de clasificación ideal debe presentar los valores de la diagonal principal próximos a 100%, indicando que no hubo confusión entre las clases. Sin embargo, esta es una situación difícil de ocurrir en imágenes con albos de características espectrales semejantes.

El valor fuera de la diagonal principal, por ejemplo 13,3 (clase línea 3 y columna 1), significa que 13,3% del área de la clase "río" fue clasificada como perteneciente a la clase 1 (bosque). El mismo raciocinio debe ser adoptado para los otros valores.

 

Para disminuir la confusión entre las clases, se aconseja el análisis de las muestras.

La tabla a continuación presenta el análisis de las muestras adquiridas para la clase bosque.

 

 

Muestras

1

2

3

Clases

 

 

 

 

Bosque

 

90

50

87

Sabana

 

5

50

0

Río

 

5

0

0

Deforestación

 

0

0

10

Los valores en porcentaje indican que en la muestra 1, 90% de los "pixels" son clasificados como bosque, 5% como sabana y 5% como río, lo que resulta en una muestra confiable. Por su vez, la muestra 2 presentó una confusión de 50% entre las clases bosque y sabana, indicando que dicha muestra debe ser eliminada.

Tópicos de Clasificación


MAXVER-ICM

Mientras el clasificador MAXVER asocia clases considerando puntos individuales de la imagen, el clasificador MAXVER-ICM (Interated Conditional Modes) considera también la dependencia espacial en la clasificación.

En una primera fase, la imagen es clasificada por el algoritmo MAXVER atribuyendo clases a los "pixels", considerando los valores de niveles digitales. En la fase siguiente, se lleva en consideración la información contextual de la imagen, o sea, la clase atribuida depende tanto del valor observado en ese "pixel", como de las clases atribuidas a sus vecinos.

 

El algoritmo atribuye clases a un determinado "pixel", considerando la vecindad interactivamente. Este proceso finaliza cuando es alcanzado el porcentaje de cambios (porcentaje de "pixels" que son reclasificados) definido previamente por el usuario.

El SPRING ofrece al usuario las opciones de 5%, 1% y 0,5% para valores de porcentaje de cambios. Un valor de 5% significa que la reatribución de clases a los "pixels" es interrumpida cuando fue alterado el 5% o menos del total de "pixels" de la imagen.

 



Tópicos de Clasificación


Distancia Euclidiana

El método de clasificación por distancia Euclidiana es un procedimiento de clasificación supervisada que utiliza esta distancia para asociar un "pixel" a una determinada clase.

En el entrenamiento supervisado, se definen los agrupamientos que representan las clases.

En la clasificación, cada "pixel" será incorporado a un grupo, a través del análisis de la medida de similitud de distancia Euclidiana, la cual es dada por:

d (x,m) = (x2 - m2) 1/2

donde:
x = "pixel" que está siendo probado
m = media de un grupo
N = número de bandas espectrales


El clasificador compara la distancia Euclidiana del "pixel" a la media de cada grupo.

El "pixel" será incorporado al grupo que presenta la menor distancia Euclidiana. Este procedimiento es repetido hasta que toda la imagen sea clasificada.

Tópicos de Clasificación


Clasificación de Imágenes Segmentadas - Clasificadores por regiones

Isoseg

O clasificador Isoseg es un dos algoritmos disponibles no Spring para clasificar regiones de una imagen segmentada. es un algoritmo de agrupamiento de dados no-supervisado, aplicado sobre el conjunto de regiones, que por su vez son caracterizadas por sus atributos estadísticos de media, matriz de covariancia, e también por el área.

Um algoritmo de "clustering" não supone ningún  conocimiento previo da distribución de densidad  de probabilidad dos temas, como ocurre no algoritmo de máxima verosimilitud. es una técnica para Clasificación que procura agrupar regiones, a partir de una medida de semejanza entre ellas. A medida de semejanza utilizada consiste na distancia de Mahalanobis entre a clase e as regiones candidatas a relación de pertenencia con esta clase.

O Isoseg utiliza os atributos estadísticos das regiones: a matriz de covariancia e el vector de media, para estimar el valor central de cada clase. Este algoritmo resume-se em tres etapas, descritas a seguir.

(1ª) Definición do limiar: el usuário define un limiar de aceitação, dado em percentagem. Este limiar por su vez define una distancia de Mahalanobis, de forma que todas regiones pertencentes a una dada clase estão distantes da clase por una distancia inferior a esta. Quanto maior el limiar, maior esta distancia e consequentemente menor será el número de clases detectadas pelo algoritmo.

(2ª) Detección das clases: as regiones son ordenadas em ordem decrescente de área e inicia-se el procedimento para agrupá-las em clases. Serão tomados como parâmetros estadísticos de una clase (media e matriz de covariancia), os parâmetros estadísticos da região de maior área que ainda não tenha sido associada a clase alguma. Em seguida, associa-se a esta clase todas regiones cuja distancia de Mahalanobis for inferior a distancia definida pelo limiar de aceitação.

Assim, a primeira clase terá como parâmetros estadísticos aquelas regiones con maior área. As clases seguintes terão parâmetros estadísticos de media das regiones de maior área, que não tenham sido associada a nenhuma das clases previamente detectadas. Esta fase repete-se até que todas regiones tenham sido associadas a alguma clase.

(3ª) Competición entre clases: as regiones son reclasificadas, considerando-se os novos parâmetros estadísticos das clases, definidos na etapa anterior.

A fase 2 consiste basicamente na detección de clases, sendo un proceso seqüencial que pode favorecer as clases que son detectadas em primeiro lugar. con vista a eliminar este favorecimento", procede-se a "competición entre clases. Esta competición consiste em reclasificar todas as regiones. el parâmetro estatístico (media de cada clase es então recalculado. el proceso repete-se até que a media das clases não se altere (convergência).

Ao término, todas regiones estarão associadas á una clase definida pelo algoritmo. el usuário deverá então associar estas clases (denominadas temas, no Spring) às clases por ele definidas no banco de dados, na opción Arquivo-Esquema Conceitual.

 

Battacharya

A medida da distancia de Battacharya es usada neste classficador por regiones, para medir a separabilidade estatística entre un par de clases espectrais. Ou seja, mede a distancia media entre as distribuições de probabilidads de clases espectrais.

O princípio es análogo ao utilizado para el clasificador Isoseg, porém a medida de distancia usada es a distãncia de Battacharya. ( ver mais detalhes em Paul M. Mather, 1993).

O clasificador Battacharya, ao contrário do Isoseg que es automático, requer interación do usuário, através do treinamento. Neste caso, as amostras serão as regiones formadas na segmentación de imágenes.

 

ClaTex

O clasificador ClaTex es un algoritmo supervisado que utiliza atributos texturais das regiones de una imagen segmentada para efetuar a Clasificación por regiones. A Clasificación es realizada por el técnica de agrupamiento de regiones a partir de una medida de semejanza entre elas. E a medida de semejanza utilizada consiste na distancia de Mahalanobis entre a clase de interesse e as regiones candidatas à relación de pertenencia con esta clase. Portanto, cada região será clasificada a una dada clase de interesse baseada na minimización da distancia de Mahalanobis.

O conjunto de medidas texturais que pode ser utilizado por este clasificador es dividido em 5 (cinco) grupos:

  1. Medidas Gerais: este grupo inclui a media, a variância, el desvio padrão, a curtoses, a assimetria e el coeficiente de variação;
  2. Medidas em histograma: este grupo inclui a mediana, a desvio médio absoluto, a entropia e a energia;
  3. Medidas Logarítmicas: neste grupo se encontram os logaritmos da media, da variância, do desvio e da textura (definida por: (definida por: , onde é a media amostral da variável ;
  4. Medidas de Autocurrelação: as medidas de autocurrelación espacial bidimensional podem ser definidas para os "lags" que variam entre -4 e 4 e ainda pode-se definir a razão entre duas medidas de autocurrelação;
  5. Medidas de Haralick: as medidas deste grupo son baseadas na matriz de co-ocorrência de Haralick ("Gray Level Co-occurrence Matrix" - GLCM). As dezoito medidas que compõem este grupo son a entropia, el contraste, a energia, a homogeneidade, a dissemejanza, a correlação, el qui-quadrado, el "cluster shade", el "cluster prominence", e a media, a variância, a energia e a entropia dos vetores soma e diferença e el contraste do vector diferença.

As etapas a serem seguidas para a realización de una Clasificación con el algoritmo ClaTex son similares àquelas apresentadas para un clasificador supervisado. Entretanto, existem duas diferenças básicas acrescidas ao ClaTex que podem ser resumidas como segue:

E por fim realiza-se a etapa de Clasificación propriamente dita, baseada na distancia de Mahalanobis, gerando-se una imagen clasificada.


Para realizar una Clasificación supervisada

Antes de presentar los procedimientos para realizar una clasificación, se describe la secuencia lógica de operaciones a ser seguida:

1. Criar el arquivo de Contexto - este archivo almacena cuáles serán las bandas que formarán parte del proceso de clasificación, cuál será el método a utilizar (pixel o región) y en el caso de la clasificación por pixel, también almacenará las muestras;

2. Ejecutar el treinamento – deben se hechos muestreos sobre una imagen del área de visualización con muestras rectangulares o poligonales;

3. Analisar as amostras - permite verificar la validez de las muestras colectadas;

4. Ejecutar a Clasificación - de acuerdo con las muestras y las bandas seleccionadas es clasificada la imagen;

5. Ejecutar una Pós-clasificación - proceso de extracción de pixels aislados en función de un umbral y un peso definidos por el usuario (no obligatorio);

      6.  Ejecutar el Mapeamento para Clases - lo que permite transformar la imagen clasificada (categoría Imagen) en un mapa temático raster (categoría Temático). NOTA: En caso de clasificación por regiones, las muestras serán las propias regiones.


Sequência para ejecutar una Clasificación a partir de una imagen segmentada

O usuário deve seguir os seguintes passos para gerar una Clasificación a partir de una imagen segmentada:

1. Criar una imagen segmentada - gerar una imagem, separada em regiones con base na análise dos níveis de cinza.

2. Criar el arquivo de Contexto - este arquivo armazena quais as bandas farão parte do proceso de Clasificación por regiones.

3. Extracción de regiones: neste procedimento el algoritmo extrai as informações estatísticas de media e variável de cada região, considerando as bandas indicadas no contexto;

4. Ejecutar el treinamento - deve ser feita amostragens sobre una imagen na área de desenho; 

5. Analisar as amostras - permite verificar a validade das amostras coletadas;

6. Clasificación - para a realizar a Clasificación de una imagen segmentada deve-se usar el clasificador por regiones;

7. Ejecutar el Mapeamento para Clases - permite transformar a imagen clasificada (categoria Imagem) para un mapa temático raster (categoria Temático).


Pós Clasificación

Este procedimiento se aplica a una imagen clasificada, con el objetivo de hacer más uniformes los temas, o sea, eliminar puntos aislados o clasificados diferente de su vecindad. Con esto, se genera una imagen clasificada que presenta menos ruido.

En una ventana de 3 x 3 "pixels", el punto central es evaluado con relación a la frecuencia de las clases (temas), en su vecindad. De acuerdo con los valores de peso y umbral definidos por el usuario, este punto central podrá tener su clase substituida por la clase de mayor frecuencia en la vecindad.

El peso varía de 1 a 7 y define el número de veces que será considerada la frecuencia del punto central.

El umbral varía también de 1 a 7 y corresponde al valor de frecuencia por encima del cual será modificado el punto central.

Por ejemplo, para la ventana de una imagen clasificada (cada número representa el color de una clase): será evaluado el "pixel" central perteneciente a la clase 2.

3

3

1

5

2

3

5

5

5

Si se considera un peso y un umbral iguales a 3, se
obtiene la siguiente frecuencia de clases:

Clase

1

2

3

5

Frecuencia

1

3

3

4

La tabla anterior indica que la clase 1 ocurre una vez; la clase 3 ocurre tres veces y la clase 5, cuatro veces. La frecuencia de la clase 2 es considerada 3, por el hecho de que el peso definido para el punto central es 3.

Un umbral igual a 3 hace que el punto central (perteneciente a la clase 2) sea atribuido a la clase 5, cuya frecuencia (4) es mayor que la del umbral definido.

La ventana clasificada con los temas homogeneizados será:

 

3

3

1

5

5

3

5

5

5

La definición del peso y el umbral dependerá de la experiencia del usuario y de las características de la imagen clasificada. Cuanto menor el peso y el umbral, mayor será el número de substituciones que serán realizadas.

Tópicos de Clasificación



Consulte también:
Outras técnicas de Processamento de Imagem.
Como ejecutar una Clasificación.