Os tópicos mostrados aquí son
·
Post-Clasificación (eliminar pixels aislados)
Vea
como ejecutar una Clasificación en SPRING.
Consulte
también:
Otras técnicas de Procesamiento de Imagen.
Como ejecutar una Clasificación.
Opciones en el menu Imágenes de
SPRING
Una clasificación es el proceso de extracción de información en
imágenes para
reconocer patrones y objetos homogéneos.
Los métodos de clasificación se utilizan para mapear áreas de
la superficie
terrestre que presentan un significado igual en imágenes
digitales.
Una información espectral de una escena puede ser representada
por una
imagen espectral, donde cada "pixel" tiene las coordenadas
espaciales
x, y además de la coordenada espectral L,
que representa
la radiancia de un albo en el intervalo de longitud de onda de
una banda
espectral. Cada "pixel" de una banda posee una correspondencia
espacial con otro "pixel", en todas las otras bandas, o sea,
para una
imagen de K bandas, existen K niveles de gris asociados a cada
"pixel" siendo uno para cada banda espectral.
El conjunto de características espectrales de un "pixel" es
denotado por el término atributos espectrales.
Conforme el proceso de clasificación utilizado, los
clasificadores pueden
ser divididos en clasificadores "pixel a pixel" y clasificadores
por
regiones.
Clasificadores
"pixel a
pixel" utilizan sólo la información espectral aislada de
cada pixel
para encontrar regiones homogéneas. Estos clasificadores pueden
ser divididos
en métodos estadísticos (que utilizan reglas de la teoría de
probabilidad) y
métodos determinísticos.
Clasificadores por regiones utilizan, además de la información espectral de cada "pixel", la información espacial que envuelve la relación entre los "pixels" y sus vecinos. Estos clasificadores buscan simular el comportamiento de un fotointérprete, al reconocer áreas homogéneas en imágenes, basados en las propiedades espectrales y espaciales de dichas imágenes. La información de bordes es utilizada inicialmente para separar regiones, las propiedades espaciales y espectrales servirán para unir áreas con la misma textura.
El resultado de una clasificación digital se representa por clases espectrales (áreas que poseen características espectrales semejantes), por ejemplo: la cartografía de uso del suelo urbano a través de una imagen multiespectral. El usuario puede tener interés en mapear áreas, residenciales e industriales y estas clases difícilmente son caracterizadas por una única firma espectral (representa un vector de dimensión igual al número de bandas, cuyas coordenadas son medidas de radiancia), debido a los diferentes tipos de albos presentes como vegetación, construcciones, pavimento, entre otros.
Frente a esta dificultad, en una clasificación, el usuario debe
considerar
la relación entre la respuesta espectral de los albos y la clase
que desea
mapear.
El resultado final de un proceso de clasificación es una imagen
digital que
constituye un mapa de "pixels" clasificados, representados por
símbolos gráficos o colores.
El proceso de clasificación digital transforma un gran número
de niveles de
gris en cada banda espectral en un pequeño número de clases en
una única banda.
Las técnicas de clasificación que pueden ser aplicadas a un
sólo canal
espectral (banda de la imagen), son conocidas como clasificaciones
unidimensionales.
Las técnicas en las que el criterio de decisión depende de la
distribución
de niveles de gris en varios canales espectrales son definidas
como técnicas de
clasificación multiespectral.
Las técnicas de clasificación multiespectral "pixel a pixel"
más
comunes son: máxima verosimilitud (MAXVER), distancia mínima y
método del
paralelepípedo (no implementado en esta versión del SPRING).
El primer paso en un proceso de clasificación multiespectral es
el
entrenamiento. Se entiende por entrenamiento el reconocimiento
de la firma
espectral de las clases.
Existen básicamente dos formas de entrenamiento: supervisado y
no
supervisado.
Cuando existen regiones de la imagen en las que el usuario
dispone de
informaciones que permiten la identificación de una clase de
interés, el
entrenamiento es denominado supervisado.
Para un entrenamiento supervisado el usuario debe identificar
en la imagen
un área representativa de cada clase. Es importante que el área
de
entrenamiento sea una muestra homogénea de la respectiva clase,
pero al mismo
tiempo se deben incluir todas las variabilidades de los niveles
de gris.
Se recomienda que el usuario adquiera más de un área de
entrenamiento,
utilizando el mayor número de informaciones disponibles, como
trabajos de
campo, mapas, entre otros.
Para la obtención de clases estadísticamente confiables, son
necesarios de
10 a 100 "pixels" de entrenamiento por cada clase. El número de
"pixels" de entrenamiento necesario para la precisión del
reconocimiento de una clase, aumenta en función de la
variabilidad entre las
clases.
La figura a seguir ilustra como el usuario debe seleccionar las
áreas, en el
entrenamiento supervisado.
Cuando el usuario utiliza algoritmos para reconocer las clases
presentes en
la imagen, el entrenamiento es denominado no supervisado.
Al definir
áreas para el entrenamiento no supervisado, el usuario no se
debe preocupar con
la homogeneidad de las clases. Las áreas seleccionadas deben ser
heterogéneas para
asegurar que todas las posibles clases y sus variaciones sean
incluidas.
La figura a continuación ilustra la forma como el usuario debe
seleccionar
las áreas, en el entrenamiento no supervisado.
Los "pixels" dentro de un área de entrenamiento son sometidos a un algoritmo de agrupamiento ("clustering") que determina el grupo al cual pertenece el dato, en un espacio de dimensión igual al número de bandas presentes. Este algoritmo asume que cada grupo ("cluster") representa la distribución de probabilidad de una clase.
El Spring dispone de tres clasificadores del tipo pixel a pixel, que serán mostrados a continuación:
MAXVER , viene del método estadístico
de Máxima
Verosimilitud, y es el método de clasificación "pixel
a
pixel" más común. Considera la ponderación de las distancias
entre medias
de los niveles digitales de las clases, utilizando parámetros
estadísticos.
Para que la clasificación por máxima verosimilitud sea
suficientemente
precisa, es necesario un número razonablemente elevado de
"pixels",
para cada conjunto de entrenamiento.
Los conjuntos de entrenamiento definen el diagrama de
dispersión de las
clases y sus distribuciones de probabilidad, considerando cada
clase del entrenamiento
como una distribución de probabilidad normal.
Se presentan dos clases (1 y 2) con distribución de
probabilidad distintas.
Estas distribuciones representan la probabilidad de un "pixel"
de
pertenecer a una u otra clase, dependiendo de la posición del
"pixel"
con relación a cada distribución.
Se observa una región donde las dos curvas se sobreponen,
indicando que un
determinado "pixel" tiene igual probabilidad de pertenecer a las
dos
clases. En esta situación se establece un criterio de decisión a
partir de la
definición de umbrales.
Los límites de clasificación son definidos a partir de puntos
de igual
probabilidad de clasificación de una y de otra clase.
La figura a seguir presenta el límite de aceptación de una clasificación, en el punto donde las dos distribuciones se cruzan. De esta forma, un "pixel" localizado en la región sombreada, a pesar de pertenecer a la clase 2, será clasificado como perteneciente a la clase 1, por el limite de aceptación establecido.
El umbral de aceptación indica el porcentaje de "pixels" de la
distribución de probabilidad de una clase, que será clasificado
como
perteneciente a dicha clase. Un umbral de 99%, por ejemplo,
engloba 99% de los
"pixels", (el 1% de los pixel que tengan menor probabilidad
serán
ignorados), compensando la posibilidad de algunos "pixels" haber
sido
introducidos durante el entrenamiento por engaño en esta clase,
o están en el
límite entre dos clases. Un umbral de 100% resultará en una
imagen clasificada
sin rechazos, o sea, todos los "pixels" serán clasificados.
Para disminuir la confusión entre las clases, o sea, reducir la
superposición
entre las distribuciones de probabilidads de las clases, se
aconseja la
adquisición de muestras significativas de albos distintos y la
evaluación de la
matriz de clasificación de las muestras.
La matriz de clasificación presenta la distribución del
porcentaje de
"pixels" clasificados correcta e incorrectamente. En el ejemplo
a
seguir, se presenta una matriz de clasificación con los
porcentajes de 4 clases
definidas en la adquisición de muestras, los valores de
desempeño medio,
abstención (aún sin ser clasificado) y confusión media.
El valor de N representa la cantidad de cada clase (en
porcentaje de
"pixels") que no fue clasificada.
La clase 1 corresponde a bosque, la clase 2 a sabana, la clase
3 a río y la
clase 4 a deforestación.
|
N |
1 |
2 |
3 |
4 |
1 |
4.7 |
94.3 |
0 |
0 |
0.9 |
2 |
1.1 |
0 |
82.3 |
0 |
16.6 |
3 |
0 |
13.3 |
0 |
86.7 |
0 |
4 |
3.8 |
0 |
4.7 |
0 |
91.5 |
Desempeño medio: 89,37
Abstención media: 3,15
Confusión media: 7,48
Una matriz de clasificación ideal debe presentar los valores de
la diagonal
principal próximos a 100%, indicando que no hubo confusión entre
las clases.
Sin embargo, esta es una situación difícil de ocurrir en
imágenes con albos de
características espectrales semejantes.
El valor fuera de la diagonal principal, por ejemplo 13,3
(clase línea 3 y
columna 1), significa que 13,3% del área de la clase "río" fue
clasificada como perteneciente a la clase 1 (bosque). El mismo
raciocinio debe
ser adoptado para los otros valores.
Para disminuir la confusión entre las clases, se aconseja el
análisis de las
muestras.
La tabla a continuación presenta el análisis de las muestras
adquiridas para
la clase bosque.
|
Muestras |
1 |
2 |
3 |
Clases |
|
|
|
|
Bosque |
|
90 |
50 |
87 |
Sabana |
|
5 |
50 |
0 |
Río |
|
5 |
0 |
0 |
Deforestación |
|
0 |
0 |
10 |
Los valores en porcentaje indican que en la muestra 1, 90% de los "pixels" son clasificados como bosque, 5% como sabana y 5% como río, lo que resulta en una muestra confiable. Por su vez, la muestra 2 presentó una confusión de 50% entre las clases bosque y sabana, indicando que dicha muestra debe ser eliminada.
Mientras el clasificador MAXVER asocia clases
considerando
puntos individuales de la imagen, el clasificador MAXVER-ICM
(Interated
Conditional Modes) considera también la dependencia espacial en
la
clasificación.
En una primera fase, la imagen es clasificada por el algoritmo
MAXVER
atribuyendo clases a los "pixels", considerando los valores de
niveles digitales. En la fase siguiente, se lleva en
consideración la
información contextual de la imagen, o sea, la clase atribuida
depende tanto
del valor observado en ese "pixel", como de las clases
atribuidas a
sus vecinos.
El algoritmo atribuye clases a un determinado "pixel",
considerando la vecindad interactivamente. Este proceso finaliza
cuando es
alcanzado el porcentaje de cambios (porcentaje de "pixels" que
son
reclasificados) definido previamente por el usuario.
El SPRING ofrece al usuario las opciones de 5%, 1% y 0,5% para
valores de
porcentaje de cambios. Un valor de 5% significa que la
reatribución de clases a
los "pixels" es interrumpida cuando fue alterado el 5% o menos
del
total de "pixels" de la imagen.
El método de clasificación por distancia
Euclidiana es un
procedimiento de clasificación supervisada que utiliza esta
distancia para
asociar un "pixel" a una determinada clase.
En el entrenamiento supervisado, se definen los agrupamientos
que
representan las clases.
En la clasificación, cada "pixel" será incorporado a un grupo,
a
través del análisis de la medida de similitud de distancia
Euclidiana, la cual
es dada por:
d (x,m) = (x2 - m2) 1/2
donde:
x = "pixel" que está siendo probado
m = media de un grupo
N = número de bandas espectrales
El clasificador compara la distancia Euclidiana del "pixel" a la
media de cada grupo.
El "pixel" será incorporado al grupo que presenta la menor
distancia Euclidiana. Este procedimiento es repetido hasta que
toda la imagen
sea clasificada.
Isoseg
O clasificador Isoseg es un dos algoritmos disponibles no Spring para clasificar regiones de una imagen segmentada. es un algoritmo de agrupamiento de dados no-supervisado, aplicado sobre el conjunto de regiones, que por su vez son caracterizadas por sus atributos estadísticos de media, matriz de covariancia, e también por el área.
Um algoritmo de "clustering" não supone ningún conocimiento previo da distribución de densidad de probabilidad dos temas, como ocurre no algoritmo de máxima verosimilitud. es una técnica para Clasificación que procura agrupar regiones, a partir de una medida de semejanza entre ellas. A medida de semejanza utilizada consiste na distancia de Mahalanobis entre a clase e as regiones candidatas a relación de pertenencia con esta clase.
O Isoseg utiliza os atributos estadísticos das regiones: a matriz de covariancia e el vector de media, para estimar el valor central de cada clase. Este algoritmo resume-se em tres etapas, descritas a seguir.
(1ª) Definición do limiar: el usuário define un limiar de aceitação, dado em percentagem. Este limiar por su vez define una distancia de Mahalanobis, de forma que todas regiones pertencentes a una dada clase estão distantes da clase por una distancia inferior a esta. Quanto maior el limiar, maior esta distancia e consequentemente menor será el número de clases detectadas pelo algoritmo.
(2ª) Detección das clases: as regiones son ordenadas em ordem decrescente de área e inicia-se el procedimento para agrupá-las em clases. Serão tomados como parâmetros estadísticos de una clase (media e matriz de covariancia), os parâmetros estadísticos da região de maior área que ainda não tenha sido associada a clase alguma. Em seguida, associa-se a esta clase todas regiones cuja distancia de Mahalanobis for inferior a distancia definida pelo limiar de aceitação.
Assim, a primeira clase terá como parâmetros estadísticos aquelas regiones con maior área. As clases seguintes terão parâmetros estadísticos de media das regiones de maior área, que não tenham sido associada a nenhuma das clases previamente detectadas. Esta fase repete-se até que todas regiones tenham sido associadas a alguma clase.
(3ª) Competición entre clases: as regiones son reclasificadas, considerando-se os novos parâmetros estadísticos das clases, definidos na etapa anterior.
A fase 2 consiste basicamente na detección de clases, sendo un proceso seqüencial que pode favorecer as clases que son detectadas em primeiro lugar. con vista a eliminar este favorecimento", procede-se a "competición entre clases. Esta competición consiste em reclasificar todas as regiones. el parâmetro estatístico (media de cada clase es então recalculado. el proceso repete-se até que a media das clases não se altere (convergência).
Ao término, todas regiones estarão associadas á una clase definida pelo algoritmo. el usuário deverá então associar estas clases (denominadas temas, no Spring) às clases por ele definidas no banco de dados, na opción Arquivo-Esquema Conceitual.
Battacharya
A medida da distancia de Battacharya es usada neste classficador por regiones, para medir a separabilidade estatística entre un par de clases espectrais. Ou seja, mede a distancia media entre as distribuições de probabilidads de clases espectrais.
O princípio es análogo ao utilizado para el clasificador Isoseg, porém a medida de distancia usada es a distãncia de Battacharya. ( ver mais detalhes em Paul M. Mather, 1993).
O clasificador Battacharya, ao contrário do Isoseg que es automático, requer interación do usuário, através do treinamento. Neste caso, as amostras serão as regiones formadas na segmentación de imágenes.
ClaTex
O clasificador ClaTex es un algoritmo supervisado que utiliza atributos texturais das regiones de una imagen segmentada para efetuar a Clasificación por regiones. A Clasificación es realizada por el técnica de agrupamiento de regiones a partir de una medida de semejanza entre elas. E a medida de semejanza utilizada consiste na distancia de Mahalanobis entre a clase de interesse e as regiones candidatas à relación de pertenencia con esta clase. Portanto, cada região será clasificada a una dada clase de interesse baseada na minimización da distancia de Mahalanobis.
O conjunto de medidas texturais que pode ser utilizado por este clasificador es dividido em 5 (cinco) grupos:
As etapas a serem seguidas para a realización de una Clasificación con el algoritmo ClaTex son similares àquelas apresentadas para un clasificador supervisado. Entretanto, existem duas diferenças básicas acrescidas ao ClaTex que podem ser resumidas como segue:
E por fim realiza-se a etapa de Clasificación propriamente dita, baseada na distancia de Mahalanobis, gerando-se una imagen clasificada.
Antes de presentar los procedimientos para realizar una clasificación, se describe la secuencia lógica de operaciones a ser seguida:
1. Criar el arquivo de Contexto - este archivo almacena cuáles serán las bandas que formarán parte del proceso de clasificación, cuál será el método a utilizar (pixel o región) y en el caso de la clasificación por pixel, también almacenará las muestras;
2. Ejecutar el treinamento – deben se hechos muestreos sobre una imagen del área de visualización con muestras rectangulares o poligonales;
3. Analisar as amostras - permite verificar la validez de las muestras colectadas;
4. Ejecutar a Clasificación - de acuerdo con las muestras y las bandas seleccionadas es clasificada la imagen;
5. Ejecutar una Pós-clasificación - proceso de extracción de pixels aislados en función de un umbral y un peso definidos por el usuario (no obligatorio);
6. Ejecutar el Mapeamento para Clases - lo que permite transformar la imagen clasificada (categoría Imagen) en un mapa temático raster (categoría Temático). NOTA: En caso de clasificación por regiones, las muestras serán las propias regiones.
O usuário deve seguir os seguintes passos para gerar una Clasificación a partir de una imagen segmentada:
1. Criar
una imagen segmentada - gerar una imagem, separada
em regiones con base
na análise dos níveis de cinza.
2. Criar el
arquivo de
Contexto - este arquivo armazena quais as bandas
farão parte do proceso
de Clasificación por regiones.
3. Extracción
de regiones:
neste procedimento el algoritmo extrai as informações
estatísticas de media
e variável de cada região, considerando as bandas indicadas no
contexto;
4. Ejecutar
el treinamento
- deve ser feita amostragens sobre una imagen na
área de desenho;
5. Analisar
as amostras -
permite verificar a validade das amostras coletadas;
6. Clasificación
- para
a realizar a Clasificación de una imagen segmentada deve-se usar
el clasificador
por regiones;
7. Ejecutar
el Mapeamento
para Clases - permite transformar a imagen
clasificada (categoria
Imagem) para un mapa temático raster (categoria Temático).
Este procedimiento se aplica a una imagen
clasificada, con
el objetivo de hacer más uniformes los temas, o sea, eliminar
puntos aislados o
clasificados diferente de su vecindad. Con esto, se genera una
imagen
clasificada que presenta menos ruido.
En una ventana de 3 x 3 "pixels", el punto central es evaluado
con
relación a la frecuencia de las clases (temas), en su vecindad.
De acuerdo con
los valores de peso y umbral definidos por el usuario, este
punto central podrá
tener su clase substituida por la clase de mayor frecuencia en
la vecindad.
El peso varía de 1 a 7 y define el número de veces que
será
considerada la frecuencia del punto central.
El umbral varía también de 1 a 7 y corresponde al valor
de frecuencia
por encima del cual será modificado el punto central.
Por ejemplo, para la ventana de una imagen clasificada (cada
número
representa el color de una clase): será evaluado el "pixel"
central
perteneciente a la clase 2.
3 |
3 |
1 |
5 |
2 |
3 |
5 |
5 |
5 |
Si se considera un peso y un umbral iguales a 3, se
obtiene la siguiente frecuencia de clases:
Clase |
1 |
2 |
3 |
5 |
Frecuencia |
1 |
3 |
3 |
4 |
La tabla anterior indica que la clase 1 ocurre una vez; la
clase 3 ocurre
tres veces y la clase 5, cuatro veces. La frecuencia de la clase
2 es
considerada 3, por el hecho de que el peso definido para el
punto central es 3.
Un umbral igual a 3 hace que el punto central (perteneciente a
la clase 2)
sea atribuido a la clase 5, cuya frecuencia (4) es mayor que la
del umbral
definido.
La ventana clasificada con los temas homogeneizados será:
3 |
3 |
1 |
5 |
5 |
3 |
5 |
5 |
5 |
La definición del peso y el umbral dependerá de la experiencia del usuario y de las características de la imagen clasificada. Cuanto menor el peso y el umbral, mayor será el número de substituciones que serán realizadas.
Consulte
también:
Outras técnicas de Processamento de
Imagem.
Como ejecutar una Clasificación.