Mapas Auto-Organizáveis na Análise Exploratória
de Dados Geoespaciais Multivariados
Dissertação de Mestrado
- Marcos Aurélio Silva
Esta página apresenta a dissertação
de Mestrado de Marcos Aurélio Santos da Silva, orientada pelos Drs.
Antônio Miguel Vieira Monteiro e José Simeão de Medeiros,
defendida em março de 2004, perante uma banca formada pelos orientadores
e pelos professores: Dr.Gilberto Câmara (DPI/INPE), Dr. José
Demísio Simões da Silva (LAC/INPE), Prof. Dr. Aluizio Fausto
Ribeiro Araújo (UFPE), como parte do programa de Mestrado em Computação
Aplicada do INPE.
Resumo
Os Mapas Auto-Organizáveis têm
sido aplicados, com sucesso, em variados problemas de análise exploratória
de dados multivariados, todavia, poucos são os trabalhos voltados
para a análise de dados coletados para unidades espaciais definidas,
como os dados produzidos por censos demográficos, aqui chamados
genericamente por dados geoespaciais. Este trabalho apresenta uma metodologia
para a análise destes dados que contempla desde a verificação
de dados atípicos até a análise de dependência
espacial, fazendo uso, como ferramentas, somente do Mapa Auto-Organizável
e seus algoritmos relacionados. Pode-se dividir a metodologia em quatro
partes: detecção de dados atípicos através
da análise da matriz de distância unificada (U-matriz), análise
de componentes através dos Planos de Componentes, detecção
automática de agrupamentos através do algoritmo Costa-Netto
e análise da distribuição e dependência espaciais
a partir dos Planos de Componentes e do particionamento dos dados na etapa
anterior, respectivamente. Para a aplicação da metodologia
proposta foi projetado e implementado um ambiente computacional integrado
para análise exploratória de dados, que faz extensivo uso
de banco de dados geográfico através da biblioteca aberta
TerraLib
(terralib.dpi.inpe.br). Compõem este ambiente a biblioteca SOMLib
e o sistema CASAA - Connectionist Approach for Spatial Analysis of Areal
Data. A biblioteca SOMLib compreende um conjunto de classes em C++
projetadas a partir do uso de padrões de projeto e outras técnicas
modernas de programação, cujo objetivo é implementar
os algoritmos relacionados com os Mapas Auto-Organizáveis, de maneira
a considerar a escalabilidade, a capacidade de manutenção
do projeto e a conectividade com a biblioteca TerraLib. O sistema
CASAA é um simulador neural SOM 2-D, com interface gráfica,
desenvolvido sobre as bibliotecas SOMLib e QT para execução
das tarefas de análise exploratória de dados geoespaciais.
Para validação da metodologia e do ambiente computacional
de análise geográfica com redes SOM a mesma foi aplicada
no problema de análise de indicadores de exclusão/inclusão
social no município de São José dos Campos, São
Paulo. Os resultados desta aplicação foram comparados com
resultados anteriores, para o mesmo conjunto de dados, obtidos através
de técnicas estatísticas e mostraram que os Mapas Auto-Organizáveis
e os algoritmos relacionados são ferramentas robustas para a tarefa
de análise exploratória de dados geoespaciais.
Conteúdo
Última atualização:
17 Março 2004.