Agrupamento de dados por florestas de caminhos otimos
Leonardo Marques Rocha
TESE
Português
T/UNICAMP R582a
[Data clustering by optimum-path transform]
Campinas, SP : [s.n.], 2008.
94 p. : il.
Orientadores: Luis Geraldo Pedroso Meloni, Alexandre Xavier Falcão
Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação
Resumo: Esta tese propõe uma nova abordagem para agrupamento de dados baseada em floresta de caminhos ótimos. As amostras são tomadas como nós de um grafo, cujos arcos são definidos pela sua relação de adjacência. Os nós são ponderados pela seus valores de densidade de probabilidade (PDF) e uma...
Ver mais
Resumo: Esta tese propõe uma nova abordagem para agrupamento de dados baseada em floresta de caminhos ótimos. As amostras são tomadas como nós de um grafo, cujos arcos são definidos pela sua relação de adjacência. Os nós são ponderados pela seus valores de densidade de probabilidade (PDF) e uma função de conexidade que é maximizada, de forma que cada máximo na PDF torna-se uma raiz de uma árvore de caminhos ótimos (grupo), composto por amostras "mais fortemente conexas" àquele máximo que a qualquer outra raiz. Máximos irrelevantes (domos) são removidos por reconstrução morfológica da PDF. Uma discussão mostra as vantagens sobre abordagens baseadas no gradiente da PDF e suas relações com a transformada watershed. O método é estendido para grande bases de dados e comparado com as abordagens de mean-shift e watershed para agrupamento de pixels e segmentação interativa, respectivamente. Os experimentos para segmentação de imagens naturais e classificação de substâncias branca e cinza do cérebro mostram resultados rápidos e precisos comparados com métodos no estado-da-arte.
Ver menos
Abstract: This thesis proposes a novel approach for data clustering based on optimum-path forest. The samples are taken as nodes of a graph, whose arcs are defined by an adjacency relation. The nodes are weighted by their probability density values (pdf) and a connectivity function is maximized,...
Ver mais
Abstract: This thesis proposes a novel approach for data clustering based on optimum-path forest. The samples are taken as nodes of a graph, whose arcs are defined by an adjacency relation. The nodes are weighted by their probability density values (pdf) and a connectivity function is maximized, such that each maximum of the pdf becomes root of an optimum-path tree (cluster), composed by samples "more strongly connected" to that maximum than to any other root. Irrelevant maxima (domes) are removed by morphological reconstruction of the pdf. A discussion shows the advantages over aproaches based on the gradient of the pdf and its relations with the watershed transform. The method is extended for large datasets and compared to mean-shift and watershed approaches for pixel clustering and interactive segmentation, respectively. The experiments for the segmentation of natural images and automatic gray and white matter classification of the brain show fast and accurate results compared to state-of-the-art methods.
Ver menos
Ver menos
Meloni, Luís Geraldo Pedroso, 1958-
Orientador
Falcão, Alexandre Xavier, 1966-
Coorientador
Furuie, Sergio Shiguemi
Avaliador
Nascimento, Francisco Assis de Oliveira
Avaliador
Lotufo, Roberto de Alencar, 1955-
Avaliador
Iano, Yuzo, 1950-
Avaliador
Agrupamento de dados por florestas de caminhos otimos
Leonardo Marques Rocha
Agrupamento de dados por florestas de caminhos otimos
Leonardo Marques Rocha
Exemplares
Nº de exemplares: 2
Não existem reservas para esta obra