Comparação de metodos na estimação do vicio da razão de erro aparente
DISSERTAÇÃO
Português
T/UNICAMP R277c
Campinas, SP : [s.n.], 1987.
94 f.
Orientador: Ademir Jose Petenate
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação
Resumo: Na teoria de discriminação e classificação, a Razão de Erro Real associada a uma função de classificação, é dada pelas probabilidades de má classificação, e é usada para estudar o desempenho da função de classificação. Para o cálculo da Razão de Erro Real é necessário o conhecimento das...
Resumo: Na teoria de discriminação e classificação, a Razão de Erro Real associada a uma função de classificação, é dada pelas probabilidades de má classificação, e é usada para estudar o desempenho da função de classificação. Para o cálculo da Razão de Erro Real é necessário o conhecimento das distribuições populacionais que estão envolvidas no problema. Existe uma vasta literatura à respeito da estimação da Razão de Erro Real. Em nosso trabalho, nós utilizaremos o estimador Razão de Erro Aparente que é um método comumente usado em outros trabalhos. Estudos mostram que este subestima a Razão de Erro Real. O objetivo de nosso trabalho é estudar o vício do estimador Razão de Erro Aparente, num contexto de comparar três métodos de estimação, sendo que dois métodos são não paramétricos, o "bootstrap" proposto por Efron e o "cross-validation". O terceiro é um método paramétrico proposto por Mclachlan. A comparação foi feita sob condição do conhecimento das distribuições populacionais. Amostras de duas populações normais multivariadas com diferentes vetores de médias e matrizes de covariâncias iguais à identidade, foram geradas por processo de simulação de Monte Carlo. A conclusão de nossos estudos é que, o método "bootstrap" mostrou-se eficiente na estimação do vício da Razão de Erro Aparente tanto quanto o estimador paramétrico, sabendo que, este último é condicionado ao conhecimento das distribuições populacionais para a sua validade. Este trabalho está dividido em quatro capítulos. A teoria de classificação e discriminação, utilizando o método de Fisher para a construção de regras de classificação, é vista no capítulo 1. O capítulo 2 apresenta uma pesquisa bibliográfica com os métodos de estimação da probabilidade de má classificação. O procedimento de vários métodos assim como o método R, usado para obter o estimador da Razão de Erro Aparente, também são desenvolvidos. A comparação feita entre os métodos de estImação do vício da Razão de Erro Aparente é vista no capítulo 3, com a descrição dos métodos "bootstrap", "cross-validation" e o "paramétrico" e também a metodologia de nosso trabalho e os resultados experimentais. Finalmente, no capítulo 4, apresenta-se as conclusões do nosso trabalho.
Abstract: Not informed.