Likelihood-based inference for models with censored responses using the Student-t and skew-t distribution
Katherine Andreina Loor Valeriano
TESE
Inglês
T/UNICAMP L873L
[Inferência para modelos com respostas censuradas usando a distribuição Student-t e skew-t]
Campinas, SP : [s.n.], 2024.
1 recurso online (182 p.) : il., digital, arquivo PDF.
Orientadores: Larissa Avila Matos, Christian Eduardo Galarza Morales
Tese (doutorado) - Universidade Estadual de Campinas (UNICAMP), Instituto de Matemática Estatística e Computação Científica
Resumo: O estudo de modelos nos quais a variável de resposta está sujeita a limites de detecção, tem sido de interesse em muitas áreas da estatística. Este tipo de dados surgem frequentemente em monitoramento ambiental, medicina, economia, agronomia e biologia. A maioria dos modelos existentes na...
Ver mais
Resumo: O estudo de modelos nos quais a variável de resposta está sujeita a limites de detecção, tem sido de interesse em muitas áreas da estatística. Este tipo de dados surgem frequentemente em monitoramento ambiental, medicina, economia, agronomia e biologia. A maioria dos modelos existentes na literatura para lidar com dados censurados assume uma distribuição normal para a variável de resposta, e essa suposição pode ser irrealista na presença de desvios da normalidade ou de outliers. Neste trabalho, propomos uma série de modelos que consideram distribuições assimétricas e de caudas pesadas, como as distribuições Student-t e skew-t, para lidar com observações censuradas e/ou faltantes na variável de resposta. Os parâmetros dos modelos são estimados utilizando o algoritmo Expectation-Maximization (EM) (Dempster et al., 1977), um método amplamente utilizado para aproximar iterativamente as estimativas de máxima verossimilhança (ML). Este algoritmo exige o cálculo de algumas esperanças condicionais. Em nossos modelos, isso inclui os dois primeiros momentos das distribuições Student-t, skew-t e extended skew-t. Para calcular os momentos da distribuição Student-t, desenvolvemos um método baseado na integração de Monte Carlo, complementado por resultados derivados da esperança condicional (veja, por exemplo, Galarza et al., 2021). Além disso, quando as esperanças condicionais não podem ser derivadas de forma explícita, empregamos uma versão de aproximação estocástica do algoritmo EM, conhecido como algoritmo SAEM (Delyon et al., 1999), para a estimação dos parâmetros. Para cada modelo, também fornecemos procedimentos para aproximar o erro padrão das estimativas e expressões para prever observações futuras. As propriedades assintóticas e a robustez das estimativas são demonstradas através de estudos de simulação, e aplicações em conjuntos de dados reais são apresentadas para esses modelos
Ver menos
Abstract: The study of models where the variable of interest is subjected to threshold values below, above, or both has been the scope of many areas of the statistic. Such data frequently arise in environmental monitoring, medicine, economics, agronomy, and biology. While most of the models to deal...
Ver mais
Abstract: The study of models where the variable of interest is subjected to threshold values below, above, or both has been the scope of many areas of the statistic. Such data frequently arise in environmental monitoring, medicine, economics, agronomy, and biology. While most of the models to deal with censored data in the literature assume a normal distribution for the response variable, this assumption can be unrealistic in the presence of deviations from normality or outliers. In this work, we propose a series of models considering asymmetric and heavy-tailed distributions, such as the Student-t and skew-t distributions, to handle censored and missing observations in the response variable. The parameters of the models are estimated using the Expectation-Maximization (EM) algorithm (Dempster et al., 1977), a widely used method for iteratively approximating the maximum likelihood (ML) estimates. This algorithm requires the computation of certain conditional expectations, specifically for our models, the first two moments from the Student-t, skew-t, and extended skew-t distributions. To compute these moments from the Student-t distribution, we develop a method based on Monte Carlo integration and results derived from the conditional distribution (see, for instance, Galarza et al., 2021). Additionally, when conditional expectations cannot be derived in a closed form, we employ a variation of the EM algorithm, known as the Stochastic Approximation EM (SAEM) algorithm (Delyon et al., 1999), for parameter estimation. For each model, we also provide procedures to approximate the standard error of the estimates and expressions for predicting future observations. The asymptotic properties and robustness of the estimates are demonstrated through simulation studies, and applications to real datasets are presented for these models
Ver menos
Aberto
Matos, Larissa Avila, 1987-
Orientador
Galarza Morales, Christian Eduardo, 1988-
Coorientador
Vilca Labra, Filidor Edilfonso, 1964-
Avaliador
Motta, Mariana Rodrigues, 1975-
Avaliador
Cabral, Celso Rômulo Barbosa
Avaliador
Prates, Marcos Oliveira
Avaliador
Likelihood-based inference for models with censored responses using the Student-t and skew-t distribution
Katherine Andreina Loor Valeriano
Likelihood-based inference for models with censored responses using the Student-t and skew-t distribution
Katherine Andreina Loor Valeriano