COMPARAÇÃO ENTRE MÉTODOS DE IMPUTAÇÃO DE DADOS EM DIFERENTES INTENSIDADES AMOSTRAIS NA SÉRIE DE PRECIPITAÇÃO PLUVIAL DA ESALQ
Resumo
Um problema frequente nas análises estatísticas de informações climatológicas é a ocorrência de dados faltantes, assim, o objetivo deste trabalho foi comparar três métodos de imputação de dados com observações da série de precipitação pluvial de uma estação climatológica convencional, no município de Piracicaba-SP, no período de 1917 a 1997, em diferentes intensidades amostrais (5%, 10% e 15%) de informações faltantes, geradas de forma aleatória. Para o “preenchimento” dessas informações, foram usados três métodos de imputação múltipla: PMM (Predictive Mean Matching), random forest e regressão linear, via método bootstrap, em cada intensidade amostral de informações faltantes. A comparação entre cada procedimento de imputação foi feita, por meio da raiz do erro quadrático médio, índice de acurácia de Willmott e o índice de desempenho. O método, que resultou em menores valores da raiz quadrada dos erros e maiores índices de desempenho e acurácia, foi o PMM, em especial, na intensidade de 10% de informações faltantes. O índice de desempenho, para os três métodos de imputação de dados, em todas as intensidades de observações faltantes, foi considerado insatisfatório, por isso, é necessária uma atenção maior quando se trata de observações tão variáveis espacialmente e temporalmente quanto as chuvas.
Palavras-chave
Texto completo:
PDFDOI: http://dx.doi.org/10.5380/rbclima.v29i0.77338
Direitos autorais 2021 Suelen Cristina Gasparetto, Sônia Maria De Stefano Piedade, Luiz Roberto Angelocci, Vitor Augusto Ozaki
Prezados leitores, informamos que a Revista Brasileira de Climatologia encontra- disponível no seguinte endereço: https://ojs.ufgd.edu.br/index.php/rbclima
