Open Journal Systems

COMPARAÇÃO ENTRE MÉTODOS DE IMPUTAÇÃO DE DADOS EM DIFERENTES INTENSIDADES AMOSTRAIS NA SÉRIE DE PRECIPITAÇÃO PLUVIAL DA ESALQ

Suelen Cristina Gasparetto, Sônia Maria De Stefano Piedade, Luiz Roberto Angelocci, Vitor Augusto Ozaki

Resumo


Um problema frequente nas análises estatísticas de informações climatológicas é a ocorrência de dados faltantes, assim, o objetivo deste trabalho foi comparar três métodos de imputação de dados com observações da série de precipitação pluvial de uma estação climatológica convencional, no município de Piracicaba-SP, no período de 1917 a 1997, em diferentes intensidades amostrais (5%, 10% e 15%) de informações faltantes, geradas de forma aleatória. Para o “preenchimento” dessas informações, foram usados três métodos de imputação múltipla: PMM (Predictive Mean Matching), random forest e regressão linear, via método bootstrap, em cada intensidade amostral de informações faltantes. A comparação entre cada procedimento de imputação foi feita, por meio da raiz do erro quadrático médio, índice de acurácia de Willmott e o índice de desempenho. O método, que resultou em menores valores da raiz quadrada dos erros e maiores índices de desempenho e acurácia, foi o PMM, em especial, na intensidade de 10% de informações faltantes. O índice de desempenho, para os três métodos de imputação de dados, em todas as intensidades de observações faltantes, foi considerado insatisfatório, por isso, é necessária uma atenção maior quando se trata de observações tão variáveis espacialmente e temporalmente quanto as chuvas.


Palavras-chave


Precipitação; Imputação múltipla; MICE; Comparação de métodos.

Texto completo:

PDF


DOI: http://dx.doi.org/10.5380/rbclima.v29i0.77338