USO DO ALGORITMO "FLORESTA ALEATÓRIA" NA IDENTIFICAÇÃO DO COMPORTAMENTO DA POPULAÇÃO NA BUSCA POR SERVIÇOS DE SAÚDE APÓS O INÍCIO DA PANDEMIA DO NOVO CORONAVÍRUS

Autores

DOI:

https://doi.org/10.5380/atoz.v11i0.84017

Palavras-chave:

Floresta Aleatória, Mineração de Dados, Covid-19, Tarefa de Classificação.

Resumo

Introdução: A mineração de dados é uma das cinco etapas do Knowledge Discovery in Databases (KDD), ou Descoberta de Conhecimento em Banco de Dados, e pode ser aplicada em diversas áreas do conhecimento, incluindo a saúde. As preocupações e esforços com a saúde pública vêm ganhando maior relevância, uma vez que o mundo todo vem sofrendo com o enfrentamento da pandemia do novo coronavírus, principalmente em países subdesenvolvidos e em desenvolvimento, como é o caso do Brasil e outras nações do continente americano. Método: Visando contribuir para a área, o objetivo deste estudo foi aplicar um algoritmo classificador para identificar o comportamento da população na busca por serviços de saúde após o início da pandemia do novo coronavírus. A base de dados utilizada foi a Premise General Population Covid-19 Health Services Disruption Survey 2020, oriunda do projeto Covid-19 Health Services Disruption Survey 2020. Resultados: Utilizando o algoritmo Floresta Aleatória, obteve-se 87,5% de acurácia na classificação de pessoas que irão ou não recorrer a serviços de saúde em países americanos Conclusão: Verificou-se que atributos sociodemográficos foram importantes na identificação destas pessoas, principalmente a quantidade de moradores em uma residência, etnia, religião, situações empregatícia e financeira. O modelo desenvolvido e os resultados alcançados podem ser usados para auxiliar autoridades de países americanos no planejamento de políticas públicas de saúde.

Biografia do Autor

Vinicius Matheus Pimentel Ariza, Universidade Tecnológica Federal do Paraná (UTFPR), Londrina, Paraná

Estudante de Engenharia de Produção na UTFPR.

Mateus Miranda do Nascimento, Universidade Tecnológica Federal do Paraná (UTFPR), Londrina, Paraná

Estudante de Engenharia de Produção na UTFPR.

Pedro Picolo Malandrino, Universidade Tecnológica Federal do Paraná (UTFPR), Londrina, Paraná

Estudante de Engenharia de Produção na UTFPR.

Bruno Samways dos Santos, Universidade Tecnológica Federal do Paraná (UTFPR), Londrina, Paraná

Graduado em Engenharia de Produção com ênfase em Controle e Automação pela Universidade Tecnológica Federal do Paraná, Campus Ponta Grossa (UTFPR-PG), mestre em Engenharia de Produção pela mesma universidade e doutor em Engenharia de Produção e Sistemas pela Pontifícia Universidade Católica do Paraná (PUCPR). É professor efetivo do Departamento de Engenharia de Produção da Universidade Tecnológica Federal do Paraná do Campus Londrina (UTFPR - LD) e desempenha o cargo de Coordenador Substituto do Curso de Engenharia de Produção.

Referências

Aggarwal, C.C. (2015) Data Classification in Data Mining. Springer, Cham, 285-344.

Amorim, B.S.P. (2019) et al. Uso de Aprendizado de Máquina para Classificação de Risco de Acidentes em Rodovia. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Campina Grande, Paraíba, Brasil.

Armocida, B. et al (2020). The Italian health system and the COVID-19 challenge. The Lancet Public Health, 5(5), 253.

Azambuja, C. R. C. D (2014). "Importância das medidas de gestão no controle da superlotação hospitalar."

Bramer, M. (2016). Data for data mining. In Principles of data mining. Springer, London, 9-19.

Breiman, L. (2001). Random forests. Machine learning, 45(1), 5-32.

Dantas, D., Donadia, E. Comparação entre as técnicas de regressão logística, árvore de decisão, bagging e random forest aplicadas a um estudo de concessão de crédito. 2013. Trabalho de Conclusão de Curso (Graduação em Estatística) - Universidade Federal do Paraná, Curitiba, 2013. Retirado de http://www.coordest.ufpr.br/wp-content/uploads/2018/12/TCC_DanielEricson.pdf

Fayyad, U.M., Piatetsky-Shapiro, G., Smyth, P., Uthurusamy, R (1996). Advances in Knowledge Discovery & Data Mining.. American Association for Artificial Intelligence, Menlo Park, California, 1(1).

Ganz, N. B., Ares, A. E., & Kuna, H. D (2020). Predicting Dental Implant Failures By Integrating Multiple Classifiers. Revista de Ciencia y Tecnología: RECyT, 13-23.

Goldschmidt, R., Passos, E. & Bezerra, E. (2015). Data Mining. Elsevier Brasil.

Institute for Health Metrics and Evaluation (IHME), Bill and Melinda Gates Foundation (BMGF), Premise Data Corporation. Premise General Population COVID-19 Health Services Disruption Survey 2020. Seattle, United States of America: Institute for Health Metrics and Evaluation (IHME), 2020. Retirado de http://ghdx.healthdata.org/record/ihme-data/premise-general-population-covid-19-health-services-disruption-survey-2020

Larose, D.T, Larose, C.D (2014). Discovering knowledge in data: an introduction to data mining. John Wiley & Sons.

Nunes, L. S. D. A (2018). Identificação E Reconhecimento De Padrões De Consumo De Energia Elétrica.

Python Software Foundation (PSF). Python. (2021). Retirado de https://www.python.org/

Raschka, S. (2015). Python machine learning. Packt publishing ltd.

Rocha, D. S. C. (2018). Aprendizado De Máquina Aplicado Ao Reconhecimento Automático De Falhas Em Máquinas Rotativas.

Severino, M. K., Peng, Y (2021). Machine Learning Algorithms For Fraud Prediction In Property Insurance: Empirical Evidence Using Real-World Microdata. Machine Learning with Applications.

Downloads

Publicado

2023-01-12

Como Citar

Ariza, V. M. P., Miranda do Nascimento, M., Picolo Malandrino, P., & dos Santos, B. S. (2023). USO DO ALGORITMO "FLORESTA ALEATÓRIA" NA IDENTIFICAÇÃO DO COMPORTAMENTO DA POPULAÇÃO NA BUSCA POR SERVIÇOS DE SAÚDE APÓS O INÍCIO DA PANDEMIA DO NOVO CORONAVÍRUS. AtoZ: Novas práticas Em informação E Conhecimento, 11, 1–15. https://doi.org/10.5380/atoz.v11i0.84017

Edição

Seção

Artigos