Melhoria na qualidade de dados com a aplicação de "data cleaning" na base de dados de acidentes aeronáuticos da aviação civil brasileira

Autores

  • Cleibson Aparecido de Almeida Universidade Aberta de Portugal – UAb
  • Leonardo Derckan Rodrigues Silva Instituto de Tecnologia da Aeronáutica – ITA
  • Elaine Cristina da Silva Schilipack Universidade Federal do Paraná – UFPR
  • Nivaldo Aparecido Minervi Universidade Federal do Paraná - UFPR http://orcid.org/0000-0003-0543-6295

DOI:

https://doi.org/10.5380/atoz.v5i2.47303

Palavras-chave:

Limpeza de dados, Qualidade de dados, Métodos de limpeza de dados

Resumo

Introdução: Apresenta a aplicação de técnicas de data cleaning na base de dados de acidentes aeronáuticos da aviação civil brasileira com o objetivo de mensurar o grau de melhoria na qualidade dos dados. Método: inicialmente realizou-se uma revisão de literatura sobre os conceitos de data cleaning e qualidade de dados e, em seguida, aplicaram-se as técnicas de data cleaning em uma base de dados composta por 4601 registros, referentes aos acidentes aeronáuticos ocorridos entre os anos de 1979 e 2014 na aviação civil brasileira. A medição da melhoria na qualidade dos dados foi realizada por meio da métrica “percentual de melhoria dos dados”. Resultados: Observando-se o contexto geral todos os atributos da base de dados houve uma melhoria de 9% quanto à qualidade dos dados, com atributos, como por exemplo o peso, fabricante e modelo das aeronaves, que apresentaram um grau de melhoria acima de 55% após a aplicação da metodologia. Conclusão: A técnica de data cleaning pode ser utilizada para definir políticas para a melhoria contínua em bases de dados e melhorar os processos de decisão nas organizações que tratam sobre aviação, em especial na área de segurança de voo.

Biografia do Autor

Cleibson Aparecido de Almeida, Universidade Aberta de Portugal – UAb

Graduado em Estatística - UFPR, Mestre em Engenharia de Produção -UFPR, Doutorando em Matemática
Aplicada e Modelação - UAb. Desenvolve atividades junto ao Centro de Investigação e Prevenção de Acidentes Aeronáuticos (CENIPA/FAB). 

Leonardo Derckan Rodrigues Silva, Instituto de Tecnologia da Aeronáutica – ITA

Graduado em Engenharia Civil - IESPlan, Pós-graduado em Segurança de Voo - ITA. Atualmente desenvolve atividades de coordenação junto aos órgãos internacionais no Centro de Investigação e Prevenção de Acidentes Aeronáuticos (CENIPA/FAB).

Elaine Cristina da Silva Schilipack, Universidade Federal do Paraná – UFPR

Bacharel em Estatística - UFPR. Servidora Pública com enquadramento funcional em Estatística.

Nivaldo Aparecido Minervi, Universidade Federal do Paraná - UFPR

Bacharel em Estatística - UFPR, Mestrado em Engenharia da Produção - UFPR. Professor e formador - DPRF e Ministério da Justiça.

Referências

Centro de Investigação e Prevenção de Acidentes. (2008). Relatório final a-022/cenipa/2008.

Centro de Investigação e Prevenção de Acidentes. (2009). Relatório final a-no67/cenipa/2009.

Kanki, B. G., & Seamster, T. L. (2002). Aviation information management: From documents to data. Burlington: Ashgate.

Lopes, F. P. (2006). Administração de dados: Técnicas, metodologias e ferramentas para garantir a qualidade dos dados. Recife: Universidade Federal de Pernambuco.

Oliveira, P. J., Rodrigues, F., & Henriques, P. R. (2004). Limpeza de dados: Uma visão geral. Recuperado de http://wiki.di.uminho.pt/twiki/pub/Research/Doutoramentos/SDDI2004/ArtigoOliveira.pdf

Orr, K. (1998, Feb.). Data quality and systems theory. Communications of the ACM, 41(2), 66–71. doi:10.1145/269012.269023

Pipino, L. L., Lee, Y. W., & Wang, R. Y. (2002, Apr.). Data quality assessment. Communications of the ACM, 45(4), 211–218. doi: 10.1145/505248.506010

Rahm, E., & Do, H. H. (2000). Data cleaning: Problems and current approaches. IEEE Data Engineering Bulletin, 23(4), 3–13. Recuperado de http://sites.computer.org/debull/A00dec/issue1.htm

Strong, D. M., Lee, Y. W., & Wang, R. Y. (1997, May). Data quality in context. Communications of the ACM, 40(5), 103–110. doi: 10.1145/253769.253804

Vasco, D. O. (2013). Identificação de anomalias contextuais.Porto: Universidade do Porto.

Publicado

2016-12-31

Como Citar

Almeida, C. A. de, Silva, L. D. R., Schilipack, E. C. da S., & Minervi, N. A. (2016). Melhoria na qualidade de dados com a aplicação de "data cleaning" na base de dados de acidentes aeronáuticos da aviação civil brasileira. AtoZ: Novas práticas Em informação E Conhecimento, 5(2), 72–79. https://doi.org/10.5380/atoz.v5i2.47303

Edição

Seção

Artigos