Application of data cleaning to improve data quality at the Brazilian Civil Aviation Aircraft Accidents Database

Authors

  • Cleibson Aparecido de Almeida Universidade Aberta de Portugal – UAb
  • Leonardo Derckan Rodrigues Silva Instituto de Tecnologia da Aeronáutica – ITA
  • Elaine Cristina da Silva Schilipack Universidade Federal do Paraná – UFPR
  • Nivaldo Aparecido Minervi Universidade Federal do Paraná - UFPR http://orcid.org/0000-0003-0543-6295

DOI:

https://doi.org/10.5380/atoz.v5i2.47303

Keywords:

Data cleansing, Data quality, Data cleansing methods

Abstract

Introduction: It shows the application of techniques of data cleaning in the aeronautical accidents of brazilian civil aviation with the aim of measuring the degree of improvement in the quality of the data. Method: Initially, there was a literature review on the concepts of data cleaning and data quality, and then applied the techniques of data cleaning in a database composed of 4601 records, relating to aviation accidents that occurred between the years of 1979 and 2014 in brazilian civil aviation. The measurement of the improvement in the quality of the data was performed using the metric "percent of improvement of data". Results: Observing the general context all the attributes of the database there was a 9% improvement on the quality of the data, with attributes, such as weight, manufacturer and model of the aircraft, which had a degree of improvement over 55% after application of the methodology. Conclusion: The data cleaning technique can be used to define policies for continuous improvement in data bases and improve decision-making processes in organizations that deal with aviation, particularly in the area of flight safety.

Author Biographies

Cleibson Aparecido de Almeida, Universidade Aberta de Portugal – UAb

Graduado em Estatística - UFPR, Mestre em Engenharia de Produção -UFPR, Doutorando em Matemática
Aplicada e Modelação - UAb. Desenvolve atividades junto ao Centro de Investigação e Prevenção de Acidentes Aeronáuticos (CENIPA/FAB)

Leonardo Derckan Rodrigues Silva, Instituto de Tecnologia da Aeronáutica – ITA

Graduado em Engenharia Civil - IESPlan, Pós-graduado em Segurança de Voo - ITA. Atualmente desenvolve atividades de coordenação junto aos órgãos internacionais no Centro de Investigação e Prevenção de Acidentes Aeronáuticos (CENIPA/FAB)

Elaine Cristina da Silva Schilipack, Universidade Federal do Paraná – UFPR

Bacharel em Estatística - UFPR. Servidora Pública com enquadramento funcional em Estatística

Nivaldo Aparecido Minervi, Universidade Federal do Paraná - UFPR

Bacharel em Estatística - UFPR, Mestrado em Engenharia da Produção - UFPR. Professor e formador - DPRF e Ministério da Justiça

References

Centro de Investigação e Prevenção de Acidentes. (2008). Relatório final a-022/cenipa/2008.

Centro de Investigação e Prevenção de Acidentes. (2009). Relatório final a-no67/cenipa/2009.

Kanki, B. G., & Seamster, T. L. (2002). Aviation information management: From documents to data. Burlington: Ashgate.

Lopes, F. P. (2006). Administração de dados: Técnicas, metodologias e ferramentas para garantir a qualidade dos dados. Recife: Universidade Federal de Pernambuco.

Oliveira, P. J., Rodrigues, F., & Henriques, P. R. (2004). Limpeza de dados: Uma visão geral. Recuperado de http://wiki.di.uminho.pt/twiki/pub/Research/Doutoramentos/SDDI2004/ArtigoOliveira.pdf

Orr, K. (1998, Feb.). Data quality and systems theory. Communications of the ACM, 41(2), 66–71. doi:10.1145/269012.269023

Pipino, L. L., Lee, Y. W., & Wang, R. Y. (2002, Apr.). Data quality assessment. Communications of the ACM, 45(4), 211–218. doi: 10.1145/505248.506010

Rahm, E., & Do, H. H. (2000). Data cleaning: Problems and current approaches. IEEE Data Engineering Bulletin, 23(4), 3–13. Recuperado de http://sites.computer.org/debull/A00dec/issue1.htm

Strong, D. M., Lee, Y. W., & Wang, R. Y. (1997, May). Data quality in context. Communications of the ACM, 40(5), 103–110. doi: 10.1145/253769.253804

Vasco, D. O. (2013). Identificação de anomalias contextuais.Porto: Universidade do Porto.

Published

2016-12-31

How to Cite

Almeida, C. A. de, Silva, L. D. R., Schilipack, E. C. da S., & Minervi, N. A. (2016). Application of data cleaning to improve data quality at the Brazilian Civil Aviation Aircraft Accidents Database. AtoZ: Novas práticas Em informação E Conhecimento, 5(2), 72–79. https://doi.org/10.5380/atoz.v5i2.47303