Melhoria na qualidade de dados com a aplicação de "data cleaning" na base de dados de acidentes aeronáuticos da aviação civil brasileira

Autores

  • Cleibson Aparecido de Almeida Universidade Aberta de Portugal – UAb
    • Leonardo Derckan Rodrigues Silva Instituto de Tecnologia da Aeronáutica – ITA
      • Elaine Cristina da Silva Schilipack Universidade Federal do Paraná – UFPR
        • Nivaldo Aparecido Minervi Universidade Federal do Paraná - UFPR http://orcid.org/0000-0003-0543-6295

          DOI:

          https://doi.org/10.5380/atoz.v5i2.47303

          Palavras-chave:

          Limpeza de dados, Qualidade de dados, Métodos de limpeza de dados

          Resumo

          Introdução: Apresenta a aplicação de técnicas de data cleaning na base de dados de acidentes aeronáuticos da aviação civil brasileira com o objetivo de mensurar o grau de melhoria na qualidade dos dados. Método: inicialmente realizou-se uma revisão de literatura sobre os conceitos de data cleaning e qualidade de dados e, em seguida, aplicaram-se as técnicas de data cleaning em uma base de dados composta por 4601 registros, referentes aos acidentes aeronáuticos ocorridos entre os anos de 1979 e 2014 na aviação civil brasileira. A medição da melhoria na qualidade dos dados foi realizada por meio da métrica “percentual de melhoria dos dados”. Resultados: Observando-se o contexto geral todos os atributos da base de dados houve uma melhoria de 9% quanto à qualidade dos dados, com atributos, como por exemplo o peso, fabricante e modelo das aeronaves, que apresentaram um grau de melhoria acima de 55% após a aplicação da metodologia. Conclusão: A técnica de data cleaning pode ser utilizada para definir políticas para a melhoria contínua em bases de dados e melhorar os processos de decisão nas organizações que tratam sobre aviação, em especial na área de segurança de voo.

          Biografia do Autor

          Cleibson Aparecido de Almeida, Universidade Aberta de Portugal – UAb

          Graduado em Estatística - UFPR, Mestre em Engenharia de Produção -UFPR, Doutorando em Matemática
          Aplicada e Modelação - UAb. Desenvolve atividades junto ao Centro de Investigação e Prevenção de Acidentes Aeronáuticos (CENIPA/FAB). 

          Leonardo Derckan Rodrigues Silva, Instituto de Tecnologia da Aeronáutica – ITA

          Graduado em Engenharia Civil - IESPlan, Pós-graduado em Segurança de Voo - ITA. Atualmente desenvolve atividades de coordenação junto aos órgãos internacionais no Centro de Investigação e Prevenção de Acidentes Aeronáuticos (CENIPA/FAB).

          Elaine Cristina da Silva Schilipack, Universidade Federal do Paraná – UFPR

          Bacharel em Estatística - UFPR. Servidora Pública com enquadramento funcional em Estatística.

          Nivaldo Aparecido Minervi, Universidade Federal do Paraná - UFPR

          Bacharel em Estatística - UFPR, Mestrado em Engenharia da Produção - UFPR. Professor e formador - DPRF e Ministério da Justiça.

          Referências

          Centro de Investigação e Prevenção de Acidentes. (2008). Relatório final a-022/cenipa/2008.

          Centro de Investigação e Prevenção de Acidentes. (2009). Relatório final a-no67/cenipa/2009.

          Kanki, B. G., & Seamster, T. L. (2002). Aviation information management: From documents to data. Burlington: Ashgate.

          Lopes, F. P. (2006). Administração de dados: Técnicas, metodologias e ferramentas para garantir a qualidade dos dados. Recife: Universidade Federal de Pernambuco.

          Oliveira, P. J., Rodrigues, F., & Henriques, P. R. (2004). Limpeza de dados: Uma visão geral. Recuperado de http://wiki.di.uminho.pt/twiki/pub/Research/Doutoramentos/SDDI2004/ArtigoOliveira.pdf

          Orr, K. (1998, Feb.). Data quality and systems theory. Communications of the ACM, 41(2), 66–71. doi:10.1145/269012.269023

          Pipino, L. L., Lee, Y. W., & Wang, R. Y. (2002, Apr.). Data quality assessment. Communications of the ACM, 45(4), 211–218. doi: 10.1145/505248.506010

          Rahm, E., & Do, H. H. (2000). Data cleaning: Problems and current approaches. IEEE Data Engineering Bulletin, 23(4), 3–13. Recuperado de http://sites.computer.org/debull/A00dec/issue1.htm

          Strong, D. M., Lee, Y. W., & Wang, R. Y. (1997, May). Data quality in context. Communications of the ACM, 40(5), 103–110. doi: 10.1145/253769.253804

          Vasco, D. O. (2013). Identificação de anomalias contextuais.Porto: Universidade do Porto.

          Publicado

          2016-12-31

          Como Citar

          Almeida, C. A. de, Silva, L. D. R., Schilipack, E. C. da S., & Minervi, N. A. (2016). Melhoria na qualidade de dados com a aplicação de "data cleaning" na base de dados de acidentes aeronáuticos da aviação civil brasileira. AtoZ: Novas práticas Em informação E Conhecimento, 5(2), 72–79. https://doi.org/10.5380/atoz.v5i2.47303

          Edição

          Seção

          Artigos