Mejora de la la calidad de datos con la aplicación del "data cleaning" en la base de datos de accidentes aeronáuticos de la aviación civil brasileña

Autores/as

  • Cleibson Aparecido de Almeida Universidade Aberta de Portugal – UAb
  • Leonardo Derckan Rodrigues Silva Instituto de Tecnologia da Aeronáutica – ITA
  • Elaine Cristina da Silva Schilipack Universidade Federal do Paraná – UFPR
  • Nivaldo Aparecido Minervi Universidade Federal do Paraná - UFPR http://orcid.org/0000-0003-0543-6295

DOI:

https://doi.org/10.5380/atoz.v5i2.47303

Palabras clave:

Limpieza de datos, Calidad de datos, Métodos de limpieza de datos

Resumen

Introducción: Indica las técnicas de aplicación de la "limpieza de datos" en la base de datos de accidentes de la aviación civil brasileña con el fin de medir el grado de mejora en la calidad de datos. Método: Se llevó a cabo inicialmente una revisión bibliográfica sobre los conceptos de la limpieza y calidad de datos y luego se aplicó tales técnicas en una base de datos compuesta de 4601 registros relacionados con accidentes de aviación  civil brasileña entre años 1979 y 2014. La medición de la mejora en la calidad de los datos se realizó mediante la métricas "Porcentaje de mejora." Resultados: Al se observar el contexto general de todos los atributos de la base de datos, hubo una mejora del 9% de la calidad de los datos con los atributos tales como el peso, el fabricante y el modelo de la aeronave, que mostró un grado de mejora sobre 55%, después de la aplicación de la metodología. Conclusión: Se puede utilizar la técnica de "limpieza de datos" para establecer políticas para la mejora continua en las bases de datos y los procesos de toma de decisiones en las organizaciones que se ocupan de la aviación, en particular en la seguridad aérea.

Biografía del autor/a

Cleibson Aparecido de Almeida, Universidade Aberta de Portugal – UAb

Graduado em Estatística - UFPR, Mestre em Engenharia de Produção -UFPR, Doutorando em Matemática Aplicada e Modelação - UAb. Desenvolve atividades junto ao Centro de Investigação e Prevenção de Acidentes Aeronáuticos (CENIPA/FAB). 

Leonardo Derckan Rodrigues Silva, Instituto de Tecnologia da Aeronáutica – ITA

Graduado em Engenharia Civil - IESPlan, Pós-graduado em Segurança de Voo - ITA. Atualmente desenvolve atividades de coordenação junto aos órgãos internacionais no Centro de Investigação e Prevenção de Acidentes Aeronáuticos (CENIPA/FAB).

Elaine Cristina da Silva Schilipack, Universidade Federal do Paraná – UFPR

Bacharel em Estatística - UFPR. Servidora Pública com enquadramento funcional em Estatística

Nivaldo Aparecido Minervi, Universidade Federal do Paraná - UFPR

Bacharel em Estatística - UFPR, Mestrado em Engenharia da Produção - UFPR. Professor e formador - DPRF e Ministério da Justiça

Citas

Centro de Investigação e Prevenção de Acidentes. (2008). Relatório final a-022/cenipa/2008.

Centro de Investigação e Prevenção de Acidentes. (2009). Relatório final a-no67/cenipa/2009.

Kanki, B. G., & Seamster, T. L. (2002). Aviation information management: From documents to data. Burlington: Ashgate.

Lopes, F. P. (2006). Administração de dados: Técnicas, metodologias e ferramentas para garantir a qualidade dos dados. Recife: Universidade Federal de Pernambuco.

Oliveira, P. J., Rodrigues, F., & Henriques, P. R. (2004). Limpeza de dados: Uma visão geral. Recuperado de http://wiki.di.uminho.pt/twiki/pub/Research/Doutoramentos/SDDI2004/ArtigoOliveira.pdf

Orr, K. (1998, Feb.). Data quality and systems theory. Communications of the ACM, 41(2), 66–71. doi:10.1145/269012.269023

Pipino, L. L., Lee, Y. W., & Wang, R. Y. (2002, Apr.). Data quality assessment. Communications of the ACM, 45(4), 211–218. doi: 10.1145/505248.506010

Rahm, E., & Do, H. H. (2000). Data cleaning: Problems and current approaches. IEEE Data Engineering Bulletin, 23(4), 3–13. Recuperado de http://sites.computer.org/debull/A00dec/issue1.htm

Strong, D. M., Lee, Y. W., & Wang, R. Y. (1997, May). Data quality in context. Communications of the ACM, 40(5), 103–110. doi: 10.1145/253769.253804

Vasco, D. O. (2013). Identificação de anomalias contextuais.Porto: Universidade do Porto.

Publicado

2016-12-31

Cómo citar

Almeida, C. A. de, Silva, L. D. R., Schilipack, E. C. da S., & Minervi, N. A. (2016). Mejora de la la calidad de datos con la aplicación del "data cleaning" en la base de datos de accidentes aeronáuticos de la aviación civil brasileña. AtoZ: Novas práticas Em informação E Conhecimento, 5(2), 72–79. https://doi.org/10.5380/atoz.v5i2.47303

Número

Sección

Artículos