Please use this identifier to cite or link to this item: https://ric.cps.sp.gov.br/handle/123456789/26409
Title: Análise comparativa de ferramentas de limpeza de dados
Other Titles: Comparative analysis of data cleansing tools
Authors: ARAÚJO, Júlio César Lima de
Advisor: TOMAZELA, Maria das Graças Junqueira Machado
Other contributor: ARANTES, Janaine Cristiane de Souza
OLIVEIRA, Giovana Fadini de
type of document: Monografia
Keywords: Descoberta de conhecimento;Banco de dados
Issue Date: 12-Dec-2012
Publisher: 105
Citation: ARAÚJO, Júlio César Lima de. Análise comparativa de ferramentas de limpeza de dados, 2012. Trabalho de Conclusão de Curso. (Tecnologia em Banco de Dados) - Faculdade de Tecnologia "Dr. Archimedes Lammoglia", Indaiatuba, 2012.
Abstract: A limpeza de dados é parte essencial de vários processos importantes para o tratamento e descoberta de informações, um grande exemplo de processo na qual a limpeza de dados é aplicada é o Processo de Descoberta de Conhecimento ou KDD (Knowledge Discovery in Database). Dessa forma apresentamos um estudo sobre a limpeza de dados e realizamos um comparativo de duas ferramentas responsáveis por essa limpeza, tendo como objetivo verificar as potencialidades dessas ferramentas de limpeza de dados, analisando sua eficácia. Para a realização deste estudo foi feita a pesquisa bibliográfica para referencial teórico, em seguida foi feito um levantamento de informações sobre as ferramentas de limpeza de dados e demais métodos necessários para o estudo, para que então fossem definidos os testes e a realização da avaliação e análise. A análise foi feita através de um sistema de pontos que foram atribuídos conforme os resultados obtidos nos testes. Os testes foram divididos em: três testes a partir dos métodos de limpeza de dados e um teste a partir de um questionário sobre a usabilidade das ferramentas. O trabalho apresentou características e observações dos processos utilizados por essas ferramentas, assim como algumas desvantagens que as ferramentas apresentaram nos testes como, por exemplo, a necessidade de meios mais eficientes para identificação e correção de registros inconsistentes. Os resultados mostraram que as duas ferramentas tiveram um bom desempenho, sendo a ferramenta WinPure Clean & Match a mais conceituada com 1,9 de nota e a DataCleaner com 1,79.
URI: https://ric.cps.sp.gov.br/handle/123456789/26409
Appears in Collections:Trabalhos de Conclusão de Curso

Files in This Item:
File Description SizeFormat 
JÚLIO CÉSAR LIMA DE ARAÚJO.pdf
  Restricted Access
1.31 MBAdobe PDFView/Open Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.