Use este identificador para citar ou linkar para este item: https://ric.cps.sp.gov.br/handle/123456789/26409
Título: Análise comparativa de ferramentas de limpeza de dados
Título(s) alternativo(s): Comparative analysis of data cleansing tools
Autor(es): ARAÚJO, Júlio César Lima de
Orientador(es): TOMAZELA, Maria das Graças Junqueira Machado
Outro(s) contribuidor(es): ARANTES, Janaine Cristiane de Souza
OLIVEIRA, Giovana Fadini de
Tipo documental: Monografia
Palavras-chave: Descoberta de conhecimento;Banco de dados
Data do documento: 12-Dez-2012
Editor: 105
Referência Bibliográfica: ARAÚJO, Júlio César Lima de. Análise comparativa de ferramentas de limpeza de dados, 2012. Trabalho de Conclusão de Curso. (Tecnologia em Banco de Dados) - Faculdade de Tecnologia "Dr. Archimedes Lammoglia", Indaiatuba, 2012.
Resumo: A limpeza de dados é parte essencial de vários processos importantes para o tratamento e descoberta de informações, um grande exemplo de processo na qual a limpeza de dados é aplicada é o Processo de Descoberta de Conhecimento ou KDD (Knowledge Discovery in Database). Dessa forma apresentamos um estudo sobre a limpeza de dados e realizamos um comparativo de duas ferramentas responsáveis por essa limpeza, tendo como objetivo verificar as potencialidades dessas ferramentas de limpeza de dados, analisando sua eficácia. Para a realização deste estudo foi feita a pesquisa bibliográfica para referencial teórico, em seguida foi feito um levantamento de informações sobre as ferramentas de limpeza de dados e demais métodos necessários para o estudo, para que então fossem definidos os testes e a realização da avaliação e análise. A análise foi feita através de um sistema de pontos que foram atribuídos conforme os resultados obtidos nos testes. Os testes foram divididos em: três testes a partir dos métodos de limpeza de dados e um teste a partir de um questionário sobre a usabilidade das ferramentas. O trabalho apresentou características e observações dos processos utilizados por essas ferramentas, assim como algumas desvantagens que as ferramentas apresentaram nos testes como, por exemplo, a necessidade de meios mais eficientes para identificação e correção de registros inconsistentes. Os resultados mostraram que as duas ferramentas tiveram um bom desempenho, sendo a ferramenta WinPure Clean & Match a mais conceituada com 1,9 de nota e a DataCleaner com 1,79.
URI: https://ric.cps.sp.gov.br/handle/123456789/26409
Aparece nas coleções:Trabalhos de Conclusão de Curso

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
JÚLIO CÉSAR LIMA DE ARAÚJO.pdf
  Restricted Access
1.31 MBAdobe PDFVisualizar/Abrir    Solictar uma cópia


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.