Use este identificador para citar ou linkar para este item:
https://ric.cps.sp.gov.br/handle/123456789/26409
Título: | Análise comparativa de ferramentas de limpeza de dados |
Título(s) alternativo(s): | Comparative analysis of data cleansing tools |
Autor(es): | ARAÚJO, Júlio César Lima de |
Orientador(es): | TOMAZELA, Maria das Graças Junqueira Machado |
Outro(s) contribuidor(es): | ARANTES, Janaine Cristiane de Souza OLIVEIRA, Giovana Fadini de |
Tipo documental: | Monografia |
Palavras-chave: | Descoberta de conhecimento;Banco de dados |
Data do documento: | 12-Dez-2012 |
Editor: | 105 |
Referência Bibliográfica: | ARAÚJO, Júlio César Lima de. Análise comparativa de ferramentas de limpeza de dados, 2012. Trabalho de Conclusão de Curso. (Tecnologia em Banco de Dados) - Faculdade de Tecnologia "Dr. Archimedes Lammoglia", Indaiatuba, 2012. |
Resumo: | A limpeza de dados é parte essencial de vários processos importantes para o tratamento e descoberta de informações, um grande exemplo de processo na qual a limpeza de dados é aplicada é o Processo de Descoberta de Conhecimento ou KDD (Knowledge Discovery in Database). Dessa forma apresentamos um estudo sobre a limpeza de dados e realizamos um comparativo de duas ferramentas responsáveis por essa limpeza, tendo como objetivo verificar as potencialidades dessas ferramentas de limpeza de dados, analisando sua eficácia. Para a realização deste estudo foi feita a pesquisa bibliográfica para referencial teórico, em seguida foi feito um levantamento de informações sobre as ferramentas de limpeza de dados e demais métodos necessários para o estudo, para que então fossem definidos os testes e a realização da avaliação e análise. A análise foi feita através de um sistema de pontos que foram atribuídos conforme os resultados obtidos nos testes. Os testes foram divididos em: três testes a partir dos métodos de limpeza de dados e um teste a partir de um questionário sobre a usabilidade das ferramentas. O trabalho apresentou características e observações dos processos utilizados por essas ferramentas, assim como algumas desvantagens que as ferramentas apresentaram nos testes como, por exemplo, a necessidade de meios mais eficientes para identificação e correção de registros inconsistentes. Os resultados mostraram que as duas ferramentas tiveram um bom desempenho, sendo a ferramenta WinPure Clean & Match a mais conceituada com 1,9 de nota e a DataCleaner com 1,79. |
URI: | https://ric.cps.sp.gov.br/handle/123456789/26409 |
Aparece nas coleções: | Trabalhos de Conclusão de Curso |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
JÚLIO CÉSAR LIMA DE ARAÚJO.pdf Restricted Access | 1.31 MB | Adobe PDF | Visualizar/Abrir Solictar uma cópia |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.