Use este identificador para citar ou linkar para este item:
https://ric.cps.sp.gov.br/handle/123456789/25203
Título: | Análise de sensibilidade paramétrica do algorítmo Knnimpute |
Título(s) alternativo(s): | Parametric sensitivity analysis of the Knnimpute algorithm |
Autor(es): | TAKANO, Carlos Eduardo |
Orientador(es): | MARQUES, José Luiz |
Tipo documental: | Monografia |
Palavras-chave: | Banco de dados;Algoritmo |
Data do documento: | Jul-2012 |
Editor: | 105 |
Referência Bibliográfica: | TAKANO, Carlos Eduardo. Análise de sensibilidade paramétrica do algorítmo Knnimpute. Trabalho de Conclusão de Curso (Curso Superior de Tecnologia em Banco de Dados) - Faculdade de Tecnologia de Indaiatuba "Dr. Archimedes Lammoglia", Indaiatuba, 2012. |
Resumo: | Um dos problemas que afetam os bancos de dados sãos os dados faltantes. Para a resolução de tal problema existem diversos métodos de tratamento e um deles é a imputação de dados, que foi o foco deste presente trabalho, no qual foi utilizado um algoritmo específico para imputação, chamado KNNIMPUTE, implementado dentro do software Matlab R2010a. O algoritmo citado possui parâmetros variáveis que são a métrica de distância e o valor de k vizinhos mais próximos ao dado faltante, utilizados para calcular o elemento a ser imputado. O objetivo central deste trabalho foi encontrar quais as variáveis de métrica de distância e valor de k, dentro do algoritmo KNNIMPUTE, que obteriam os melhores resultados de imputação. Utilizando-se de uma metodologia experimental, foram realizados seguidos experimentos com diferentes bases, dentro do software Matlab R2010a, efetuando-se alterações nos parâmetros de métrica de distância e valor de k. Na medição da acurácia de imputação, foram utilizados os critério da raiz quadrada do erro quadrático médio (RMSE, do inglês Root Mean Square Error) e do erro absoluto médio (MAE, do inglês Mean Absolute Error), em que menores valores de MAE e RMSE indicam uma maior acurácia. Após a realização dos experimentos, concluiu-se que a métrica de distância cosine e o valor de k=5, foram os parâmetros que trouxeram os melhores resultados para as bases utilizadas, sendo essa configuração, apenas uma sugestão para início de um processo de imputação, utilizando o algoritmo KNNIMPUTE, não uma regra geral. |
URI: | https://ric.cps.sp.gov.br/handle/123456789/25203 |
Aparece nas coleções: | Trabalhos de Conclusão de Curso |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
CARLOS EDUARDO TAKANO.pdf Restricted Access | 4.29 MB | Adobe PDF | Visualizar/Abrir Solictar uma cópia |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.