Please use this identifier to cite or link to this item: https://ric.cps.sp.gov.br/handle/123456789/25203
Title: Análise de sensibilidade paramétrica do algorítmo Knnimpute
Other Titles: Parametric sensitivity analysis of the Knnimpute algorithm
Authors: TAKANO, Carlos Eduardo
Advisor: MARQUES, José Luiz
type of document: Monografia
Keywords: Banco de dados;Algoritmo
Issue Date: Jul-2012
Publisher: 105
Citation: TAKANO, Carlos Eduardo. Análise de sensibilidade paramétrica do algorítmo Knnimpute. Trabalho de Conclusão de Curso (Curso Superior de Tecnologia em Banco de Dados) - Faculdade de Tecnologia de Indaiatuba "Dr. Archimedes Lammoglia", Indaiatuba, 2012.
Abstract: Um dos problemas que afetam os bancos de dados sãos os dados faltantes. Para a resolução de tal problema existem diversos métodos de tratamento e um deles é a imputação de dados, que foi o foco deste presente trabalho, no qual foi utilizado um algoritmo específico para imputação, chamado KNNIMPUTE, implementado dentro do software Matlab R2010a. O algoritmo citado possui parâmetros variáveis que são a métrica de distância e o valor de k vizinhos mais próximos ao dado faltante, utilizados para calcular o elemento a ser imputado. O objetivo central deste trabalho foi encontrar quais as variáveis de métrica de distância e valor de k, dentro do algoritmo KNNIMPUTE, que obteriam os melhores resultados de imputação. Utilizando-se de uma metodologia experimental, foram realizados seguidos experimentos com diferentes bases, dentro do software Matlab R2010a, efetuando-se alterações nos parâmetros de métrica de distância e valor de k. Na medição da acurácia de imputação, foram utilizados os critério da raiz quadrada do erro quadrático médio (RMSE, do inglês Root Mean Square Error) e do erro absoluto médio (MAE, do inglês Mean Absolute Error), em que menores valores de MAE e RMSE indicam uma maior acurácia. Após a realização dos experimentos, concluiu-se que a métrica de distância cosine e o valor de k=5, foram os parâmetros que trouxeram os melhores resultados para as bases utilizadas, sendo essa configuração, apenas uma sugestão para início de um processo de imputação, utilizando o algoritmo KNNIMPUTE, não uma regra geral.
URI: https://ric.cps.sp.gov.br/handle/123456789/25203
Appears in Collections:Trabalhos de Conclusão de Curso

Files in This Item:
File Description SizeFormat 
CARLOS EDUARDO TAKANO.pdf
  Restricted Access
4.29 MBAdobe PDFView/Open Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.