Use este identificador para citar ou linkar para este item: https://ric.cps.sp.gov.br/handle/123456789/25203
Título: Análise de sensibilidade paramétrica do algorítmo Knnimpute
Título(s) alternativo(s): Parametric sensitivity analysis of the Knnimpute algorithm
Autor(es): TAKANO, Carlos Eduardo
Orientador(es): MARQUES, José Luiz
Tipo documental: Monografia
Palavras-chave: Banco de dados;Algoritmo
Data do documento: Jul-2012
Editor: 105
Referência Bibliográfica: TAKANO, Carlos Eduardo. Análise de sensibilidade paramétrica do algorítmo Knnimpute. Trabalho de Conclusão de Curso (Curso Superior de Tecnologia em Banco de Dados) - Faculdade de Tecnologia de Indaiatuba "Dr. Archimedes Lammoglia", Indaiatuba, 2012.
Resumo: Um dos problemas que afetam os bancos de dados sãos os dados faltantes. Para a resolução de tal problema existem diversos métodos de tratamento e um deles é a imputação de dados, que foi o foco deste presente trabalho, no qual foi utilizado um algoritmo específico para imputação, chamado KNNIMPUTE, implementado dentro do software Matlab R2010a. O algoritmo citado possui parâmetros variáveis que são a métrica de distância e o valor de k vizinhos mais próximos ao dado faltante, utilizados para calcular o elemento a ser imputado. O objetivo central deste trabalho foi encontrar quais as variáveis de métrica de distância e valor de k, dentro do algoritmo KNNIMPUTE, que obteriam os melhores resultados de imputação. Utilizando-se de uma metodologia experimental, foram realizados seguidos experimentos com diferentes bases, dentro do software Matlab R2010a, efetuando-se alterações nos parâmetros de métrica de distância e valor de k. Na medição da acurácia de imputação, foram utilizados os critério da raiz quadrada do erro quadrático médio (RMSE, do inglês Root Mean Square Error) e do erro absoluto médio (MAE, do inglês Mean Absolute Error), em que menores valores de MAE e RMSE indicam uma maior acurácia. Após a realização dos experimentos, concluiu-se que a métrica de distância cosine e o valor de k=5, foram os parâmetros que trouxeram os melhores resultados para as bases utilizadas, sendo essa configuração, apenas uma sugestão para início de um processo de imputação, utilizando o algoritmo KNNIMPUTE, não uma regra geral.
URI: https://ric.cps.sp.gov.br/handle/123456789/25203
Aparece nas coleções:Trabalhos de Conclusão de Curso

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CARLOS EDUARDO TAKANO.pdf
  Restricted Access
4.29 MBAdobe PDFVisualizar/Abrir    Solictar uma cópia


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.