Use este identificador para citar ou linkar para este item:
https://ric.cps.sp.gov.br/handle/123456789/26411
Título: | Comparação dos algoritmos k-means e fuzzy c-means, em dados do censo varietal qualitativo da cana-de-açúcar de uma usina do estado de São Paulo |
Título(s) alternativo(s): | Comparison of k-means and fuzzy c-means algorithms, using data from the qualitative varietal census of sugar cane from a plant in the state of São Paulo |
Autor(es): | PANSONATO, Ramon |
Orientador(es): | TOMAZELA, Maria das Graças Junqueira Machado FURGERI, Sérgio |
Outro(s) contribuidor(es): | ARANTES, Janaine Cristiane de Souza OLIVEIRA, Giovana Fadini de |
Tipo documental: | Monografia |
Palavras-chave: | Mineração de dados;Banco de dados;Cana-de-açúcar |
Data do documento: | 12-Dez-2012 |
Editor: | 105 |
Referência Bibliográfica: | PANSONATO, Ramon. Comparação dos algoritmos k-means e fuzzy c-means, em dados do censo varietal qualitativo da cana-de-açúcar de uma usina do estado de São Paulo, 2012. Trabalho de Conclusão de Curso. (Tecnologia em Banco de Dados) - Faculdade de Tecnologia "Dr. Archimedes Lammoglia", Indaiatuba, 2012. |
Resumo: | A mineração de dados é a etapa mais importante dentro do processo de descoberta de conhecimento em bases de dados, o KDD - Knowledge Discovery in Databases. Essa etapa consiste em minerar os dados a fim de trazer padrões úteis para um maior entendimento daqueles dados armazenados. As principais tarefas da mineração de dados são, classificação, associação e clusterização. O objetivo desse trabalho foi em pesquisar sobre os algoritmos de clusterização de dados k-means e fuzzy c-means e aplicá-los em uma base contendo dados sobre cana-de-açúcar do estado de São Paulo, com a finalidade de verificar qual deles traz um melhor resultado. O suporte metodológico baseou-se em um levantamento bibliográfico sobre o KDD; levantamento sobre Mineração de Dados focando a parte de clusterização; levantamento sobre lógica fuzzy e de como ocorre a clusterização fuzzy. Foram realizados diversos testes utilizando os recursos de Mineração de Dados da ferramenta MATLAB, como a criação de classes para os dados e a classificação dos mesmos através da técnica KNN – K-nearest neighbor. Os resultados obtidos através dos algoritmos de clusterização foram analisados e comparados através do Microsoft Office Excel e foi possível identificar qual algoritmo traz melhores resultados no agrupamento dos dados, concluindo, então, que para o cenário estudado, o k-means mostrou-se mais eficaz, trazendo melhores resultados do que o algoritmo fuzzy c-means. Tendo que o k-means teve um acerto de 19% na maior classe criada, “Muito Baixa”, e o fuzzy c-means teve 4% de acerto na mesma classe. |
URI: | https://ric.cps.sp.gov.br/handle/123456789/26411 |
Aparece nas coleções: | Trabalhos de Conclusão de Curso |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Ramon Pansonato.pdf Restricted Access | 931.22 kB | Adobe PDF | Visualizar/Abrir Solictar uma cópia |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.