Scikit-learn: um estudo sobre aprendizado de máquina em python

ALBARELI, Luiz Virgilio

Please use this identifier to cite or link to this item: https://ric.cps.sp.gov.br/handle/123456789/37207

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	BORGES JÚNIOR, Sérgio Ricardo	-
dc.contributor.author	ALBARELI, Luiz Virgilio	-
dc.date.accessioned	2025-10-23T18:34:19Z	-
dc.date.available	2025-10-23T18:34:19Z	-
dc.date.issued	2020	-
dc.identifier.citation	ALBARELI, Luiz Virgilio. Scikit-learn: um estudo sobre aprendizado de máquina em python. 2020. Trabalho de Conclusão de Curso (Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas) – Faculdade de Tecnologia de São José do Rio Preto, São José do Rio Preto, 2020.	pt_BR
dc.identifier.uri	https://ric.cps.sp.gov.br/handle/123456789/37207	-
dc.description.abstract	Este trabalho buscou demonstrar como a técnica de Machine Learning pode ser aplicada por meio de algoritmos classificadores disponível em Python por meio da Biblioteca Scikit-learn. Para isso, os conjuntos de dados Iris e Titanic foram utilizados. Os algoritmos utilizados foram: Random Forest, Decison Tree, Extra Trees, Adaboost e K-Nearest Neighbors. Para comparar os resultados obtidos, foi utilizada a métrica acurácia, que representa a porcentagem dos valores preditos de forma correta em relação ao valor real, e essa métrica foi apurada com dois métodos: accuracy_score e cross_val_score. Com isso, foi constatado que no datasetTitanic com o método accuracy_score, o melhor modelo foi o AdaBoost, no entanto,com o método cross_val_score houve um empate entre o Extra Trees e o Random Forest. Já no datasetIris, com o método accuracy_score, os melhores desempenhos foram dos modelos Adaboost e K-Nearest Neighbors e, com o método cross_val_score, o melhor desempenho foi para o algoritmo K-Nearest Neighbors.	pt_BR
dc.description.abstract	This work focused on demonstrating how the Machine Learningtechnique can be applied using classifying algorithms available in Python through the Scikit-learn Library. For this, the Iris and Titanic data sets were used. The used algorithms were: Random Forest, Decison Tree, Extra Trees, Adaboost and K-Nearest Neighbors. To compare the obtained results, the accuracy metric was used, which represents the percentage of the values correctly predicted in relation to the real value, and this metric was calculated using two methods; accuracy_score and cross_val_score. With that it was found that in the Titanic dataset with the accuracy_score method the best model was Adaboost, however,with the cross_val_score method there was a tie between Extra Trees and the random Forest. In the Íris dataset, with the accuracy_score method, the best performances were from the Adaboost and K-Nearest Neighbors models and, with the cross_val_score method, the best performance was for the K-Nearest Neighbors algorithm.	pt_BR
dc.description.sponsorship	Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas	pt_BR
dc.language.iso	pt_BR	pt_BR
dc.publisher	121	pt_BR
dc.subject	Machine learning	pt_BR
dc.subject	Python	pt_BR
dc.subject	Algoritmos	pt_BR
dc.subject.other	Informação e Comunicação	pt_BR
dc.title	Scikit-learn: um estudo sobre aprendizado de máquina em python	pt_BR
dc.title.alternative	Scikit-learn: a study on machine learning in python	pt_BR
dc.type	Artigo Científico	pt_BR
dcterms.type	-	pt_BR
Appears in Collections:	Trabalhos de Conclusão de Curso

Files in This Item:

File	Description	Size	Format
analiseedesenvolvimentodesistemas_2020_1_luizvalbareli_scikitlearnumestudosobreaprendizadodemaquinaempython.pdf Restricted Access		528.32 kB	Adobe PDF	View/Open Request a copy

Show simple item record Recommend this item