Please use this identifier to cite or link to this item: https://ric.cps.sp.gov.br/handle/123456789/43905
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorFAVAN, João Ricardo-
dc.contributor.advisorCAPELOCI, Eloiza Martins Primo-
dc.contributor.authorFRANCO, Dalton Pacola-
dc.contributor.authorPAULA, Daniel Batistão de-
dc.date.accessioned2026-04-28T17:26:49Z-
dc.date.available2026-04-28T17:26:49Z-
dc.date.issued2023-11-28-
dc.identifier.citationFRANCO, Dalton Pacola; PAULA, Daniel Batistão de. Criação de banco de frases validadas por machine learning para plataforma de aprendizagem em língua inglesa, 2023. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Big Data no Agronegócio) - Faculdade de Tecnologia FATEC Shunji Nishimura (Pompéia), Pompéia, 2023.pt_BR
dc.identifier.urihttps://ric.cps.sp.gov.br/handle/123456789/43905-
dc.description.abstractO uso do Big Data na Linguística tem revolucionado a forma como entendemos e estudamos as Línguas, abrangendo a análise de grandes volumes de dados linguísticos para entender padrões de uso da linguagem, aprimorando a eficácia no estudo de idiomas. Os modelos de machine learning, que é um subcampo da inteligência artificial, podem ser utilizados para aprendizado de idiomas, sendo possível definir o perfil de estudo de um usuário, seus temas e quais são os próximos passos com relação ao seu aprendizado. Foi desenvolvido neste trabalho um algoritmo utilizando a linguagem de programação Python com o modelo Multilayer Perceptron (MLP) para criar um validador de frases, onde foram utilizadas seis condições validadoras como entrada do algoritmo. As frases foram retiradas de dois sites distintos utilizando a técnica web scraping. As frases já validadas pelo algoritmo foram inseridas no banco de dados MySQL em quatorze assuntos distintos, facilitando a obtenção de vocabulário com um contexto já estabelecido. As frases validadas e categorizadas por assuntos foram disponibilizadas em uma API (Application Programming Interface) que foi desenvolvida com o framework Flask. O algoritmo de machine learning empregado para o validador foi o Multilayer Perceptron, que alcançou uma acurácia de 0.93 durante os testes pós-treinamento, demonstrando um desempenho esperado na tarefa de reconhecimento de frases. Para o classificador de assunto das frases foram comparados três modelos de machine learning: Multilayer Perceptron, Decision Tree e Random Forest, sendo feito uma comparação da acurácia dos modelos, o melhor resultado foi o do modelo MLP.pt_BR
dc.description.sponsorshipCurso Superior de Tecnologia em Bigdata no Agronegóciopt_BR
dc.language.isopt_BRpt_BR
dc.publisher259pt_BR
dc.subjectLíngua inglesapt_BR
dc.subjectMachine learningpt_BR
dc.subjectInteligência artificialpt_BR
dc.subjectEnsino e aprendizagempt_BR
dc.subjectAprendizagempt_BR
dc.subjectBanco de dadospt_BR
dc.subject.otherInformação e Comunicaçãopt_BR
dc.titleCriação de banco de frases validadas por machine learning para plataforma de aprendizagem em língua inglesapt_BR
dc.title.alternativeCreation of a database of phrases validated by machine learning for an English language learning platformpt_BR
dc.typeArtigo Científicopt_BR
dcterms.type-pt_BR
Appears in Collections:Trabalhos de Conclusão de Curso

Files in This Item:
File Description SizeFormat 
bigdata_2023_2_daltonfranco_criacaodebancodefrases.pdf476.94 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.