Use este identificador para citar ou linkar para este item: https://ric.cps.sp.gov.br/handle/123456789/28719
Título: Análise e utilização da aprendizagem de máquina em dados de alunos e ex-alunos do ensino superior para obtenção das causas e entendimento sobre a evasão escolar em instituições de ensino
Título(s) alternativo(s): Analysis and use of machine learning on data from higher education students and alumni to obtain the causes and understanding of school dropout in educational institutions
Autor(es): ALMAGRO, Bruno Correia
BRITO, Leonardo Almeida Santos
Orientador(es): MARTINS, Ronaldo Rodrigues
Tipo documental: Monografia
Palavras-chave: Evasão escolar;Análise de dados
Data do documento: Dez-2021
Editor: 182
Referência Bibliográfica: ALMAGRO, Bruno Correia; BRITO, Leonardo Almeida Santos. Análise e utilização da aprendizagem de máquina em dados de alunos e ex-alunos do ensino superior para obtenção das causas e entendimento sobre a evasão escolar em instituições de ensino. Orientador: Ronaldo Rodrigues Martins. 2021. 46 f. Trabalho de conclusão de curso (Curso Superior de Gestão da Tecnologia da Informação) - Fatec Catanduva, Catanduva, 2021.
Resumo: Apesar de ter discussões aprofundadas no ensino fundamental e médio, os índices de evasão carecem de discussão aprofundada no ensino superior. Entender os fatores que levam a evasão escolar pode trazer luz ao problema, com esse entendimento é possível propor ações que sejam eficientes, otimizando recursos. Uma forma de tentar entender quais são esses fatores é a avaliação de correlação sobre os atributos que descrevem os alunos e suas características, posteriormente aplicando esses dados dentro de um algoritmo de máquina não supervisionado. Algoritmos não-supervisionados são baseados em encontrar padrões dentro de um conjunto de dados, sem a necessidade de fazer o processo de rotulação ou predição, sendo assim, na nossa perspectiva, a ideia é encontrar quais atributos de uma pessoa são essenciais para definir se essa pessoa irá evadir ou não. Pensando nisso, este trabalho busca por meio da aprendizagem de máquina, encontrar características relevantes, ou até possíveis causas para a evasão de alunos no ensino superior. Para isso foram utilizados microdados do censo da educação superior do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) de 2019, onde foram aplicados métodos de aprendizado não supervisionado, mais precisamente K-Means, Expectation-Maximization e DBSCAN. Os resultados do trabalho demonstram precisão de 93.60% e uma acurácia 34.78%, além de prover vários indicativos de possíveis causas e soluções.
Despite having in-depth discussions in elementary and secondary education, dropout rates lack in-depth discussion in higher education. Understanding the factors that lead to school dropouts can shed light on the problem, with this understanding it is possible to propose actions that are efficient, optimizing resources. One way to try to understand what these factors are is to evaluate correlations on the attributes that describe students and their characteristics, later applying this data within an unsupervised machine learning algorithm. Unsupervised algorithms are based on finding patterns within a dataset, without the need to do the labeling or prediction process, so, from our perspective, the idea is to find which attributes of a person are essential to define whether this person will evade or not. With that in mind, this work seeks, through machine learning, to find relevant characteristics, or even possible causes for the dropout of students in higher education. For this, microdata from the higher education census of the National Institute of Educational Studies and Research Anísio Teixeira (INEP) of 2019 were used, where unsupervised learning methods were applied, more precisely K-Means, Expectation-Maximization and DBSCAN. The results of the work demonstrate a precision of 93.60% and an accuracy of 34.78%, in addition to providing several indications of possible causes and solutions.
URI: https://ric.cps.sp.gov.br/handle/123456789/28719
Aparece nas coleções:Trabalhos de Conclusão de Curso



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.