Back to Search
Start Over
Análise preditiva na detecção de evasão de alunos no ensino superior privado brasileiro: abordagem de algoritmos de aprendizado de máquina, com base nas perspectivas acadêmicas, financeiras, geográficas e socioeconômicas
- Source :
- Repositório Institucional do FGV (FGV Repositório Digital), Fundação Getulio Vargas (FGV), instacron:FGV
- Publication Year :
- 2020
-
Abstract
- Com o objetivo de propor um modelo empírico capaz de auxiliar na tomada de decisão gerencial quanto a previsão e prevenção da evasão de estudantes em uma instituição de ensino superior (IES) privada, esta pesquisa se propõe a analisar a utilização de variáveis acadêmicas, financeiras, geográficas e socioeconômicas aplicadas a quatro modelos supervisionados de aprendizado de máquina: [1] Regressão Logística; [2] Árvore de Decisão; [3] Redes Neurais Artificiais; e [4] Florestas Aleatórias. Implementados a partir de quatro abordagens diferentes de balanceamento de classes: [1] sem balanceamento; [2] com balanceamento para cima (Up-Sampling); [3] com balanceamento para baixo (Down- Sampling); e [4] balanceamento híbrido do tipo Smote. Como resultados, apresentou-se dois modelos empíricos distintos que podem ser implementados em conjunto com os sistemas de gestão empresarial de uma IES de maneira a permitirem uma tomada de decisão tempestiva que possibilite a mitigação da evasão de estudantes. No primeiro, propõem-se a aplicação do algoritmo de floresta aleatória com balanceamento híbrido, de maneira que se possa calcular a probabilidade de evasão dos alunos ao final do semestre, e permitir que os responsáveis pela retenção dos estudantes possam realizar abordagens de intervenção baseadas nas variáveis que mais influenciam no cálculo da evasão, este modelo se mostrou mais preciso na classificação dos alunos e portanto permite uma redução na quantidade de abordagens que seriam realizadas quando comparado aos demais. O segundo método empírico propõe a utilização do modelo de árvores de decisão, também elaborado por meio do balanceamento híbrido, cujas regras de cálculo da probabilidade de evasão devem ser parametrizadas nos sistemas de gestão e integrados com as ferramentas de CRM da IES, a fim de avisar aos responsáveis pela manutenção dos estudantes sobre a possibilidade de evasão de um determinado aluno, demonstrou-se que a vantagem deste modelo é sua tempestividade e fácil interpretação. In order to propose a empirical model capable of assisting management decision-making regarding the prediction and prevention of student dropout in a private higher education institution (HEI), this research proposals to analyze the use of academic, financial, geographic and socioeconomic information applied to four supervised machine learning models: [1] Logistic Regression; [2] Decision Tree; [3] Artificial Neural Networks; and [4] Random Forests. Implemented from four different class balancing approaches: [1] unbalanced; [2] up-sampling; [3] down-sampling; and [4] Smote hybrid sampling. As a result, two distinct theoretical models are presented that can be implemented in conjunction with the HEI management systems to permit timely decision making that allow the mitigation of student dropout. In the first, it is proposed the application of the random forest algorithm with hybrid balancing, so that it is possible to calculate the probability of students' evasion at the end of the semester, and to allow those responsible for maintaining students to carry out intervention approaches based on variables that most influence the dropout calculation, this model provides a more accurate output in classifying students and therefore allows a reduction in the number of approaches that would be taken when compared to the others models. The second theoretical method proposes the use of the decision tree model, also developed through hybrid balancing, whose rules for calculating the probability of evasion must be parameterized in the management systems and integrated with the CRM tools of the HEI, in order to notify those responsible for the students' retention about the possibility of dropout, it is demonstrated that the advantage of this model is its timeliness and easy interpretation.
- Subjects :
- Analytics
Dropout
Processo decisório
Aprendizado do computador
Modelos preditivos
Predictive models
Universidades e faculdades - Processamento de dados
Universidades e faculdades particulares - Administração
Administração de empresas
Machine learning
Sistemas de informação gerencial
Evasão universitária
Evasão
Educational management
Gestão educacional
Subjects
Details
- Language :
- Portuguese
- Database :
- OpenAIRE
- Journal :
- Repositório Institucional do FGV (FGV Repositório Digital), Fundação Getulio Vargas (FGV), instacron:FGV
- Accession number :
- edsair.od......3056..2a9c7ab8e9199b86ad0b483d9072cbb8