1. Análise preditiva na detecção de evasão de alunos no ensino superior privado brasileiro: abordagem de algoritmos de aprendizado de máquina, com base nas perspectivas acadêmicas, financeiras, geográficas e socioeconômicas
- Author
-
Vescovi, Paulo Victor da Silva, Escolas::EAESP, Sicsú, Abraham Laredo, Gracioso, Alexandre, and Francisco, Eduardo de Rezende
- Subjects
Analytics ,Dropout ,Processo decisório ,Aprendizado do computador ,Modelos preditivos ,Predictive models ,Universidades e faculdades - Processamento de dados ,Universidades e faculdades particulares - Administração ,Administração de empresas ,Machine learning ,Sistemas de informação gerencial ,Evasão universitária ,Evasão ,Educational management ,Gestão educacional - Abstract
Com o objetivo de propor um modelo empírico capaz de auxiliar na tomada de decisão gerencial quanto a previsão e prevenção da evasão de estudantes em uma instituição de ensino superior (IES) privada, esta pesquisa se propõe a analisar a utilização de variáveis acadêmicas, financeiras, geográficas e socioeconômicas aplicadas a quatro modelos supervisionados de aprendizado de máquina: [1] Regressão Logística; [2] Árvore de Decisão; [3] Redes Neurais Artificiais; e [4] Florestas Aleatórias. Implementados a partir de quatro abordagens diferentes de balanceamento de classes: [1] sem balanceamento; [2] com balanceamento para cima (Up-Sampling); [3] com balanceamento para baixo (Down- Sampling); e [4] balanceamento híbrido do tipo Smote. Como resultados, apresentou-se dois modelos empíricos distintos que podem ser implementados em conjunto com os sistemas de gestão empresarial de uma IES de maneira a permitirem uma tomada de decisão tempestiva que possibilite a mitigação da evasão de estudantes. No primeiro, propõem-se a aplicação do algoritmo de floresta aleatória com balanceamento híbrido, de maneira que se possa calcular a probabilidade de evasão dos alunos ao final do semestre, e permitir que os responsáveis pela retenção dos estudantes possam realizar abordagens de intervenção baseadas nas variáveis que mais influenciam no cálculo da evasão, este modelo se mostrou mais preciso na classificação dos alunos e portanto permite uma redução na quantidade de abordagens que seriam realizadas quando comparado aos demais. O segundo método empírico propõe a utilização do modelo de árvores de decisão, também elaborado por meio do balanceamento híbrido, cujas regras de cálculo da probabilidade de evasão devem ser parametrizadas nos sistemas de gestão e integrados com as ferramentas de CRM da IES, a fim de avisar aos responsáveis pela manutenção dos estudantes sobre a possibilidade de evasão de um determinado aluno, demonstrou-se que a vantagem deste modelo é sua tempestividade e fácil interpretação. In order to propose a empirical model capable of assisting management decision-making regarding the prediction and prevention of student dropout in a private higher education institution (HEI), this research proposals to analyze the use of academic, financial, geographic and socioeconomic information applied to four supervised machine learning models: [1] Logistic Regression; [2] Decision Tree; [3] Artificial Neural Networks; and [4] Random Forests. Implemented from four different class balancing approaches: [1] unbalanced; [2] up-sampling; [3] down-sampling; and [4] Smote hybrid sampling. As a result, two distinct theoretical models are presented that can be implemented in conjunction with the HEI management systems to permit timely decision making that allow the mitigation of student dropout. In the first, it is proposed the application of the random forest algorithm with hybrid balancing, so that it is possible to calculate the probability of students' evasion at the end of the semester, and to allow those responsible for maintaining students to carry out intervention approaches based on variables that most influence the dropout calculation, this model provides a more accurate output in classifying students and therefore allows a reduction in the number of approaches that would be taken when compared to the others models. The second theoretical method proposes the use of the decision tree model, also developed through hybrid balancing, whose rules for calculating the probability of evasion must be parameterized in the management systems and integrated with the CRM tools of the HEI, in order to notify those responsible for the students' retention about the possibility of dropout, it is demonstrated that the advantage of this model is its timeliness and easy interpretation.
- Published
- 2020