Back to Search Start Over

Analysis of factors affecting student’s academic achievement with high-dimensional sparse discrete choice models and causal machine learning techniques

Authors :
Türküz, Elanur
Çağlayan Akay, Ebru
Marmara Üniversitesi
Sosyal Bilimler Enstitüsü
Ekonometri Anabilim Dalı
Ekonometri Bilim Dalı
Publication Year :
2023

Abstract

Nedensel etkinin sapmasız tahmini noktasında kontrol değişkenlerin doğru seçimi ekonometride önemli bir yere sahiptir. İhmal edilmiş değişkenden kaynaklı bir sapmaya neden olmamak için yüksek boyutlu bir uzaydan hangi kontrol değişkenlerin seçilmesi gerektiğinin bilinmediği çalışmalarda nedensel parametrelerin model seçim aşamasında meydana gelebilecek hatalara karşı robust tahmincilerle tahmin edilmeleri gerekmektedir. Bu tez çalışmasında Türkiye ve Singapur’daki öğrencilerin okula yapmış oldukları devamsızlığın, öğretmenleri tarafından verilen ödev sıklığının ve okul dışında aldıkları özel derslerin akademik başarılarının bir nedeni olup olmadığını araştırmak üzere yüksek boyutlu seyrek nitel tercih modelleri ile nedensel makine öğrenmesi tekniklerine başvurulmuştur. Kontrol değişkenlerin veri odaklı seçiminin önemini ortaya çıkartabilmek için nedensel parametreler önce düşük boyutlu Lojistik regresyon modeline bloklar halinde eklenen kontrol değişkenler ile tahmin edilmiş sonra elde edilen tahminler nedensel makine öğrenmesi teknikleri arasından otomatik model seçim özelliğine sahip DS-LASSO, PO-LASSO ve DML-LASSO tahmincilerinin yüksek boyutlu seyrek nitel tercih modellerinden elde ettikleri sonuçlar ile karşılaştırılmıştır. Kontrol değişken seçiminin önsel bilgiye dayandırıldığı Lojistik regresyon modellerine ait tahminler kendi içinde karşılaştırıldığında klasik tekniklerin model seçimine karşı önemli bir hassasiyet gösterdiği görülmüştür. Nedensel parametreleri yüksek boyutlu seyrek nitel tercih modelleri aracılığı ile tahmin eden DS-LASSO, PO-LASSO ve DML-LASSO tahmincilerine ait sonuçlar ise kendi aralarında tutarlı olup Türkiye ve Singapur’daki öğrencilerin akademik başarılarının her üç faktörden de etkilendiği ancak etki büyüklüklerinin ülkeler arasında farklılaştığına işaret etmektedir. The decision of how to control for covariates has been a long-standing topic in econometrics. However, since it is often not known which covariates one should select from a high dimensional space to obtain bias-free estimates of causal parameters, techniques which are robust to model selection mistakes have become much more desirable. This study investigates whether school absenteeism, the frequency of homework assigned by teachers, and private lessons have an impact on Turkish and Singaporean students' academic achievement with high-dimensional sparse discrete choice models and causal machine learning techniques.In order to reveal the importance of data-driven model selection, separate low-dimensional Logistic regression models were estimated for both countries. Control variables were added in blocks and estimates of the low-dimensional Logistic regression models were compared to those obtained by causal machine learning estimators such as DS-LASSO, PO-LASSO and DML-LASSO from high-dimensional sparse discrete choice models. Causal parameter estimates of low-dimensional Logistic regression models show significant sensitivity towards the selection of control variables based on priori information. Whereas the findings of the DS-LASSO, PO-LASSO and DML-LASSO estimators show internal consistency and indicate that all three factors affect students’ academic achievement in Turkey and Singapore but differ in effect size.

Details

Language :
Turkish
Database :
OpenAIRE
Accession number :
edsair.od......3098..ec93fc9b260ff09607cf76903a6183f9