Back to Search Start Over

Predicting the admission decision of a participant to the school of physical education and sports at Cukurova University by using different machine learning methods combined with feature selection

Authors :
Özsert Yiğit, Gözde
Akay, M. Fatih
Çukurova Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı
Akay, Mehmet Fatih
Bilgisayar Mühendisliği Anabilim Dalı
Publication Year :
2016
Publisher :
Çukurova Üniversitesi, Fen Bilimleri Enstitüsü, 2016.

Abstract

TEZ10046 Tez (Yüksek Lisans) -- Çukurova Üniversitesi, Adana, 2016. Kaynakça (s. 125-127) var. xx, 129 s. : res. (bzs. rnk.), tablo ; 29 cm. Bu tezin amacı Çukurova Üniversitesi Beden Eğitimi ve Spor Yüksekokuluna başvuran adayların kabul edilip edilmeyeceğini nitelik seçme algoritmaları ile birleştirilmiş Destek Vektör Makineleri (SVM), Çok Katmanlı Algılayıcı (MLP), Radyal Tabanlı Fonksiyon Ağları, Ağaç Yükseltme ve K-Ortalama Sınıflandırma Algoritmaları kullanarak tahmin etmektir. Nitelik seçme algoritmaları olarak Relif-F, Korelasyon-tabanlı Nitelik Seçme (CFS) ve F-Score algoritmaları seçilmiştir. Veri kümeleleri 10 katlı çapraz doğrulama ve farklı yüzdesel oranlar kullanılarak eğitim ve test kümelerine ayrılmıştır. Deneyler sırasıyla 2006 ve 2007 yıllarında okula alınan adayların gerçek test sonuçları üzerinde yapılmıştır. Her iki veri seti üzerinde sınıflayıcıların sınıflandırma performansı; doğruluk, duyarlılık, özgünlük, pozitif öngörü değeri ve negatif öngörü değeri kullanılarak değerlendirilmiştir. Sonuçlar tahmin modellerindeki tahmin değişkenleri azaldıkça doğruluğun da paralel olarak azaldığını göstermektedir. The purpose of this thesis is to develop new hybrid admission decision prediction models by using different machine learning methods including Support Vector Machines (SVM), Multilayer Perceptron (MLP), Radial Basis Function (RBF) Network, TreeBoost (TB) and K-Means Clustering (KMC) combined with feature selection algorithms to investigate the effect of the predictor variables on the admission decision of a candidate to the School of Physical Education and Sports at Cukurova University. Three feature selection algorithms including Relief-F, F-Score and Correlation-based Feature Selection (CFS) have been considered. Experiments have been conducted on the datasets, which contain data of participants who applied to the School in 2006 and 2007. The datasets have been randomly split into training and test sets using 10-fold cross validation as well as different percentage ratios. The performance of the prediction models for the datasets has been assessed using classification accuracy, specificity, sensitivity, positive predictive value (PPV) and negative predictive value (NPV). The results show that a decrease in the number of predictor variables in the prediction models usually leads to a parallel decrease in classification accuracy. Bu çalışma Ç.Ü. Bilimsel Araştırma Projeleri Birimi tarafından desteklenmiştir. Proje No: FYL-2015-3845.

Details

Language :
English
Database :
OpenAIRE
Accession number :
edsair.dedup.wf.001..027cf16b5008db41af709adcf7ec6e16