Yurtta Barınan Öğrencilerin Ayrılma Sebeplerinin Veri Madenciliği Yöntemleriyle Analiz Edilmesi
Berrin Değirmenci1*, Oktay Yıldız2
1Gazi Üniversitesi, Ankara, Türkiye
2Gazi Üniversitesi, Ankara, Türkiye
* Corresponding author: berrin.degirmenci@gazi.edu.tr
Presented at the Cognitive Models and Artificial Intelligence Conference (BMYZ2023), Ankara, Türkiye, Oct 26, 2023
SETSCI Conference Proceedings, 2023, 15, Page (s): 76-80 , https://doi.org/10.36287/setsci.6.1.027
Published Date: 29 December 2023 | 1205 2
Abstract
Ülkemizde Üniversite öğrencilerinin büyük bir bölümü öğrenim hayatlarının bir döneminde devlet yurtlarında kalmaktadır. Bu çalışmanın amacı, Kredi ve Yurtlar Genel Müdürlüğü (KYGM)’nde barınan öğrencilerin; yurttan ayrılma sebeplerinin veri madenciliği yöntemleriyle analiz edilmesidir. Yapılan analizler sonucunda yurt şartlarının iyileştirilmesi veya sosyal ortamın düzenlenmesi için öneriler sunulması, ayrılma nedenleri ve barınan öğrencilerin çeşitli özellikleri analiz edilerek; ayrılması baştan öngörülen öğrencilerin yurt başvuru ve yerleştirme kriterlerinin yeniden gözden geçirilmesinin sağlanmasıdır. İlk olarak veri ön işleme ve öznitelik analizi gerçekleştirilmiştir. Öznitelik seçimi, bilgi kazancı ve korelasyon öznitelik sıralama filtresi kullanılarak yapılmıştır. Modellerin aşırı uyumunu önlemek için eğitim seti üzerinde k-katlı çapraz doğrulama kullanılarak, veri setine popüler tahmin modelleri olan; lojistik regresyon, naive bayes, destek vektör makinesi, karar ağaçları, KNN, ANN vb. uygulanmıştır. Önerilen kayıp tahmin modeli; doğruluk, kesinlik, hatırlama, f-ölçüsü ve karar verici etkinliği (ROC) alanı gibi metrikler kullanılarak değerlendirilmiştir. En başarılı sonuçları; Karar Tablosu (DecisionTable) algoritması %86,95 doğruluk ve %89 ROC alanı, Adaboost algoritması %86,93 doğruluk ve %89 ROC alanı ve Karar Kütüğü (Decision Stump) algoritmasın %86,93 doğruluk ve %85 ROC alanı ile göstermiştir.
Keywords - Yurt Memnuniyeti, Sınıflandırma, Kümeleme, Makine Öğrenmesi, Veri Madenciliği
References
E. Kavuncu, “Türkiye’de Üniversitelerde Öğrenci-Yurt Hizmetleri ve Barınma Sorunu”, Eğitim-Öğretim ve Bilim Araştırma Dergisi, sayı:30,pp. 48-50, 2014.
P. Frijters et al., “Heterogeneity in peer effects in random dormitory assignment in a developing country”, Journal of Economic Behavior and Organization, 163, pp.117-134,2019.
N. Perach et al. “Stable matching of student-groups to dormitories”, European Journal of Operational Research, 302 (1) , pp.50-61, 2022.
Ö. Kökalan et al., “Measurement of Service Quality in Public and Private/Foundation University Dormitories: Comparison of Turkish and Foreign Students”, Yüksek Öğretim Dergisi, 9(3), pp.263-278, 2019
I. Ullah et al., “A Churn Prediction Model Using Random Forest: Analysis of Machine Learning Techniques for Churn Prediction and Factor Identification in Telecom Sector”, IEEE Access, vol:7, pp: 60134 – 60149, 2019.
A. De Caigny et al., “A new hybrid classification algorithm for customer churn prediction based on logistic regression and decision trees”, European Journal of operational research, vol:269 (2), pp.760-772,2018.
Tianpei Xu. et al., “Telecom Churn Prediction System Based on Ensemble Learning Using Feature Grouping”, Applied Sciences-Basel, 11(11), doi: 10.3390/app11114742, 2021.
A. Amin et al., “Customer churn prediction in the telecommunication sector using a rough set approach”, Neurocomputing, vol:237, pp.242-254, 2017.
S. Wu et al., “Integrated Churn Prediction and Customer Segmentation Framework for Telco Business”, IEEE ACCESS, Vol. 9, 62118-62136, 2021.
F. Usman-Hamza et al., “Intelligent Decision Forest Models for Customer Churn Prediction”, Applied Sciences, Vol. 12,8270, 2022.
P. Lalwani et al. “Customer churn prediction system: a machine learning approach”, Computing, Vol. 104, No:2, pp.271-294,2021.
D. Al-Najjar et al., “Machine Learning to Develop Credit Card Customer Churn Prediction”, Journal of Theoretical and applied electronic commerce research, Vol. 17, Issue:4,pp:1529-1542,2022
P. Mishra et al., “A Detailed Investigation and Analysis of Using Machine Learning Techniques for Intrusion Detection”, IEEE Communications Surveys & Tutorials, vol.21(1), pp. 686-728,2019
H. Uğuz, “A two-stage feature selection method for text categorization by using information gain, principal component analysis and genetic algorithm”, Knowledge-Based Systems, Vol:24, pp:1024-1032,2011
K. Niu et al., “A Developed Feature Selection Method for Classification Based on United Information Gain”, 2017 IEEE Smartworld, Ubiquitous Intelligence & Computing, Advanced & Trusted Computed, Scalable Computing & Communications, Cloud & Big Data Computing, Internet Of People And Smart City Innovation (Smartworld/Scalcom/Uic/Atc/Cbdcom/Iop/Sci),2017
AM. Kowshalya et al., “Correlation Based Feature Selection Algorithms for Varying Datasets of Different Dimensionality”, Wireless Personan Communications, Vol.108, pp:1977-1993, 2019
A. Çınar, “Performance Evaluation Of Classification Algorithms In Data Mining And An Application With The R Language”, Marmara Üniversitesi Öneri Dergisi, vol. 14(51), pp. 90-111,2019
S. Uddin et al. (2019), “Comparing different supervised machine learning algorithms for disease prediction”, BMC Medical Informatics and Decision Making, 19(1), 2019
TM. Rausch et al., “Predicting online shopping cart abandonment with machine learning approaches”, International Journal of Market Research, Vol:64, pp:89-112, 2022.
C. Cortes and V. Vapnik, Support-Vector Networks. Machine Learning, 20, 273-297. http://dx.doi.org/10.1007/BF00994018,1995