ELECTRA ve XLNET Modellerini Kullanarak X Verilerinden İntihara Meyilli İçerikleri Tespit Etme
Tolga Aydın1, Muhammet Coşkun Irmak2*
1Atatürk Üniversitesi, Erzurum, Türkiye
2Van Yüzüncü Yıl Üniversitesi, Van, Türkiye
* Corresponding author: coskunirmak@yyu.edu.tr
Presented at the Cognitive Models and Artificial Intelligence Conference (BMYZ2023), Ankara, Türkiye, Oct 26, 2023
SETSCI Conference Proceedings, 2023, 15, Page (s): 45-50 , https://doi.org/10.36287/setsci.6.1.019
Published Date: 29 December 2023 | 1454 7
Abstract
İntihar konusu, birçok farklı disiplin tarafından incelenen ve tarihin her döneminde karşılaşılan bir konu olmuştur. Teknolojinin gelişimi ve akıllı telefonların her yerde bulunması sebebiyle, kullanıcılar, özellikle çevrimiçi sosyal platformlar aracılığıyla duygu ve düşüncelerini rahatlıkla ifade edebilmişlerdir. Paylaşılan bu düşüncelerden biri de intihar düşüncesidir. İntiharın önlenebilmesi ve genç popülasyonda artan intihar oranlarının kontrol altına alınabilmesi için son zamanlarda sosyal medyada paylaşılan intihar düşüncelerinin tespiti üzerine yapılan araştırmaların sayısı her geçen gün artmaktadır. Bu çalışmada, en popüler sosyal medya platformlarından birisi olan X’te paylaşılan gönderilerden hazırlanan bir veri seti üzerinde makine öğrenmesi ve doğal dil işleme teknikleri kullanılarak bu paylaşımı yapan kişilerin intihara meyilli olup olmadığının tespitinin yapılmasına odaklanılmıştır. Önceden eğitilmiş transformatör yöntemlerinin klasik makine öğrenmesi yöntemleri ile karşılaştırmalı bir analizi sunulmuştur. Tüm modeller içerisinde en yüksek doğruluk oranı, ELECTRA modeli ile %96.61 olarak elde edilmiştir. Bu bulgular, intihara meyilli tweetlerin tespitinde transformatör modellerinin potansiyelinin yüksek olduğunu göstermekte ve özellikle ELECTRA'nın bu alanda etkili bir araç olabileceğini ortaya koymaktadır.
Keywords - İntihar tespiti, Doğal dil işleme, ELECTRA, XLNET, Transformatör model
References
Rabani, S. T., Khan, Q. R., and Khanday, A. M. U. D. “Detection of suicidal ideation on Twitter using machine learning & ensemble approaches”. Baghdad science journal, 17(4), 1328-1328, 2020.
Haque, R., Islam, N., Islam, M., and Ahsan, M. M. “A comparative analysis on suicidal ideation detection using NLP, machine, and deep learning.” Technologies, 10(3), 57,2022.
Baghdadi, N. A., Malki, A., Balaha, H. M., AbdulAzeem, Y., Badawy, M., and Elhosseini, M. “An optimized deep learning approach for suicide detection through Arabic tweets.” PeerJ Computer Science, 8, e1070, 2022.
Abdulsalam, A., Alhothali, A., and Al-Ghamdi, S. “Detecting Suicidality in Arabic Tweets Using Machine Learning and Deep Learning Techniques.” arXiv preprint arXiv:2309.00246, 2023.
Abdulsalam, A., and Alhothali, A. “Suicidal ideation detection on social media: A review of machine learning methods.” arXiv preprint arXiv:2201.10515, 2022.
Ramírez-Cifuentes, D., Freire, A., Baeza-Yates, R., Puntí, J., Medina-Bravo, P., Velazquez, D. A., ... and Gonzàlez, J. “Detection of suicidal ideation on social media: multimodal, relational, and behavioral analysis.” Journal of medical internet research, 22(7), e17758, 2020.
Chatterjee, M., Kumar, P., Samanta, P., and Sarkar, D. “Suicide ideation detection from online social media: A multi-modal feature based technique.” International Journal of Information Management Data Insights, 2(2), 100103, 2022.
Sabri, N. M., and Mohamad, N. A. “Detection of Suicidal Tweets Based On Naïve Bayes Algorithm.” International Journal of Advanced Research in Technology and Innovation, 4(3), 47-59, 2022.
Deepa, J., Shriraaman, S., Shruti, V. V., and Vasanth, G. “Detecting and Determining Degree of Suicidal Ideation on Tweets Using LSTM and Machine Learning Models.” Journal of Survey in Fisheries Sciences, 10(2S), 3217-3224, 2023.
Priyamvada, B., Singhal, S., Nayyar, A., Jain, R., Goel, P., Rani, M., and Srivastava, M. “Stacked CNN-LSTM approach for prediction of suicidal ideation on social media.” Multimedia Tools and Applications, 1-22, 2023.
Mahmud, S. A., Suicidal Tweet Detection Dataset, (Son Erişim Tarihi: 30.09.2023), https://www.kaggle.com/datasets/aunanya875/suicidal-tweet-detection-dataset
Naveen, S., Kiran, M. S. R., Indupriya, M., Manikanta, T. V., and Sudeep, P. V. “Transformer models for enhancing AttnGAN based text to image generation.” Image and Vision Computing, 115, 104284, 2021.
Clark, K., Luong, M. T., Le, Q. V., and Manning, C. D. “Electra: Pre-training text encoders as discriminators rather than generators.” arXiv preprint arXiv:2003.10555, 2020.
Li, X., Li, L., Ma, W., & Wang, W. “Two-phase flow patterns identification in porous media using feature extraction and SVM.” International Journal of Multiphase Flow, 104222, 2022.
Singh, N., Jena, S., and Panigrahi, C. K. “A novel application of Decision Tree classifier in solar irradiance prediction.” Materials Today: Proceedings, 58, 316-323, 2022.
Kavzoğlu, T., and Çölkesen, İ. “Karar ağaçları ile uydu görüntülerinin sınıflandırılması.” Harita Teknolojileri Elektronik Dergisi, 2(1), 36-45, 2010.
Yangın, G. “XGBoost ve Karar Ağacı Tabanlı Algoritmaların Diyabet Veri Setleri Üzerine Uygulaması” Mimar Sinan Güzel Sanatlar Üniversitesi, Fen Bilimleri Enstitüsü, İstatistik Anabilim Dalı, İstanbul, 2019.