Двошарова модель для виявлення фальсифікованої інформації з використанням наївного баєсівського класифікатора в соціально орієнтованих системах.

Автор(и)

DOI:

https://doi.org/10.30837/2522-9818.2025.4.112

Ключові слова:

аналіз даних; наївний баєсівський класифікатор; нейронні мережі; паралелізація; фальсифіковані новини.

Анотація

Предметом дослідження є проблема виявлення сфабрикованої інформації в соціально орієнтованих системах, яким властиве значне користувацьке навантаження. Мета – розроблення двошарової моделі класифікації фейкової інформації на основі поєднання наївного баєсівського класифікатора й гібридної рекурентно-згорткової нейромережі. У статті розв’язано такі завдання: експертне оцінювання та доменний аналіз для визначення базових класів фейкової інформації; аналіз лінгвістичних маркерів дезінформації та розроблення векторів ознак для класифікації; створення моделей для сегрегації даних з використанням наївного баєсівського класифікатора; експериментальна перевірка запропонованої двошарової моделі та порівняння з підходом RCNN. Упроваджено такі методи: аналітичний (для формування набору маркерів дезінформації); індуктивний (з метою визначення цільового набору індикаторів для реалізації другого шару моделі); експертне оцінювання (для встановлення  найбільш впливових факторів ефективності та вагових коефіцієнтів ознак); експериментальний і багатокритеріальний методи оцінювання (з метою визначення найбільш ефективної моделі). Досягнуті результати. Сформовано класифікаційну структуру для типів фейкової інформації, що містить п’ять категорій – від жартів до глобально шкідливих новин. Розроблено набір дискримінативних ознак, властивих для сфабрикованої інформації, зокрема первинні лінгвістичні маркери та вторинні стилометричні індикатори. Визначено, що підхід з використанням двошарової моделі продемонстрував у середньому 15% підвищення ефективності порівняно з прямим застосуванням гібридної рекурентно-згортокової нейромережі. Висновки. Застосування двошарової моделі класифікації даних успішно розширює можливості базового виявлення факту фальсифікації інформації, зокрема оцінювання масштабу й аналіз навмисності фабрикації. Емпіричний аналіз демонструє, що імплементація двошарової моделі з наївним баєсівським класифікатором досягає середнього 15% підвищення продуктивності, на відміну від простого застосування нейронної мережі. Ця різниця в продуктивності стає особливо значущою в системах з високою пропускною здатністю, де швидка ідентифікація та реагування на сфабриковану інформацію є критичними операційними параметрами. Здобутий результат дає змогу стверджувати про доцільність упровадження запропонованого підходу, а відповідно, сприяє зменшенню впливу подібної інформації в соціально орієнтованих системах, особливо під час кризових явищ.

Біографії авторів

Артем Ховрат, Харківський національний університет радіоелектроніки

аспірант кафедри "Програмна інженерія"

Володимир Кобзєв, Харківський національний університет радіоелектроніки

кандидат технічних наук, старший науковий співробітник, професор кафедри "Програмна інженерія"

Посилання

References

Aïmeur, I. E., Amri, S., Bassard, G. (2023), "Fake news, disinformation and misinformation in social media: a review", Social Network Analysis and Mining, No. 13 (1). DOI: 10.1007/s13278-023-01028-5

Anders, M. "Fake News Detection. European Data Protection Supervisor", available at: https://edps.europa.eu/press-publications/publications/techsonar/fake-news-detection_en (last accessed 27.06.2025).

Reis, J. C. S., Correia, A., Murai, F., Veloso, A., Benevenuto, F. (2019), "Supervised Learning for Fake News Detection", IEEE Intelligent Systems, No. 34(2), P. 76–81. DOI: 10.1109/MIS.2019.2899143

Yuan, L., Jiang, H., Shen, H., Shi, L., Cheng, N. (2023), "Sustainable Development of Information Dissemination: A Review of Current Fake News Detection Research and Practice", Systems, No. 11(9), Article 458. DOI: 10.3390/systems11090458

Afanasieva, I., Golian, N., Golian, V., Khovrat, A., Onyshchenko, K. (2023), "Application of Neural Networks to Identify of Fake News". Computational Linguistics and Intelligent Systems (COLINS 2023): 7th International Conference, Kharkiv, 20 April – 21 April 2023: CEUR workshop proceedings, No. 3396, P. 346–358, available at: https://ceur-ws.org/Vol-3396/paper28.pdf (last accessed: 27.06.2025).

Rocha, Y.M., de Moura, G.A., Desiderio, G.A., de Oliveira, C.H., Lourenço, F.D., de Figueiredo Nicolete, L.D. (2023), "The impact of fake news on social media and its influence on health during the COVID-19 pandemic: a systematic review", Journal of Public Health, Vol. 31, P. 1007–1016. DOI: 10.1007/s10389-021-01658-z

Karalis, M. (2024), "Fake leads, defamation and destabilization: how online disinformation continues to impact Russia’s invasion of Ukraine", Intelligence and National Security, Vol. 39 (3). P. 512–524. DOI: 10.1080/02684527.2024.2329418

Alonso, M.A., Vilares, D., Gómez-Rodríguez, C., Vilares, J. (2021), "Sentiment Analysis for Fake News Detection", Electronics, No. 10(11), Article 1348. DOI: 10.3390/electronics10111348

Tolosana, R., Vera-Rodriguez, R., Fierrez, J., Morales, A., Ortega-Garcia, J. (2020), "Deepfakes and beyond: A Survey of face manipulation and fake detection", Information Fusion, Vol. 64, P. 131–148. DOI: 10.1016/j.inffus.2020.06.014

Bhatia, N. (2020), "Using transfer learning, spectrogram audio classification, and MIT app inventor to facilitate machine learning understanding", Massachusetts Institute of Technology, Р.11–112. available at: https://dspace.mit.edu/handle/1721.1/127379 (last accessed 27.06.2025).

Xia, T., Chen, X. A. (2020), "A Discrete Hidden Markov Model for SMS Spam Detection", Applied Science, Vol. 10 (14), Article 5011. DOI: 10.3390/app10145011

Najar, F., Zamzami, N., Bouguila, S. (2019), "Fake News Detection Using Bayesian Inference", Information Reuse and Integration for Data Science, 30 July – 1 August 2019, Los Angeles, P. 389–394. DOI: 10.1109/IRI.2019.00066

Breuer, A., Eilat, R., Weinsberg, U. (2023), "Friend or Faux: Graph-Based Early Detection of Fake Accounts on Social Networks", Web Conference, 20–24 April 2023, Taipei, P. 1287–1297. DOI: 10.1145/3366423.3380204

Yakovlev, S., Khovrat, A., Kobziev, V., Uzlov, D. (2024), "Decision Support Algorithm in the Development of Information Sensitive Socially Oriented Systems". Workshop of IT-professionals on Artificial Intelligence, Cambridge, 25 September – 27 September 2024: CEUR workshop proceedings, P. 315–326, available at: https://ceur-ws.org/Vol-3777/paper20.pdf (last accessed: 27.06.2025).

Choudhary, A., Arora, A. (2021), "Linguistic feature based learning model for fake news detection and classification", Expert Systems with Applications, Vol. 169, Article 114171. DOI: 10.1016/j.eswa.2020.114171

##submission.downloads##

Опубліковано

2025-12-28

Як цитувати

Ховрат, А., & Кобзєв, В. (2025). Двошарова модель для виявлення фальсифікованої інформації з використанням наївного баєсівського класифікатора в соціально орієнтованих системах. СУЧАСНИЙ СТАН НАУКОВИХ ДОСЛІДЖЕНЬ ТА ТЕХНОЛОГІЙ В ПРОМИСЛОВОСТІ, (4(34), 112–123. https://doi.org/10.30837/2522-9818.2025.4.112