Двошарова модель для виявлення фальсифікованої інформації з використанням наївного баєсівського класифікатора в соціально орієнтованих системах.
DOI:
https://doi.org/10.30837/2522-9818.2025.4.112Ключові слова:
аналіз даних; наївний баєсівський класифікатор; нейронні мережі; паралелізація; фальсифіковані новини.Анотація
Предметом дослідження є проблема виявлення сфабрикованої інформації в соціально орієнтованих системах, яким властиве значне користувацьке навантаження. Мета – розроблення двошарової моделі класифікації фейкової інформації на основі поєднання наївного баєсівського класифікатора й гібридної рекурентно-згорткової нейромережі. У статті розв’язано такі завдання: експертне оцінювання та доменний аналіз для визначення базових класів фейкової інформації; аналіз лінгвістичних маркерів дезінформації та розроблення векторів ознак для класифікації; створення моделей для сегрегації даних з використанням наївного баєсівського класифікатора; експериментальна перевірка запропонованої двошарової моделі та порівняння з підходом RCNN. Упроваджено такі методи: аналітичний (для формування набору маркерів дезінформації); індуктивний (з метою визначення цільового набору індикаторів для реалізації другого шару моделі); експертне оцінювання (для встановлення найбільш впливових факторів ефективності та вагових коефіцієнтів ознак); експериментальний і багатокритеріальний методи оцінювання (з метою визначення найбільш ефективної моделі). Досягнуті результати. Сформовано класифікаційну структуру для типів фейкової інформації, що містить п’ять категорій – від жартів до глобально шкідливих новин. Розроблено набір дискримінативних ознак, властивих для сфабрикованої інформації, зокрема первинні лінгвістичні маркери та вторинні стилометричні індикатори. Визначено, що підхід з використанням двошарової моделі продемонстрував у середньому 15% підвищення ефективності порівняно з прямим застосуванням гібридної рекурентно-згортокової нейромережі. Висновки. Застосування двошарової моделі класифікації даних успішно розширює можливості базового виявлення факту фальсифікації інформації, зокрема оцінювання масштабу й аналіз навмисності фабрикації. Емпіричний аналіз демонструє, що імплементація двошарової моделі з наївним баєсівським класифікатором досягає середнього 15% підвищення продуктивності, на відміну від простого застосування нейронної мережі. Ця різниця в продуктивності стає особливо значущою в системах з високою пропускною здатністю, де швидка ідентифікація та реагування на сфабриковану інформацію є критичними операційними параметрами. Здобутий результат дає змогу стверджувати про доцільність упровадження запропонованого підходу, а відповідно, сприяє зменшенню впливу подібної інформації в соціально орієнтованих системах, особливо під час кризових явищ.
Посилання
References
Aïmeur, I. E., Amri, S., Bassard, G. (2023), "Fake news, disinformation and misinformation in social media: a review", Social Network Analysis and Mining, No. 13 (1). DOI: 10.1007/s13278-023-01028-5
Anders, M. "Fake News Detection. European Data Protection Supervisor", available at: https://edps.europa.eu/press-publications/publications/techsonar/fake-news-detection_en (last accessed 27.06.2025).
Reis, J. C. S., Correia, A., Murai, F., Veloso, A., Benevenuto, F. (2019), "Supervised Learning for Fake News Detection", IEEE Intelligent Systems, No. 34(2), P. 76–81. DOI: 10.1109/MIS.2019.2899143
Yuan, L., Jiang, H., Shen, H., Shi, L., Cheng, N. (2023), "Sustainable Development of Information Dissemination: A Review of Current Fake News Detection Research and Practice", Systems, No. 11(9), Article 458. DOI: 10.3390/systems11090458
Afanasieva, I., Golian, N., Golian, V., Khovrat, A., Onyshchenko, K. (2023), "Application of Neural Networks to Identify of Fake News". Computational Linguistics and Intelligent Systems (COLINS 2023): 7th International Conference, Kharkiv, 20 April – 21 April 2023: CEUR workshop proceedings, No. 3396, P. 346–358, available at: https://ceur-ws.org/Vol-3396/paper28.pdf (last accessed: 27.06.2025).
Rocha, Y.M., de Moura, G.A., Desiderio, G.A., de Oliveira, C.H., Lourenço, F.D., de Figueiredo Nicolete, L.D. (2023), "The impact of fake news on social media and its influence on health during the COVID-19 pandemic: a systematic review", Journal of Public Health, Vol. 31, P. 1007–1016. DOI: 10.1007/s10389-021-01658-z
Karalis, M. (2024), "Fake leads, defamation and destabilization: how online disinformation continues to impact Russia’s invasion of Ukraine", Intelligence and National Security, Vol. 39 (3). P. 512–524. DOI: 10.1080/02684527.2024.2329418
Alonso, M.A., Vilares, D., Gómez-Rodríguez, C., Vilares, J. (2021), "Sentiment Analysis for Fake News Detection", Electronics, No. 10(11), Article 1348. DOI: 10.3390/electronics10111348
Tolosana, R., Vera-Rodriguez, R., Fierrez, J., Morales, A., Ortega-Garcia, J. (2020), "Deepfakes and beyond: A Survey of face manipulation and fake detection", Information Fusion, Vol. 64, P. 131–148. DOI: 10.1016/j.inffus.2020.06.014
Bhatia, N. (2020), "Using transfer learning, spectrogram audio classification, and MIT app inventor to facilitate machine learning understanding", Massachusetts Institute of Technology, Р.11–112. available at: https://dspace.mit.edu/handle/1721.1/127379 (last accessed 27.06.2025).
Xia, T., Chen, X. A. (2020), "A Discrete Hidden Markov Model for SMS Spam Detection", Applied Science, Vol. 10 (14), Article 5011. DOI: 10.3390/app10145011
Najar, F., Zamzami, N., Bouguila, S. (2019), "Fake News Detection Using Bayesian Inference", Information Reuse and Integration for Data Science, 30 July – 1 August 2019, Los Angeles, P. 389–394. DOI: 10.1109/IRI.2019.00066
Breuer, A., Eilat, R., Weinsberg, U. (2023), "Friend or Faux: Graph-Based Early Detection of Fake Accounts on Social Networks", Web Conference, 20–24 April 2023, Taipei, P. 1287–1297. DOI: 10.1145/3366423.3380204
Yakovlev, S., Khovrat, A., Kobziev, V., Uzlov, D. (2024), "Decision Support Algorithm in the Development of Information Sensitive Socially Oriented Systems". Workshop of IT-professionals on Artificial Intelligence, Cambridge, 25 September – 27 September 2024: CEUR workshop proceedings, P. 315–326, available at: https://ceur-ws.org/Vol-3777/paper20.pdf (last accessed: 27.06.2025).
Choudhary, A., Arora, A. (2021), "Linguistic feature based learning model for fake news detection and classification", Expert Systems with Applications, Vol. 169, Article 114171. DOI: 10.1016/j.eswa.2020.114171
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Наше видання використовує положення про авторські права Creative Commons для журналів відкритого доступу.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0), котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
Автори мають право укладати самостійні додаткові угоди щодо не комерційного та не ексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису опублікованої роботи, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи.












