ІМПЛЕМЕНТАЦІЯ ІНТЕЛЕКТУАЛЬНОЇ СИСТЕМИ АНАЛІЗУ ТОНАЛЬНОСТІ ТА КЛАСТЕРИЗАЦІЇ ПУБЛІКАЦІЙ У СОЦІАЛЬНІЙ МЕРЕЖІ TWITTER

Автор(и)

DOI:

https://doi.org/10.30837/ITSSI.2023.23.025

Ключові слова:

нейронна мережа; LSTM; аналіз тональності публікацій; кластерний аналіз; соціальна мережа Twitter

Анотація

Завдяки інтенсивному розвитку соціальних мереж постійно зростає популярність обміну короткими текстовими повідомленнями, тональність яких може бути чутливим індикатором суспільних настроїв і важливих соціальних явищ, цікавих для соціологів, політиків, економістів і фахівців інших галузей. У зв’язку з цим завдання автоматизації опрацювання таких природномовних повідомлень має вагомий науковий і практичний інтерес. Об’єктом дослідження є тональність користувацьких публікацій у соціальній мережі Twitter. Завдяки широкій популярності цієї соціальної мережі та великій кількості повідомлень, лаконічних за своєю сутністю, можна зручно визначати настрій користувацьких публікацій та об’єднувати їх у кластери відповідно до заданих параметрів інтелектуальної системи. Предметом дослідження є методи й алгоритми аналізу тональності великих масивів повідомлень, що містять необхідні ключові слова та стосуються конкретної теми, визначення факторів та розподілів тональності повідомлень, з огляду на вхідний масив даних системи, поділ повідомлень на основні групи та надання оцінок у визначених межах кожній групі, поділ на кластери відповідно до отриманої точки пошуку та відображення отриманих результатів у потрібному форматі. Мета роботи – реалізація інтелектуальної системи аналізу тональності та кластеризації публікацій на основі рекурентної нейронної мережі довгої короткочасної пам’яті (LSTM) та алгоритму кластеризації k-means. У статті передбачається вирішити такі основні завдання: проаналізувати найбільш уживані та найновіші алгоритми, методи, підходи та засоби імплементації завдань аналізу тональності й кластеризації публікацій у соціальних мережах; розробити концептуальну структуру інтелектуальної системи аналізу тональності й кластеризації публікацій; сформувати функціональні завдання до ключових модулів створюваної інтелектуальної системи аналізу тональності й кластеризації публікацій у соціальній мережі Twitter; реалізувати інтелектуальну систему аналізу тональності й кластеризації публікацій на основі рекурентної нейронної мережі та алгоритму кластеризації k-means і експериментально її перевірити. У роботі застосовано методи: рекурентна нейронна мережа довгої короткочасної пам’яті; алгоритм кластеризації k-means. Здобуто такі результати: проаналізовано, спроєктовано й побудовано загальну структуру інтелектуальної системи аналізу тональності й кластеризації публікацій. Основним завданням створення системи насамперед було покращення рекурентної нейронної мережі довгої короткочасної пам’яті, що, завдяки вдосконаленому алгоритму, суттєво полегшує опрацювання повідомлення обробниками природної мови відповідно до текстових даних певного розміру. Також одночасно використано особливий алгоритм кластеризації, а саме k-means, завдяки чому вдалося змінити загальний підхід до кластеризації та створення фінальних кластерів, відповідно до здобутих результатів роботи рекурентної нейронної мережі. Висновки: унаслідок застосування комбінації LSTM нейронної мережі та алгоритму кластеризації k-means вдалося прискорити процес аналізу тональності й кластеризації публікацій у соціальній мережі Twitter на 10...15% порівняно з аналогічними згортковими нейронними мережами та ієрархічною кластеризацією.

Біографії авторів

Тарас Батюк, Національний університет "Львівська політехніка"

аспірант кафедри "Інформаційні системи та мережі"

Дмитро Досин, Національний університет "Львівська політехніка"

доктор технічних наук, старший науковий співробітник

Посилання

Список літератури

Almahmood R. J. K., Tekerek A. Issues and Solutions in Deep Learning-Enabled Recommendation Systems within the E-Commerce Field. Applied Sciences. 2022. № 12 (21). Р. 256–264. DOI: https://doi.org/10.3390/app122111256

Xie W., Damiano L., Jong C.-H. Emotional appeals and social support in organizational YouTube videos during COVID-19. Telematics and Informatics reports. 2022. № 8 (1). Р. 100–128.

Abbas A. F., Jusoh A., Mas’od A., Alsharif A. H., Ali J. Bibliometrix analysis of information sharing in social media. Cogent Business & Management. 2022. № 9 (1). Р. 521–543. DOI: https://doi.org/10.1080/23311975.2021.2016556

Villegas-Ch. W., Erazo D. M., Ortiz-Garces I., Gaibor-Naranjo W., Palacios-Pacheco X. Artificial Intelligence Model for the Identification of the Personality of Twitter Users through the Analysis of Their Behavior in the Social Network. Electronics. 2022. № 11 (22). Р. 381–399. DOI: https://doi.org/10.3390/electronics11223811

Malkawi R., Daradkeh M., El-Hassan A., Petrov P. A Semantic Similarity-Based Identification Method for Implicit Citation Functions and Sentiments Information. Information. 2022. № 13 (11). Р. 546–561. DOI: https://doi.org/10.3390/info13110546

Yuan Y., You T., Xu T., Yu X. Customer-Oriented Strategic Planning for Hotel Competitiveness Improvement Based on Online Reviews. Sustainability. 2022. № 14 (22). Р. 152–199.

Yin J. Y. B., Saad N. H. M., Yaacob Z. Exploring Sentiment Analysis on E-Commerce Business: Lazada and Shopee. Tem journal. 2022. № 11 (4). Р. 1508–1519. DOI: https://doi.org/10.18421/TEM114-11

Hinduja S., Afrin M., Mistry S., Krishna A. Machine learning-based proactive social-sensor service for mental health monitoring using twitter data. International journal of Information Management Data insights. 2022. № 2 (2). Р. 103–124.

Bhadamkar A., Bhattacharya S. Tesla Inc. Stock Prediction Using Sentiment Analysis. Australasian Accounting, Business and Finance journal. 2022. № 16 (5). Р. 52–66. DOI: https://doi.org/10.14453/aabfj.v16i5.05

Alhakiem H. R., Setiawan E. B. Aspect-Bas1ed Sentiment Analysis on Twitter Using Logistic Regression with FastText Feature Expansion. Jurnal resti (Rekayasa sistem dan Teknologi Informasi). 2022. № 6 (5). Р. 840–846. DOI: https://doi.org/10.29207/resti.v6i5.4429

Pawełoszek I. Towards a Smart City—The Study of Car-Sharing Services in Poland. Energies. 2022. № 15 (22). Р 845–859. DOI: https://doi.org/10.3390/en15228459

Huang X., Gong P., Wang S., White M., Zhang B. Machine Learning Modeling of Vitality Characteristics in Historical Preservation Zones with Multi-Source Data. Buildings. 2022. № 12 (11). Р. 1978–1989. DOI: https://doi.org/10.3390/buildings12111978

Li C., Renda M., Yusuf F., Geller J., Chun S. A. Public Health Policy Monitoring through Public Perceptions: A Case of COVID-19 Tweet Analysis. Information. 2022. № 13 (11). Р. 443–457. DOI: https://doi.org/10.3390/info13110543

Vysotska V. Information Technology for Internet Resources Promotion in Search Systems Based on Content Analysis of Web-Page Keywords. Radio Electronics, Computer Science, Control. 2021. № 3. Р. 133–151.

Corti L., Zanetti M., Tricella G., Bonati M. Social media analysis of Twitter tweets related to ASD in 2019–2020, with particular attention to COVID-19: topic modelling and sentiment analysis. Journal of Big Data. 2022. № 9 (1). Р. 1–17. DOI: https://doi.org/10.1186/s40537-022-00666-4

Lampropoulos G., Keramopoulos E. Virtual Reality in Education: A Comparative Social Media Data and Sentiment Analysis Study. International journal of recent contributions from Engineering, Science & IT. 2007. № 10 (3). Р. 221–235. DOI: https://doi.org/10.3991/ijes.v10i03.34057

Liu H. Online review analysis on various networks’ consumer feedback using deep learning. IET networks. 2022. № 11 (6). Р. 234–244. DOI: https://doi.org/10.1049/ntw2.12045

Wang Y., Chen Z., Fu C. Synergy Masks of Domain Attribute Model DaBERT: Emotional Tracking on Time-Varying Virtual Space Communication. Sensors. 2022. № 22 (21). Р. 450–471. DOI: https://doi.org/10.3390/s22218450

References

Almahmood R. J. K., Tekerek A. Issues and Solutions in Deep Learning-Enabled Recommendation Systems within the E-Commerce Field. Applied Sciences. 2022. № 12 (21). Р. 256–264. DOI: https://doi.org/10.3390/app122111256

Xie W., Damiano L., Jong C.-H. Emotional appeals and social support in organizational YouTube videos during COVID-19. Telematics and Informatics reports. 2022. № 8 (1). Р. 100–128.

Abbas A. F., Jusoh A., Mas’od A., Alsharif A. H., Ali J. Bibliometrix analysis of information sharing in social media. Cogent Business & Management. 2022. № 9 (1). Р. 521–543. DOI: https://doi.org/10.1080/23311975.2021.2016556

Villegas-Ch. W., Erazo D. M., Ortiz-Garces I., Gaibor-Naranjo W., Palacios-Pacheco X. Artificial Intelligence Model for the Identification of the Personality of Twitter Users through the Analysis of Their Behavior in the Social Network. Electronics. 2022. № 11 (22). Р. 381–399. DOI: https://doi.org/10.3390/electronics11223811

Malkawi R., Daradkeh M., El-Hassan A., Petrov P. A Semantic Similarity-Based Identification Method for Implicit Citation Functions and Sentiments Information. Information. 2022. № 13 (11). Р. 546–561. DOI: https://doi.org/10.3390/info13110546

Yuan Y., You T., Xu T., Yu X. Customer-Oriented Strategic Planning for Hotel Competitiveness Improvement Based on Online Reviews. Sustainability. 2022. № 14 (22). Р. 152–199.

Yin J. Y. B., Saad N. H. M., Yaacob Z. Exploring Sentiment Analysis on E-Commerce Business: Lazada and Shopee. Tem journal. 2022. № 11 (4). Р. 1508–1519. DOI: https://doi.org/10.18421/TEM114-11

Hinduja S., Afrin M., Mistry S., Krishna A. Machine learning-based proactive social-sensor service for mental health monitoring using twitter data. International journal of Information Management Data insights. 2022. № 2 (2). Р. 103–124.

Bhadamkar A., Bhattacharya S. Tesla Inc. Stock Prediction Using Sentiment Analysis. Australasian Accounting, Business and Finance journal. 2022. № 16 (5). Р. 52–66. DOI: https://doi.org/10.14453/aabfj.v16i5.05

Alhakiem H. R., Setiawan E. B. Aspect-Bas1ed Sentiment Analysis on Twitter Using Logistic Regression with FastText Feature Expansion. Jurnal resti (Rekayasa sistem dan Teknologi Informasi). 2022. № 6 (5). Р. 840–846. DOI: https://doi.org/10.29207/resti.v6i5.4429

Pawełoszek I. Towards a Smart City—The Study of Car-Sharing Services in Poland. Energies. 2022. № 15 (22). Р 845–859. DOI: https://doi.org/10.3390/en15228459

Huang X., Gong P., Wang S., White M., Zhang B. Machine Learning Modeling of Vitality Characteristics in Historical Preservation Zones with Multi-Source Data. Buildings. 2022. № 12 (11). Р. 1978–1989. DOI: https://doi.org/10.3390/buildings12111978

Li C., Renda M., Yusuf F., Geller J., Chun S. A. Public Health Policy Monitoring through Public Perceptions: A Case of COVID-19 Tweet Analysis. Information. 2022. № 13 (11). Р. 443–457. DOI: https://doi.org/10.3390/info13110543

Vysotska V. Information Technology for Internet Resources Promotion in Search Systems Based on Content Analysis of Web-Page Keywords. Radio Electronics, Computer Science, Control. 2021. № 3. Р. 133–151.

Corti L., Zanetti M., Tricella G., Bonati M. Social media analysis of Twitter tweets related to ASD in 2019–2020, with particular attention to COVID-19: topic modelling and sentiment analysis. Journal of Big Data. 2022. № 9 (1). Р. 1–17. DOI: https://doi.org/10.1186/s40537-022-00666-4

Lampropoulos G., Keramopoulos E. Virtual Reality in Education: A Comparative Social Media Data and Sentiment Analysis Study. International journal of recent contributions from Engineering, Science & IT. 2007. № 10 (3). Р. 221–235. DOI: https://doi.org/10.3991/ijes.v10i03.34057

Liu H. Online review analysis on various networks’ consumer feedback using deep learning. IET networks. 2022. № 11 (6). Р. 234–244. DOI: https://doi.org/10.1049/ntw2.12045

Wang Y., Chen Z., Fu C. Synergy Masks of Domain Attribute Model DaBERT: Emotional Tracking on Time-Varying Virtual Space Communication. Sensors. 2022. № 22 (21). Р. 450–471. DOI: https://doi.org/10.3390/s22218450

##submission.downloads##

Опубліковано

2023-04-21

Як цитувати

Батюк, Т., & Досин, Д. (2023). ІМПЛЕМЕНТАЦІЯ ІНТЕЛЕКТУАЛЬНОЇ СИСТЕМИ АНАЛІЗУ ТОНАЛЬНОСТІ ТА КЛАСТЕРИЗАЦІЇ ПУБЛІКАЦІЙ У СОЦІАЛЬНІЙ МЕРЕЖІ TWITTER . СУЧАСНИЙ СТАН НАУКОВИХ ДОСЛІДЖЕНЬ ТА ТЕХНОЛОГІЙ В ПРОМИСЛОВОСТІ, (1 (23), 25–44. https://doi.org/10.30837/ITSSI.2023.23.025