ІМПЛЕМЕНТАЦІЯ ІНТЕЛЕКТУАЛЬНОЇ СИСТЕМИ АНАЛІЗУ ТОНАЛЬНОСТІ ТА КЛАСТЕРИЗАЦІЇ ПУБЛІКАЦІЙ У СОЦІАЛЬНІЙ МЕРЕЖІ TWITTER
DOI:
https://doi.org/10.30837/ITSSI.2023.23.025Ключові слова:
нейронна мережа; LSTM; аналіз тональності публікацій; кластерний аналіз; соціальна мережа TwitterАнотація
Завдяки інтенсивному розвитку соціальних мереж постійно зростає популярність обміну короткими текстовими повідомленнями, тональність яких може бути чутливим індикатором суспільних настроїв і важливих соціальних явищ, цікавих для соціологів, політиків, економістів і фахівців інших галузей. У зв’язку з цим завдання автоматизації опрацювання таких природномовних повідомлень має вагомий науковий і практичний інтерес. Об’єктом дослідження є тональність користувацьких публікацій у соціальній мережі Twitter. Завдяки широкій популярності цієї соціальної мережі та великій кількості повідомлень, лаконічних за своєю сутністю, можна зручно визначати настрій користувацьких публікацій та об’єднувати їх у кластери відповідно до заданих параметрів інтелектуальної системи. Предметом дослідження є методи й алгоритми аналізу тональності великих масивів повідомлень, що містять необхідні ключові слова та стосуються конкретної теми, визначення факторів та розподілів тональності повідомлень, з огляду на вхідний масив даних системи, поділ повідомлень на основні групи та надання оцінок у визначених межах кожній групі, поділ на кластери відповідно до отриманої точки пошуку та відображення отриманих результатів у потрібному форматі. Мета роботи – реалізація інтелектуальної системи аналізу тональності та кластеризації публікацій на основі рекурентної нейронної мережі довгої короткочасної пам’яті (LSTM) та алгоритму кластеризації k-means. У статті передбачається вирішити такі основні завдання: проаналізувати найбільш уживані та найновіші алгоритми, методи, підходи та засоби імплементації завдань аналізу тональності й кластеризації публікацій у соціальних мережах; розробити концептуальну структуру інтелектуальної системи аналізу тональності й кластеризації публікацій; сформувати функціональні завдання до ключових модулів створюваної інтелектуальної системи аналізу тональності й кластеризації публікацій у соціальній мережі Twitter; реалізувати інтелектуальну систему аналізу тональності й кластеризації публікацій на основі рекурентної нейронної мережі та алгоритму кластеризації k-means і експериментально її перевірити. У роботі застосовано методи: рекурентна нейронна мережа довгої короткочасної пам’яті; алгоритм кластеризації k-means. Здобуто такі результати: проаналізовано, спроєктовано й побудовано загальну структуру інтелектуальної системи аналізу тональності й кластеризації публікацій. Основним завданням створення системи насамперед було покращення рекурентної нейронної мережі довгої короткочасної пам’яті, що, завдяки вдосконаленому алгоритму, суттєво полегшує опрацювання повідомлення обробниками природної мови відповідно до текстових даних певного розміру. Також одночасно використано особливий алгоритм кластеризації, а саме k-means, завдяки чому вдалося змінити загальний підхід до кластеризації та створення фінальних кластерів, відповідно до здобутих результатів роботи рекурентної нейронної мережі. Висновки: унаслідок застосування комбінації LSTM нейронної мережі та алгоритму кластеризації k-means вдалося прискорити процес аналізу тональності й кластеризації публікацій у соціальній мережі Twitter на 10...15% порівняно з аналогічними згортковими нейронними мережами та ієрархічною кластеризацією.
Посилання
Список літератури
Almahmood R. J. K., Tekerek A. Issues and Solutions in Deep Learning-Enabled Recommendation Systems within the E-Commerce Field. Applied Sciences. 2022. № 12 (21). Р. 256–264. DOI: https://doi.org/10.3390/app122111256
Xie W., Damiano L., Jong C.-H. Emotional appeals and social support in organizational YouTube videos during COVID-19. Telematics and Informatics reports. 2022. № 8 (1). Р. 100–128.
Abbas A. F., Jusoh A., Mas’od A., Alsharif A. H., Ali J. Bibliometrix analysis of information sharing in social media. Cogent Business & Management. 2022. № 9 (1). Р. 521–543. DOI: https://doi.org/10.1080/23311975.2021.2016556
Villegas-Ch. W., Erazo D. M., Ortiz-Garces I., Gaibor-Naranjo W., Palacios-Pacheco X. Artificial Intelligence Model for the Identification of the Personality of Twitter Users through the Analysis of Their Behavior in the Social Network. Electronics. 2022. № 11 (22). Р. 381–399. DOI: https://doi.org/10.3390/electronics11223811
Malkawi R., Daradkeh M., El-Hassan A., Petrov P. A Semantic Similarity-Based Identification Method for Implicit Citation Functions and Sentiments Information. Information. 2022. № 13 (11). Р. 546–561. DOI: https://doi.org/10.3390/info13110546
Yuan Y., You T., Xu T., Yu X. Customer-Oriented Strategic Planning for Hotel Competitiveness Improvement Based on Online Reviews. Sustainability. 2022. № 14 (22). Р. 152–199.
Yin J. Y. B., Saad N. H. M., Yaacob Z. Exploring Sentiment Analysis on E-Commerce Business: Lazada and Shopee. Tem journal. 2022. № 11 (4). Р. 1508–1519. DOI: https://doi.org/10.18421/TEM114-11
Hinduja S., Afrin M., Mistry S., Krishna A. Machine learning-based proactive social-sensor service for mental health monitoring using twitter data. International journal of Information Management Data insights. 2022. № 2 (2). Р. 103–124.
Bhadamkar A., Bhattacharya S. Tesla Inc. Stock Prediction Using Sentiment Analysis. Australasian Accounting, Business and Finance journal. 2022. № 16 (5). Р. 52–66. DOI: https://doi.org/10.14453/aabfj.v16i5.05
Alhakiem H. R., Setiawan E. B. Aspect-Bas1ed Sentiment Analysis on Twitter Using Logistic Regression with FastText Feature Expansion. Jurnal resti (Rekayasa sistem dan Teknologi Informasi). 2022. № 6 (5). Р. 840–846. DOI: https://doi.org/10.29207/resti.v6i5.4429
Pawełoszek I. Towards a Smart City—The Study of Car-Sharing Services in Poland. Energies. 2022. № 15 (22). Р 845–859. DOI: https://doi.org/10.3390/en15228459
Huang X., Gong P., Wang S., White M., Zhang B. Machine Learning Modeling of Vitality Characteristics in Historical Preservation Zones with Multi-Source Data. Buildings. 2022. № 12 (11). Р. 1978–1989. DOI: https://doi.org/10.3390/buildings12111978
Li C., Renda M., Yusuf F., Geller J., Chun S. A. Public Health Policy Monitoring through Public Perceptions: A Case of COVID-19 Tweet Analysis. Information. 2022. № 13 (11). Р. 443–457. DOI: https://doi.org/10.3390/info13110543
Vysotska V. Information Technology for Internet Resources Promotion in Search Systems Based on Content Analysis of Web-Page Keywords. Radio Electronics, Computer Science, Control. 2021. № 3. Р. 133–151.
Corti L., Zanetti M., Tricella G., Bonati M. Social media analysis of Twitter tweets related to ASD in 2019–2020, with particular attention to COVID-19: topic modelling and sentiment analysis. Journal of Big Data. 2022. № 9 (1). Р. 1–17. DOI: https://doi.org/10.1186/s40537-022-00666-4
Lampropoulos G., Keramopoulos E. Virtual Reality in Education: A Comparative Social Media Data and Sentiment Analysis Study. International journal of recent contributions from Engineering, Science & IT. 2007. № 10 (3). Р. 221–235. DOI: https://doi.org/10.3991/ijes.v10i03.34057
Liu H. Online review analysis on various networks’ consumer feedback using deep learning. IET networks. 2022. № 11 (6). Р. 234–244. DOI: https://doi.org/10.1049/ntw2.12045
Wang Y., Chen Z., Fu C. Synergy Masks of Domain Attribute Model DaBERT: Emotional Tracking on Time-Varying Virtual Space Communication. Sensors. 2022. № 22 (21). Р. 450–471. DOI: https://doi.org/10.3390/s22218450
References
Almahmood R. J. K., Tekerek A. Issues and Solutions in Deep Learning-Enabled Recommendation Systems within the E-Commerce Field. Applied Sciences. 2022. № 12 (21). Р. 256–264. DOI: https://doi.org/10.3390/app122111256
Xie W., Damiano L., Jong C.-H. Emotional appeals and social support in organizational YouTube videos during COVID-19. Telematics and Informatics reports. 2022. № 8 (1). Р. 100–128.
Abbas A. F., Jusoh A., Mas’od A., Alsharif A. H., Ali J. Bibliometrix analysis of information sharing in social media. Cogent Business & Management. 2022. № 9 (1). Р. 521–543. DOI: https://doi.org/10.1080/23311975.2021.2016556
Villegas-Ch. W., Erazo D. M., Ortiz-Garces I., Gaibor-Naranjo W., Palacios-Pacheco X. Artificial Intelligence Model for the Identification of the Personality of Twitter Users through the Analysis of Their Behavior in the Social Network. Electronics. 2022. № 11 (22). Р. 381–399. DOI: https://doi.org/10.3390/electronics11223811
Malkawi R., Daradkeh M., El-Hassan A., Petrov P. A Semantic Similarity-Based Identification Method for Implicit Citation Functions and Sentiments Information. Information. 2022. № 13 (11). Р. 546–561. DOI: https://doi.org/10.3390/info13110546
Yuan Y., You T., Xu T., Yu X. Customer-Oriented Strategic Planning for Hotel Competitiveness Improvement Based on Online Reviews. Sustainability. 2022. № 14 (22). Р. 152–199.
Yin J. Y. B., Saad N. H. M., Yaacob Z. Exploring Sentiment Analysis on E-Commerce Business: Lazada and Shopee. Tem journal. 2022. № 11 (4). Р. 1508–1519. DOI: https://doi.org/10.18421/TEM114-11
Hinduja S., Afrin M., Mistry S., Krishna A. Machine learning-based proactive social-sensor service for mental health monitoring using twitter data. International journal of Information Management Data insights. 2022. № 2 (2). Р. 103–124.
Bhadamkar A., Bhattacharya S. Tesla Inc. Stock Prediction Using Sentiment Analysis. Australasian Accounting, Business and Finance journal. 2022. № 16 (5). Р. 52–66. DOI: https://doi.org/10.14453/aabfj.v16i5.05
Alhakiem H. R., Setiawan E. B. Aspect-Bas1ed Sentiment Analysis on Twitter Using Logistic Regression with FastText Feature Expansion. Jurnal resti (Rekayasa sistem dan Teknologi Informasi). 2022. № 6 (5). Р. 840–846. DOI: https://doi.org/10.29207/resti.v6i5.4429
Pawełoszek I. Towards a Smart City—The Study of Car-Sharing Services in Poland. Energies. 2022. № 15 (22). Р 845–859. DOI: https://doi.org/10.3390/en15228459
Huang X., Gong P., Wang S., White M., Zhang B. Machine Learning Modeling of Vitality Characteristics in Historical Preservation Zones with Multi-Source Data. Buildings. 2022. № 12 (11). Р. 1978–1989. DOI: https://doi.org/10.3390/buildings12111978
Li C., Renda M., Yusuf F., Geller J., Chun S. A. Public Health Policy Monitoring through Public Perceptions: A Case of COVID-19 Tweet Analysis. Information. 2022. № 13 (11). Р. 443–457. DOI: https://doi.org/10.3390/info13110543
Vysotska V. Information Technology for Internet Resources Promotion in Search Systems Based on Content Analysis of Web-Page Keywords. Radio Electronics, Computer Science, Control. 2021. № 3. Р. 133–151.
Corti L., Zanetti M., Tricella G., Bonati M. Social media analysis of Twitter tweets related to ASD in 2019–2020, with particular attention to COVID-19: topic modelling and sentiment analysis. Journal of Big Data. 2022. № 9 (1). Р. 1–17. DOI: https://doi.org/10.1186/s40537-022-00666-4
Lampropoulos G., Keramopoulos E. Virtual Reality in Education: A Comparative Social Media Data and Sentiment Analysis Study. International journal of recent contributions from Engineering, Science & IT. 2007. № 10 (3). Р. 221–235. DOI: https://doi.org/10.3991/ijes.v10i03.34057
Liu H. Online review analysis on various networks’ consumer feedback using deep learning. IET networks. 2022. № 11 (6). Р. 234–244. DOI: https://doi.org/10.1049/ntw2.12045
Wang Y., Chen Z., Fu C. Synergy Masks of Domain Attribute Model DaBERT: Emotional Tracking on Time-Varying Virtual Space Communication. Sensors. 2022. № 22 (21). Р. 450–471. DOI: https://doi.org/10.3390/s22218450
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Наше видання використовує положення про авторські права Creative Commons для журналів відкритого доступу.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0), котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
Автори мають право укладати самостійні додаткові угоди щодо не комерційного та не ексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису опублікованої роботи, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи.