Query expansion based on context-dependent sentiment analysis in databases with domain-specific filtering

Василь Вікторович Мелюх; Катерина Романівна Потапова; Микола Васильович  Наливайчук; Андрій Іванович Дичка

doi:10.15587/1729-4061.2025.322120

Розширення запитів на основі аналізу контекстно-залежного настрою в базах даних з фільтрацією за доменом

Автор(и)

Василь Вікторович Мелюх Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0009-0009-3783-9954
Катерина Романівна Потапова Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0000-0002-3347-6350
Микола Васильович Наливайчук Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0000-0002-8942-9844
Андрій Іванович Дичка Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0000-0003-0578-2788

DOI:

https://doi.org/10.15587/1729-4061.2025.322120

Ключові слова:

розширення запитів, обробка природної мови, пошук інформації, семантичний аналіз, бази даних

Анотація

Об’єктом дослідження є процеси інформаційного пошуку у предметно-орієнтованих базах даних, які потребують адаптивного підходу для розширення запитів. Застосовуючи методи обробки природної мови (Natural Language Processing), зокрема контекстуальні вбудовування та архітектури трансформерів, дослідження акцентує увагу на адаптивному визначенні наміру користувача в межах поданого запиту. Це передбачає аналіз і застосування алгоритмів обробки тексту з доменною фільтрацією для підвищення точності та релевантності результатів пошуку. Удосконалений метод демонструє підвищення точності контекстно-чутливих моделей на 6% у порівнянні з базовими підходами. Агрегований показник F1-міри, який об’єднує точність, повноту та влучність, відображає релевантність побудованих моделей, показуючи приріст на 6-8%. Різниця між найменш і найбільш ефективними методами становить 16% у точності та 17% у релевантності. Вдосконалений метод долає обмеження статичних традиційних синонімічних і статистичних методів, динамічно інтерпретуючи взаємозв’язок між тональністю, контекстом і доменною специфікою контенту. Покращене семантичне розуміння дозволяє точніше узгоджувати розширені запити з цілями користувача. Це може бути ефективно застосованим на практиці в умовах, коли системи інформаційного пошуку працюють у межах доменно-специфічних баз даних. Також може стосуватися сценаріїв, у яких запити користувачів містять складні, емоційно забарвлені мовні конструкції, що потребують глибшого розуміння взаємозв’язків й тональності слів. Однак реалізація методу потребує навчання на високоякісних доменно-специфічних наборах даних із контекстуальними мітками, що могли б забезпечили ефективну та точну адаптацію

Біографії авторів

Василь Вікторович Мелюх, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Аспірант

Кафедра програмного забезпечення комп’ютерних систем

Катерина Романівна Потапова, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Кандидат технічних наук, доцент

Кафедра системного програмування і спеціалізованих комп'ютерних систем

Микола Васильович Наливайчук, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Кандидат технічних наук, старший викладач

Кафедра системного програмування і спеціалізованих комп'ютерних систем

Андрій Іванович Дичка, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Доктор філософії (PhD) з інженерії програмного забезпечення

Кафедра програмного забезпечення комп’ютерних систем

Посилання

Cai, F., de Rijke, M. (2016). A Survey of Query Auto Completion in Information Retrieval. Foundations and Trends® in Information Retrieval, 10 (4), 273–363. https://doi.org/10.1561/1500000055
Sparck Jones, K. (1972). A statistical interpretation of term specificity and its application in retrieval. Journal of Documentation, 28 (1), 11–21. https://doi.org/10.1108/eb026526
Manning, C. D., Raghavan, P., Schütze, H. (2008). Introduction to Information Retrieval. Cambridge: Cambridge University Press. https://doi.org/10.1017/cbo9780511809071
Hu, Z., Dychka, I., Potapova, K., Meliukh, V. (2024). Augmenting Sentiment Analysis Prediction in Binary Text Classification through Advanced Natural Language Processing Models and Classifiers. International Journal of Information Technology and Computer Science, 16 (2), 16–31. https://doi.org/10.5815/ijitcs.2024.02.02
Mikolov, T., Chen, K., Corrado, G. Dean, J. (2013). Efficient estimation of word representations in vector space. arXiv. https://doi.org/10.48550/arXiv.1301.3781
Yuan, J., Zhao, Y., Qin, B. (2022). Learning to share by masking the non-shared for multi-domain sentiment classification. International Journal of Machine Learning and Cybernetics, 13 (9), 2711–2724. https://doi.org/10.1007/s13042-022-01556-0
Naseri, S., Dalton, J., Yates, A., Allan, J. (2022). CEQE to SQET: A study of contextualized embeddings for query expansion. Information Retrieval Journal, 25 (2), 184–208. https://doi.org/10.1007/s10791-022-09405-y
Singh, J. (2017). Ranks Aggregation and Semantic Genetic Approach based Hybrid Model for Query Expansion. International Journal of Computational Intelligence Systems, 10 (1), 34. https://doi.org/10.2991/ijcis.2017.10.1.4
Zheng, Z., Hui, K., He, B., Han, X., Sun, L., Yates, A. (2020). BERT-QE: Contextualized Query Expansion for Document Re-ranking. Findings of the Association for Computational Linguistics: EMNLP 2020. https://doi.org/10.18653/v1/2020.findings-emnlp.424
Xu, B., Lin, H., Lin, Y., Yang, L., Xu, K. (2018). Improving Pseudo-Relevance Feedback With Neural Network-Based Word Representations. IEEE Access, 6, 62152–62165. https://doi.org/10.1109/access.2018.2876425
Fang, F., Zhang, B.-W., Yin, X.-C. (2018). Semantic Sequential Query Expansion for Biomedical Article Search. IEEE Access, 6, 45448–45457. https://doi.org/10.1109/access.2018.2861869
Wang, Y., Wang, N., Zhou, L. (2017). Keyword Query Expansion Paradigm Based on Recommendation and Interpretation in Relational Databases. Scientific Programming, 2017, 1–12. https://doi.org/10.1155/2017/7613026
Parlar, T., Özel, S. A., Song, F. (2018). QER: a new feature selection method for sentiment analysis. Human-Centric Computing and Information Sciences, 8 (1). https://doi.org/10.1186/s13673-018-0135-8

Розширення запитів на основі аналізу контекстно-залежного настрою в базах даних з фільтрацією за доменом

##submission.downloads##

PDF (English)

Опубліковано

2025-02-27

Як цитувати

Мелюх, В. В., Потапова, К. Р., Наливайчук, М. В. ., & Дичка, А. І. (2025). Розширення запитів на основі аналізу контекстно-залежного настрою в базах даних з фільтрацією за доменом. Eastern-European Journal of Enterprise Technologies, 1(2 (133), 6–17. https://doi.org/10.15587/1729-4061.2025.322120

Завантажити посилання

Номер

Том 1 № 2 (133) (2025): Інформаційні технології. Системи управління в промисловості

Розділ

Інформаційні технології

Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.

Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.

Ліцензійний договір – це документ, в якому автор гарантує, що володіє усіма авторськими правами на твір (рукопис, статтю, тощо).
Автори, підписуючи Ліцензійний договір з ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР», мають усі права на подальше використання свого твору за умови посилання на наше видання, в якому твір опублікований. Відповідно до умов Ліцензійного договору, Видавець ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР» не забирає ваші авторські права та отримує від авторів дозвіл на використання та розповсюдження публікації через світові наукові ресурси (власні електронні ресурси, наукометричні бази даних, репозитарії, бібліотеки тощо).
За відсутності підписаного Ліцензійного договору або за відсутністю вказаних в цьому договорі ідентифікаторів, що дають змогу ідентифікувати особу автора, редакція не має права працювати з рукописом.
Важливо пам’ятати, що існує і інший тип угоди між авторами та видавцями – коли авторські права передаються від авторів до видавця. В такому разі автори втрачають права власності на свій твір та не можуть його використовувати в будь-який спосіб.