Реалізація частоти слова-оберненої частоти документа (TF-IDF) та Word2Vec у системі рекомендацій традиційної медицини на основі контентної фільтрації
DOI:
https://doi.org/10.15587/1729-4061.2025.338128Ключові слова:
фільтрація на основі контенту, розмірність, вилучення ознак, система рекомендацій, семантичний зв'язок, частота слова-обернена частота документа, традиційна медицина, розмір вікна, Word2Vec, вага словаАнотація
Згідно з Всесвітньою організацією охорони здоров'я (ВООЗ), традиційна медицина є кульмінацією всіх знань, здібностей та практик, отриманих з теорій, вірувань та досвіду, унікальних для різних культур, і які використовуються для підтримки здоров'я, а також для запобігання, діагностики, лікування або покращення фізичних та психічних захворювань. Нещодавно традиційну фітотерапію класифікували як таку, що складається з лікувальних методів, що існували, часто протягом сотень років, до створення сучасної медицини. Відсутність легкодоступної інформації щодо опису та ефективності традиційної медицини ускладнює для користувачів розуміння переваг кожного виду традиційної медицини. Через це потрібна система рекомендацій, яка має на меті полегшити користувачам пошук традиційної медицини, що відповідає їхнім уподобанням. Це дослідження пропонує систему рекомендацій щодо традиційної медицини з методом фільтрації на основі контенту, використовуючи комбінацію частоти використання термінів, оберненої частоти використання документів та вилучення ознак Word2Vec. Цей метод аналізує текст опису традиційної медицини та рекомендує на основі ваги слова та семантичні зв'язки між словами. Результати показують оптимальну продуктивність при розмірах 50–200 та розмірах вікна 9–15 для комбінації частоти слова-оберненої частоти документа та Word2Vec, тоді як частота слова-обернена частота документа сама по собі досягає 80% точності, а Word2Vec має нижчу продуктивність (4–14%) у широкому діапазоні експериментів з параметрами. Виходячи з вищезазначеного оптимального результату, цю систему рекомендацій можна застосовувати для отримання інформації про традиційну медицину, яка підходить людям, яким потрібно налаштувати найкращу модель розмірів та розміру вікна
Посилання
- Che, C.-T., George, V., Ijinu, T. P., Pushpangadan, P., Andrae-Marobela, K. (2024). Traditional medicine. Pharmacognosy. Academic Press, 11–28. https://doi.org/10.1016/b978-0-443-18657-8.00037-2
- WHO traditional medicine strategy: 2014–2023 (2013). World Health Organization. Available at: http://apps.who.int/iris/bitstream/10665/92455/1/9789241506090_eng.pdf Last accessed: 20.05.2025
- Bodeker, G., Graz, B.; Ryan, E. T., Hill, D. R., Solomon, T., Aronson, N. E., Endy, T. P. (Eds.). (2020). Traditional Medicine. Hunter’s Tropical Medicine and Emerging Infectious Diseases. Elsevier, 194–199. https://doi.org/10.1016/b978-0-323-55512-8.00025-9
- Kamboj, V. P. (2000). Herbal medicine. Current Science, 78 (1), 35–39.
- Pal, S. K., Shukla, Y. (2003). Herbal medicine: Current status and the future. Asian Pacific Journal of Cancer Prevention, 4, 281–288. Available at: https://www.researchgate.net/profile/Sanjoy-Pal-2/publication/8914668_Herbal_medicine_Current_status_and_the_future/links/0c96051fd33d11991d000000/Herbal-medicine-Current-status-and-the-future.pdf
- WHO global report on traditional and complementary medicine 2019 (2019). Geneva: World Health Organization, 226. Available at: https://iris.who.int/bitstream/handle/10665/312342/9789241515436-eng.pdf?sequence=1
- Sianipar, E. A. (2021). The potential of Indonesian traditional herbal medicine as immunomodulatory agents: A review. International Journal of Pharmaceutical Sciences and Research, 12 (10), 5229–5237. https://doi.org/10.13040/IJPSR.0975-8232.12(10).5229-37
- Pradipta, I. S., Aprilio, K., Febriyanti, R. M., Ningsih, Y. F., Pratama, M. A. A., Indradi, R. B. et al. (2023). Traditional medicine users in a treated chronic disease population: a cross-sectional study in Indonesia. BMC Complementary Medicine and Therapies, 23 (1). https://doi.org/10.1186/s12906-023-03947-4
- Muharrami, L. K., Santoso, M., Fatmawati, S. (2024). Traditional Medicine Uses of Madurese Ethnic, Indonesia: Indigenous Knowledge “Jamu” in Relation with Medicinal Plants. Journal of Hunan University Natural Sciences, 51 (10). https://doi.org/10.55463/issn.1674-2974.51.10.2
- Yunitarini, R., Widiaswanti, E. (2024). Analysis and Design of Indonesian Traditional Medicine (Jamu) Information System by using Prototyping Model (Case Study: Madura Island). E3S Web of Conferences, 483, 03012. https://doi.org/10.1051/e3sconf/202448303012
- Vall, A., Dorfer, M., Eghbal-zadeh, H., Schedl, M., Burjorjee, K., Widmer, G. (2019). Feature-combination hybrid recommender systems for automated music playlist continuation. User Modeling and User-Adapted Interaction, 29 (2), 527–572. https://doi.org/10.1007/s11257-018-9215-8
- Widayanti, R., Chakim, M., Lukita, C., Rahardja, U., Lutfiani, N. (2023). Improving Recommender Systems using Hybrid Techniques of Collaborative Filtering and Content-Based Filtering. Journal of Applied Data Sciences, 4 (3), 289–302. https://doi.org/10.47738/jads.v4i3.115
- Van Balen, J., Goethals, B. (2021). High-dimensional Sparse Embeddings for Collaborative Filtering. Proceedings of the Web Conference 2021. Ljubljana, 575–581. https://doi.org/10.1145/3442381.3450054
- Gunarto, S. A., Honggara, E. S., Purwanto, D. D. (2023). Website Sistem Rekomendasi dengan Content Based Filtering pada Produk Perawatan Kulit. Jurnal Sistem Dan Teknologi Informasi, 11 (3), 399. https://doi.org/10.26418/justin.v11i3.59049
- Nastiti, P. (2019). Penerapan Metode Content Based Filtering Dalam Implementasi Sistem Rekomendasi Tanaman Pangan. Teknika, 8 (1), 1–10. https://doi.org/10.34148/teknika.v8i1.139
- Huda, A. A., Fajarudin, R., Hadinegoro, A. (2022). Sistem Rekomendasi Content-based Filtering Menggunakan TF-IDF Vector Similarity Untuk Rekomendasi Artikel Berita. Building of Informatics, Technology and Science, 4 (3), 1679–1686. https://doi.org/10.47065/bits.v4i3.2511
- Putri, M. W., Muchayan, A., Kamisutara, M. (2020). Sistem Rekomendasi Produk Pena Eksklusif Menggunakan Metode Content-Based Filtering dan TF-IDF. Journal of Information Technology and Computer Science, 5 (3), 229. https://doi.org/10.31328/jointecs.v5i3.1563
- Negara, E. S., Sulaiman, Andryani, R., Saksono, P. H., Widyanti, Y. (2023). Recommendation System with Content-Based Filtering in NFT Marketplace. Journal of Advances in Information Technology, 14 (3), 518–522. https://doi.org/10.12720/jait.14.3.518-522
- Nawangsari, R. P., Kusumaningrum, R., Wibowo, A. (2019). Word2Vec for Indonesian Sentiment Analysis towards Hotel Reviews: An Evaluation Study. Procedia Computer Science, 157, 360–366. https://doi.org/10.1016/j.procs.2019.08.178
- Khomsah, S. (2021). Sentiment Analysis on YouTube Comments Using Word2Vec and Random Forest. Telematika, 18 (1), 61–72. https://doi.org/10.31315/telematika.v18i1.4493
- Ramadhanti, N. R., Mariyah, S. (2019). Document Similarity Detection Using Indonesian Language Word2vec Model. 2019 3rd International Conference on Informatics and Computational Sciences (ICICoS). Semarang: IEEE, 1–6. https://doi.org/10.1109/icicos48119.2019.8982432
- Cahyani, S. N., Saraswati, G. W. (2023). Implementation of support vector machine method in classifying school library books with combination of TF-IDF and WORD2VEC. Jurnal Teknik Informatika, 4 (6), 1555–1566. https://doi.org/10.52436/1.jutif.2023.4.6.1536
- Liang, M., Niu, T. (2022). Research on Text Classification Techniques Based on Improved TF-IDF Algorithm and LSTM Inputs. Procedia Computer Science, 208, 460–470. https://doi.org/10.1016/j.procs.2022.10.064
- Nurfalah, F., Asriyanik, Pambudi, A. (2022). Sistem Rekomendasi Event Online Menggunakan Metode Content Based Filtering. Elkom : Jurnal Elektronika Dan Komputer, 15 (2), 271–279. https://doi.org/10.51903/elkom.v15i2.736
- Irvandani, A., Auliasari, K., Primaswara Prasetya, R. (2020). Sistem Rekomendasi Pemilihan Fotografer dengan Metode Haversine dan TF-IDF di Malang Raya. Jurnal Mahasiswa Teknik Informatika, 4 (1), 137–146. https://doi.org/10.36040/jati.v4i1.2330
- Yutika, C. H., Adiwijaya, A., Faraby, S. A. (2021). Analisis Sentimen Berbasis Aspek pada Review Female Daily Menggunakan TF-IDF dan Naïve Bayes. Jurnal Media Informatika Budidarma, 5 (2), 422. https://doi.org/10.30865/mib.v5i2.2845
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2025 Rika Yunitarini, Dwi Aqilah Pradita, Ernaning Widiaswanti

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.
Ліцензійний договір – це документ, в якому автор гарантує, що володіє усіма авторськими правами на твір (рукопис, статтю, тощо).
Автори, підписуючи Ліцензійний договір з ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР», мають усі права на подальше використання свого твору за умови посилання на наше видання, в якому твір опублікований. Відповідно до умов Ліцензійного договору, Видавець ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР» не забирає ваші авторські права та отримує від авторів дозвіл на використання та розповсюдження публікації через світові наукові ресурси (власні електронні ресурси, наукометричні бази даних, репозитарії, бібліотеки тощо).
За відсутності підписаного Ліцензійного договору або за відсутністю вказаних в цьому договорі ідентифікаторів, що дають змогу ідентифікувати особу автора, редакція не має права працювати з рукописом.
Важливо пам’ятати, що існує і інший тип угоди між авторами та видавцями – коли авторські права передаються від авторів до видавця. В такому разі автори втрачають права власності на свій твір та не можуть його використовувати в будь-який спосіб.






