Порівняння великих мовних моделей (LLM) GPT-3 та PaLM-2 для створення індонезійського культурного контенту




Ключові слова:

велика мовна модель, генеративний штучний інтелект, GPT-3, PaLM-2, оцінка BERTScore


Великі мовні моделі можуть допомогти у створенні контенту на культурну тематику. Однак будь-яка інформація, що генерується за допомогою великих мовних моделей, повинна бути оцінена, щоб переконатися у достовірності отриманої інформації. Незважаючи на те, що в багатьох дослідженнях проводиться порівняння можливостей великих мовних моделей, існує не так багато досліджень з порівняння ефективності великих мовних моделей при створенні індонезійського культурного контенту. У даному дослідженні порівнюється достовірність інформації, що генерується за допомогою великої мовної моделі з використанням методу експертної оцінки при створенні індонезійського культурного контенту, та можливості її тонкої настройки, оцінені за допомогою BERTScore. Метод оцінки був успішно застосований, а результати показують, що в цьому випадку PaLM-2 містила менше дезінформації, тоді як GPT-3 досягла успіху в тонкому налаштуванні. Використання комбінації експертної оцінки та BERTScore дозволяє оцінювати великі мовні моделі та отримувати додаткові достовірні навчальні дані для усунення недоліків. Згідно з результатами, PaLM-2 видала більш достовірний контент, набравши 27 балів, у той час як GPT-3 набрала 8 балів. У ході навчання нових наборів даних/тонкої настройки було виявлено, що мовна модель GPT-3 дозволяє швидше освоїти набір даних, витративши на це 50 хвилин і 27,000 індонезійських рупій, в той час як для PaLM-2 знадобилося 2 години 10 хвилин і 1,377,204 індонезійських рупій. Що стосується результатів оцінки навчальних наборів даних, то GPT-3 має перевагу, набравши в середньому 0,85205 балів. У той же час, налаштована модель PaLM-2 отримала середній загальний бал 0,78942. У цьому випадку налаштована модель GPT-3 має перевагу на 8 %. На практиці цей метод може бути використаний, якщо оцінка носить описовий характер і вимагає безпосередньої оцінки з боку експертів

Спонсор дослідження

  • Thank you to the Palembang City Culture Service for being a resource for the data in this research.

Біографії авторів

Deni Erlansyah, Universitas Bina Darma

Data Science Interdisciplinary Research Center

Amirul Mukminin, Jambi University

Doctor of Educational Leardership and Policy Studies (Language Policy), Professor

Department of English Language Education

Dedek Julian, Universitas Bina Darma

Data Science Interdisciplinary Research Center

Edi Surya Negara, Universitas Bina Darma

Data Science Interdisciplinary Research Center

Ferdi Aditya, Universitas Bina Darma

Data Science Interdisciplinary Research Center

Rezki Syaputra, Universitas Bina Darma

Data Science Interdisciplinary Research Center


Як цитувати

Erlansyah, D., Mukminin, A., Julian, D., Negara, E. S., Aditya, F., & Syaputra, R. (2024). Порівняння великих мовних моделей (LLM) GPT-3 та PaLM-2 для створення індонезійського культурного контенту. Eastern-European Journal of Enterprise Technologies, 4(2 (130), 19–29. https://doi.org/10.15587/1729-4061.2024.309972