Розробка тематичної та нейромережевої моделі для навчання даних




Ключові слова:

багатошарова нейронна мережа, модель LDA, глибоке навчання, зворотне поширення помилки


Дослідження в галузі семантичного аналізу тексту починаються з вивчення структури природної мови. Казахська мова унікальна тим, що відноситься до аглютинативних мов і потребує ретельного вивчення. Об'єктом цього дослідження є текст казахською мовою. Існуючі підходи щодо дослідження семантичного аналізу тексту казахською мовою не розглядають аналіз тексту за допомогою методів тематичного моделювання та навчання нейронних мереж. Метою даного дослідження є визначення якості тематичної моделі на основі методу LDA (Latent Dirichlet Allocation) із семплюванням Гібса, через навчання нейронної мережі. LDA модель може визначити семантичну можливість ключових слів одного документа і дати їм коефіцієнт оцінки. Для побудови нейронної мережі була використана одна з поширених архітектур LSTM, яка добре зарекомендувала себе в роботі з NLP (Natural Language Processing). В результаті навчання можна побачити, якою мірою текст навчився і як пройшов семантичний аналіз тексту казахською мовою. Система, розроблена на основі LDA моделі та навчання нейронної мережі, поєднує виявлені ключові слова в окремі теми. В цілому експериментальні результати показали, що використання глибоких нейронних мереж дають передбачувані результати якості LDA моделі в обробці казахської мови. Розроблена модель нейронної мережі сприяє оцінці визначення точності семантики тексту, що використовується казахською мовою. Отримані результати можна застосувати в системах обробки текстових даних, наприклад, при перевірці відповідності теми та змісту запропонованих текстів (рефератів, курсових, дипломних та інших робіт).

Біографії авторів

Akerke Аkanova, S. Seifullin Kazakh Agro Technical University

PhD, Senior Lecturer

Department of Computer Engineering and Software

Nazira Ospanova, Toraighyrov University

PhD, Associate Professor, Head of Department

Department of Information Technology

Saltanat Sharipova, S. Seifullin Kazakh Agro Technical University

Master of Science in Informatics

Department of Computer Engineering and Software

Gulalem Мauina, S. Seifullin Kazakh Agro Technical University

Master of Engineering and Technology

Department of Information Systems

Zhanat Abdugulova, L. N. Gumilyov Eurasian National University

Candidate of Economic Sciences, Associate Professor

Department of Systems Analysis and Management


