Розпізнавання голосового повідомлення у месенджері
DOI:
https://doi.org/10.31498/2225-6733.45.2022.276225Ключові слова:
розпізнавання мови, звукове повідомлення, ASR, NodeJS, месенджери, чат-ботАнотація
Стаття присвячена розгляду питання розпізнавання мовленнєвого сигналу. Описано етапи та елементи процесу обробки та розпізнавання природної мови з аудіосигналу. Наведено сучасні технології підтримки автоматичного розпізнавання мовлення та проблеми вибору серед них. Розглянуто аналіз останніх досліджень і публікацій щодо обробки голосових даних. Запропоновано рішення у вигляді чат-боту для автоматичного перетворення голосових повідомлень у текстові
Посилання
Добрушкін Г.О. Основні підходи до розпізнавання мовленнєвої інформації (частина 1) / Г.О. Добрушкін, В.Я. Данилов // Вісник Вінницького політехнічного інституту. – 2009. – № 47. – С. 50-64.
Васильєва Н.Б. Проблеми створення систем розпізнавання мовлення для різних комп’ютерних платформ / Н.Б. Васильєва, Д.Я. Федорин // Штучний інтелект. – 2013. – Вип. № 4. – С. 158-167.
Chavan Rupali S. An Implementation of Text Dependent Speaker Independent Isolated Word Speech Recognition Using HMM Ms / Rupali S. Chavan, Dr. Ganesh S. Sable // Journal of Engineering Sciences & Research Technology. – 2013. – Vol. 2(9). – Pp. 2311-2318.
Tang C. Speech Recognition in High Noise Environment / C. Tang, M. Li // Ekoloji. – 2019. – Vol. 28(107). – Pp. 1561-1565.
Dave N. Feature Extraction Methods LPC, PLP and MFCC in Speech Recognition / N. Dave // International Journal For Advance Research in Engineering And Technology. – 2013. – Vol. 1, iss. VI. – Pp. 1-5.
Dubagunta S.P. Improving Children Speech Recognition through Feature Learning from Raw Speech Signal / S.P. Dubagunta, S.H. Kabil, Doss M. Magimai // 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). – 2019. – Pp. 5736-5740. –Mode of access: https://doi.org/10.1109/ICASSP.2019.8682826.
Mittal R. Speech Emotion Recognition / R. Mittal, S. Vart // 2nd International Conference on Intelligent Technologies (CONIT). – 2022. – Pp. 1-6. – Mode of access: https://doi.org/10.1109/CONIT55038.2022.9848265.
AssemblyAI API Platform for Models [Electronic resource]. – Mode of access: https://www.assemblyai.com.
Telegram Bot Features [Electronic resource]. – Mode of access: https://core.telegram.org/bots/features.
Bot API Reference [Electronic resource]. – Mode of access: https://tlgrm.ru/docs/bots/api.
Axios [Electronic resource]. – Mode of access: https://axios-http.com.
Node.js | About [Electronic resource]. – Mode of access: https://nodejs.org/about.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Журнал "Вісник Приазовського державного технічного університету. Серія: Технічні науки" видається під ліцензією СС-BY (Ліцензія «Із зазначенням авторства»).
Дана ліцензія дозволяє поширювати, редагувати, поправляти і брати твір за основу для похідних навіть на комерційній основі із зазначенням авторства. Це найзручніша з усіх пропонованих ліцензій. Рекомендується для максимального поширення і використання неліцензійних матеріалів.
Автори, які публікуються в цьому журналі, погоджуються з наступними умовами:
1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, яка дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи в цьому журналі.
2. Автори мають право укладати самостійні додаткові угоди, які стосуються неексклюзивного поширення роботи в тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи в цьому журналі.