Розпізнавання голосового повідомлення  у месенджері

М.П. Рядченко; О.Є. П'ятикоп

doi:10.31498/2225-6733.45.2022.276225

Розпізнавання голосового повідомлення у месенджері

Автор(и)

М.П. Рядченко ДВНЗ «Приазовський державний технічний університет», м. Дніпро, Україна
О.Є. П'ятикоп ДВНЗ «Приазовський державний технічний університет», м. Дніпро, Україна https://orcid.org/0000-0002-7731-3051

DOI:

https://doi.org/10.31498/2225-6733.45.2022.276225

Ключові слова:

розпізнавання мови, звукове повідомлення, ASR, NodeJS, месенджери, чат-бот

Анотація

Стаття присвячена розгляду питання розпізнавання мовленнєвого сигналу. Описано етапи та елементи процесу обробки та розпізнавання природної мови з аудіосигналу. Наведено сучасні технології підтримки автоматичного розпізнавання мовлення та проблеми вибору серед них. Розглянуто аналіз останніх досліджень і публікацій щодо обробки голосових даних. Запропоновано рішення у вигляді чат-боту для автоматичного перетворення голосових повідомлень у текстові

Біографії авторів

М.П. Рядченко , ДВНЗ «Приазовський державний технічний університет», м. Дніпро

Студент

О.Є. П'ятикоп , ДВНЗ «Приазовський державний технічний університет», м. Дніпро

Кандидат технічних наук, доцент

Посилання

Добрушкін Г.О. Основні підходи до розпізнавання мовленнєвої інформації (частина 1) / Г.О. Добрушкін, В.Я. Данилов // Вісник Вінницького політехнічного інституту. – 2009. – № 47. – С. 50-64.

Васильєва Н.Б. Проблеми створення систем розпізнавання мовлення для різних комп’ютерних платформ / Н.Б. Васильєва, Д.Я. Федорин // Штучний інтелект. – 2013. – Вип. № 4. – С. 158-167.

Chavan Rupali S. An Implementation of Text Dependent Speaker Independent Isolated Word Speech Recognition Using HMM Ms / Rupali S. Chavan, Dr. Ganesh S. Sable // Journal of Engineering Sciences & Research Technology. – 2013. – Vol. 2(9). – Pp. 2311-2318.

Tang C. Speech Recognition in High Noise Environment / C. Tang, M. Li // Ekoloji. – 2019. – Vol. 28(107). – Pp. 1561-1565.

Dave N. Feature Extraction Methods LPC, PLP and MFCC in Speech Recognition / N. Dave // International Journal For Advance Research in Engineering And Technology. – 2013. – Vol. 1, iss. VI. – Pp. 1-5.

Dubagunta S.P. Improving Children Speech Recognition through Feature Learning from Raw Speech Signal / S.P. Dubagunta, S.H. Kabil, Doss M. Magimai // 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). – 2019. – Pp. 5736-5740. –Mode of access: https://doi.org/10.1109/ICASSP.2019.8682826.

Mittal R. Speech Emotion Recognition / R. Mittal, S. Vart // 2nd International Conference on Intelligent Technologies (CONIT). – 2022. – Pp. 1-6. – Mode of access: https://doi.org/10.1109/CONIT55038.2022.9848265.

AssemblyAI API Platform for Models [Electronic resource]. – Mode of access: https://www.assemblyai.com.

Telegram Bot Features [Electronic resource]. – Mode of access: https://core.telegram.org/bots/features.

Bot API Reference [Electronic resource]. – Mode of access: https://tlgrm.ru/docs/bots/api.

Axios [Electronic resource]. – Mode of access: https://axios-http.com.

Node.js | About [Electronic resource]. – Mode of access: https://nodejs.org/about.

##submission.downloads##

Опубліковано

2022-12-29

Як цитувати

Рядченко , М., & П’ятикоп , О. (2022). Розпізнавання голосового повідомлення у месенджері. Вісник Приазовського Державного Технічного Університету. Серія: Технічні науки, (45), 28–34. https://doi.org/10.31498/2225-6733.45.2022.276225

Завантажити посилання

Номер

№ 45 (2022): Вісник ПДТУ. Серія: Технічні науки

Розділ

122 Комп'ютерні науки та інформаційні технології

Ліцензія

Журнал "Вісник Приазовського державного технічного університету. Серія: Технічні науки" видається під ліцензією СС-BY (Ліцензія «Із зазначенням авторства»).

Дана ліцензія дозволяє поширювати, редагувати, поправляти і брати твір за основу для похідних навіть на комерційній основі із зазначенням авторства. Це найзручніша з усіх пропонованих ліцензій. Рекомендується для максимального поширення і використання неліцензійних матеріалів.

Автори, які публікуються в цьому журналі, погоджуються з наступними умовами:

1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, яка дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи в цьому журналі.

2. Автори мають право укладати самостійні додаткові угоди, які стосуються неексклюзивного поширення роботи в тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи в цьому журналі.