Вплив процедур обробки голосового сигналу системи автентифікації на якість формантних даних
DOI:
https://doi.org/10.30837/pt.2025.1.04Анотація
Розглядається актуальне наукове завдання щодо підвищення ефективності голосових систем автентифікації, які широко використовуються в сучасних системах доступу. Відомо, що знизити помилки першого і другого роду в голосових системах автентифікації можна шляхом удосконалення процедур цифрової обробки голосового сигналу, що аналізується, за рахунок більш якісного вилучення ознак користувача або удосконалення процедур прийняття рішення про допуск користувача. Важливе місце у всіх процедурах обробки голосових сигналів займають формантні дані (рівень спектральної потужності, формантні частоти, огинаюча спектру та ширина спектру формантних частот). На основі двох перших формант вирішуються завдання розпізнавання та синтезу мови, а дві наступні форманти дозволяють вирішити проблему автентифікації користувача. Мета даної роботи – намітити шляхи підвищення якості формування формантних даних стосовно задач цифрової обробки мовних сигналів. Об’єктом дослідження є процес отримання формантних даних при використанні амплітудно-частотної та фазової інформації, а також результатів розрахунку автокореляційної функції аналізованого сигналу. Предмет дослідження – методи та процедури вилучення формантних даних у процесі експериментальних досліджень. Наукова новизна отриманих результатів дослідження полягає в тому, що вперше виконано порівняльний аналіз формантних даних, отриманих за різною вихідною інформацією, а саме амплітудно-частотною та фазовою інформацією, а також результатів розрахунку автокореляційної функції аналізованого сигналу. Достовірність результатів досліджень обґрунтована коректним використанням відомого математичного апарату та збігом оцінок формантних даних в результаті обробки експериментального сигналу користувача. Практична значущість полягає в тому, що отримані результати дозволяють підвищити якість та ефективність обробки голосових даних при розпізнаванні та синтезі мови, автентифікації користувача в голосових системах та низці інших прикладних завдань, пов’язаних із мовотворенням.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).