Оцінка частоти основного тону голосового сигналу користувача системи автентифікації

Автор(и)

  • Yehor Kutsenko Харківський національний університет радіоелектроніки,
  • Mykola Pastushenko Харківський національний університет радіоелектроніки,

DOI:

https://doi.org/10.30837/pt.2019.2.07

Ключові слова:

Частота, Автентифікація, Сигнал, Голос, Фаза, Тон

Анотація

У статті аналізуються і досліджуються напрямки підвищення якісних характеристик систем голосової автентифікації в різних системах доступу. Один з основних напрямків підвищення якісних характеристик цих систем автентифікації користувача пов’язаний з використанням фазової інформації голосового сигналу. Об’єктом дослідження є процес цифрової обробки сигналів у системах голосової автентифікації. Вирішується актуальне наукове завдання дослідження нових процедур для уточнення оцінок частоти основного тону, отриманих на основі аналізу амплітудно-частотного спектра. Уточнення оцінок проводилося на основі використання фазових даних голосового сигналу, а також оцінки частоти основного тону в процесі отримання кепстральних коефіцієнтів. Мета даної роботи — дослідження впливу фазових даних на точність оцінки частоти основного тону в процесі формування шаблону користувача. Дані отримані в процесі статистичного аналізу результатів моделювання з використанням модельних і експериментальних голосових даних користувача системи автентифікації. Фазові дані голосового сигналу дозволяють отримувати адекватні та достовірні оцінки в процесі спектрального аналізу. Однак при наявності помилок, пов’язаних з грубими помилками, наприклад, прийняття за оцінку частоти основного тону частот першої або другої формант, перевагу слід віддавати оцінці, отриманій у процесі розрахунку кепстральних коефіцієнтів. Досліджено вплив довжини семплів і їх перекриття в процесі розрахунку кепстральних коефіцієнтів. Представлені результати досліджень доцільно використовувати в системах голосової автентифікації, вдосконаленні систем розпізнавання мови, а також при вирішенні завдань ідентифікації диктора.

Посилання

Рамишвили Г.С. Автоматическое опознавание говорящего по голосу. М: Радио и связь, 1981. 224 с.

Beigi H. Fundamentals of Speaker Recognition. NY: Springer, 2011. 1029 p.

ISO/IEC 2382-37:2012 Information technology – Vocabulary – Part 37: Biometrics. URL: https://www.iso.org/ru/standard/55194.html

Болл Р.М., Коннел Дж. Х., Панканти Ш., Ратха Н.К., Сеньор Э.У. Руководство по биометрии. М.: Техносфера, 2007. 368 с.

Oppenheim A.V., Lim J.S. The Importance of Phase in Signals: Article in Proceeding of the IEEE, 1981. № 69(5). P. 529-541.

Paliwal K. Usefulness of phase in speech processing. Proc. IPSJ Spoken Language Processing Workshop, Gifu, Japan, Feb. 2003. P. 1-6.

Paliwal K., Atal B. Frequency-related representation of speech. In: Proceedings of the European Conference on Speech Communication and Technology (EUROSPEECH-2003), 2003. P. 65–68.

Борисенко С.Ю., Воробьев В.И., Давыдов А.Г. Сравнение некоторых способов анализа фазовых соотношений между квазигармоническими составляющими речевых сигналов. Сборник трудов 1-ой Всероссийской акустической конференции. 2004. С. 2-7.

Wu Z. , Kinnunen T., Chng E., Li H., Ambikairajah E. A study on spoofing attack in state-of-the-art speaker verification: the telephone speech case. In Proceedings of The 2012 Asia Pacific Signal and Information Processing Association Annual Summit and Conference. IEEE, 2012. Р. 1-5.

Пастушенко Н.С., Педро В.Г., Файзулаева О.Н. Исследование информативности фазовых данных голосового сигнала пользователя системы аутентификации. Проблеми телекомунікацій. 2018. №1(22). С. 67-74. URL: http://pt.journal.kh.ua/2018/181_pastushenko_voice.pdf.

Gerhard D. Pitch extraction and fundamental frequency: History and current techniques. Regina, Canada: Department of Computer Science, University of Regina. 2003. 22 p. URL: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.58.834&rep=rep1&type=pdf

##submission.downloads##

Опубліковано

2019-12-28

Номер

Розділ

Статті