Оцінка частоти основного тону голосового сигналу користувача системи автентифікації

Yehor Kutsenko; Mykola Pastushenko

doi:10.30837/pt.2019.2.07

Оцінка частоти основного тону голосового сигналу користувача системи автентифікації

Автор(и)

Yehor Kutsenko Харківський національний університет радіоелектроніки,
Mykola Pastushenko Харківський національний університет радіоелектроніки,

DOI:

https://doi.org/10.30837/pt.2019.2.07

Ключові слова:

Частота, Автентифікація, Сигнал, Голос, Фаза, Тон

Анотація

У статті аналізуються і досліджуються напрямки підвищення якісних характеристик систем голосової автентифікації в різних системах доступу. Один з основних напрямків підвищення якісних характеристик цих систем автентифікації користувача пов’язаний з використанням фазової інформації голосового сигналу. Об’єктом дослідження є процес цифрової обробки сигналів у системах голосової автентифікації. Вирішується актуальне наукове завдання дослідження нових процедур для уточнення оцінок частоти основного тону, отриманих на основі аналізу амплітудно-частотного спектра. Уточнення оцінок проводилося на основі використання фазових даних голосового сигналу, а також оцінки частоти основного тону в процесі отримання кепстральних коефіцієнтів. Мета даної роботи — дослідження впливу фазових даних на точність оцінки частоти основного тону в процесі формування шаблону користувача. Дані отримані в процесі статистичного аналізу результатів моделювання з використанням модельних і експериментальних голосових даних користувача системи автентифікації. Фазові дані голосового сигналу дозволяють отримувати адекватні та достовірні оцінки в процесі спектрального аналізу. Однак при наявності помилок, пов’язаних з грубими помилками, наприклад, прийняття за оцінку частоти основного тону частот першої або другої формант, перевагу слід віддавати оцінці, отриманій у процесі розрахунку кепстральних коефіцієнтів. Досліджено вплив довжини семплів і їх перекриття в процесі розрахунку кепстральних коефіцієнтів. Представлені результати досліджень доцільно використовувати в системах голосової автентифікації, вдосконаленні систем розпізнавання мови, а також при вирішенні завдань ідентифікації диктора.

Посилання

Рамишвили Г.С. Автоматическое опознавание говорящего по голосу. М: Радио и связь, 1981. 224 с.

Beigi H. Fundamentals of Speaker Recognition. NY: Springer, 2011. 1029 p.

ISO/IEC 2382-37:2012 Information technology – Vocabulary – Part 37: Biometrics. URL: https://www.iso.org/ru/standard/55194.html

Болл Р.М., Коннел Дж. Х., Панканти Ш., Ратха Н.К., Сеньор Э.У. Руководство по биометрии. М.: Техносфера, 2007. 368 с.

Oppenheim A.V., Lim J.S. The Importance of Phase in Signals: Article in Proceeding of the IEEE, 1981. № 69(5). P. 529-541.

Paliwal K. Usefulness of phase in speech processing. Proc. IPSJ Spoken Language Processing Workshop, Gifu, Japan, Feb. 2003. P. 1-6.

Paliwal K., Atal B. Frequency-related representation of speech. In: Proceedings of the European Conference on Speech Communication and Technology (EUROSPEECH-2003), 2003. P. 65–68.

Борисенко С.Ю., Воробьев В.И., Давыдов А.Г. Сравнение некоторых способов анализа фазовых соотношений между квазигармоническими составляющими речевых сигналов. Сборник трудов 1-ой Всероссийской акустической конференции. 2004. С. 2-7.

Wu Z. , Kinnunen T., Chng E., Li H., Ambikairajah E. A study on spoofing attack in state-of-the-art speaker verification: the telephone speech case. In Proceedings of The 2012 Asia Pacific Signal and Information Processing Association Annual Summit and Conference. IEEE, 2012. Р. 1-5.

Пастушенко Н.С., Педро В.Г., Файзулаева О.Н. Исследование информативности фазовых данных голосового сигнала пользователя системы аутентификации. Проблеми телекомунікацій. 2018. №1(22). С. 67-74. URL: http://pt.journal.kh.ua/2018/181_pastushenko_voice.pdf.

Gerhard D. Pitch extraction and fundamental frequency: History and current techniques. Regina, Canada: Department of Computer Science, University of Regina. 2003. 22 p. URL: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.58.834&rep=rep1&type=pdf

##submission.downloads##

Опубліковано

2019-12-28

Номер

№ 2(25) (2019)

Розділ

Статті

Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:

Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).

Оцінка частоти основного тону голосового сигналу користувача системи автентифікації

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Номер

Розділ

Ліцензія

##plugins.block.developedBy.blockTitle##

Мова

Інформація