Виділення самоподібних структур мовних сигналів в задачах ідентифікації диктора

Yana Byelozorova

doi:10.15587/2313-8416.2017.101098

Виділення самоподібних структур мовних сигналів в задачах ідентифікації диктора

Автор(и)

Yana Byelozorova Національний авіаційний університет пр. Космонавта Комарова, 1, м. Київ, Україна, 03058, Україна https://orcid.org/0000-0002-0688-3436

DOI:

https://doi.org/10.15587/2313-8416.2017.101098

Ключові слова:

мовний сигнал, самоподібні структури, фрактальна розмірність, сегментація мови, розпізнавання диктора

Анотація

Досліджена задача виділення ідентифікаційних ознак диктора у вигляді параметрів частоти основного тону і розпізнавання диктора на основі кратномасштабного та фрактального перетворення. Запропоновано підхід виділення унікальних для особистості самоподібних структур і розроблені методики обробки голосового сигналу дозволяють використовувати їх для побудови систем розпізнавання мовних голосових сигналів, для створення інтелектуальних систем взаємодії користувача й комп'ютера

Біографія автора

Yana Byelozorova, Національний авіаційний університет пр. Космонавта Комарова, 1, м. Київ, Україна, 03058

Асистент

Кафедра інженерії програмного забезпечення

Посилання

Pervushin, E. A. (2011). Obzor osnovnyih metodov raspoznavaniya diktorov. Matematicheskie strukturyi i modelirovanie, 24, 41–54.

Adami, A. G. (2007). Modeling prosodic differences for speaker recognition. Speech Communication, 49 (4), 277–291. doi: 10.1016/j.specom.2007.02.005

Kinnunen, T., Li, H. (2010). An overview of text-independent speaker recognition: From features to supervectors. Speech Communication, 52 (1), 12–40. doi: 10.1016/j.specom.2009.08.009

Rybalsky, O. V., Solovyov, V. I. (2014). Razrabotka i issledovaniya prigodnosti ekspertnogo instrumentariya "fraktal-m" dlya identifikatsii diktora po parametram golosovyih signalov. Registraciya, hranenie i obrabrabotka dannyh, 16 (1), 79–87.

Sorokin, V. N., Tsyiplihin, A. I. (2010). Verifikatsiya diktora po spektralno-vremennyim parametram rechevogo signala. Informatsionnyie protsessyi, 10 (2), 87–104.

Rybalsky, O. V., Soloviev, V. I., Zheleznyak, V. K. (2014). Spektralnyiy analiz i sovremennyie rechevyie tehnologii. Vestnik Polotskogo gosudarstvennogo universiteta, 4, 2–6.

Ptashnik, B. Y., Simotyuk, M. M. (2009). A theorem of contribution for spaces in an unchecked order. Lviv: Publisher National University "Lviv Polytechnic", 26.

Pleonkin, A. V. (2013). Razryivyi gazodinamicheskih funktsiy v metodah skvoznogo scheta, ih algoritmicheskaya lokalizatsiya i klassifikatsiya. Мoscow, 125.

Solovev, V. I., Byelozorova, Ya. A. (2013). Ispolzovanie fraktalnoy razmernosti audiofaylov v zadache segmentatsii zvukovogo fayla. Visnik Shidnoukrayinskogo natsionainogo universitetu im. V. Dalya, 5 (194), 165–169.

Solovjov, V. I., Byelozorova, Ya. A. (2014). Multifractal approach in pattern recognition of an announcer’s voice. Tеka. Commission of motorization and energetics in agriculture, 15 (2), 13–21.

##submission.downloads##

Опубліковано

2017-05-31

Номер

Том 5 № 2 (2017)

Розділ

Технічні науки

Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.

Наше видання використовує положення про авторські права Creative Commons CC BY для журналів відкритого доступу.

Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:

1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.

2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.