Виділення самоподібних структур мовних сигналів в задачах ідентифікації диктора
DOI:
https://doi.org/10.15587/2313-8416.2017.101098Ключові слова:
мовний сигнал, самоподібні структури, фрактальна розмірність, сегментація мови, розпізнавання диктораАнотація
Досліджена задача виділення ідентифікаційних ознак диктора у вигляді параметрів частоти основного тону і розпізнавання диктора на основі кратномасштабного та фрактального перетворення. Запропоновано підхід виділення унікальних для особистості самоподібних структур і розроблені методики обробки голосового сигналу дозволяють використовувати їх для побудови систем розпізнавання мовних голосових сигналів, для створення інтелектуальних систем взаємодії користувача й комп'ютера
Посилання
Pervushin, E. A. (2011). Obzor osnovnyih metodov raspoznavaniya diktorov. Matematicheskie strukturyi i modelirovanie, 24, 41–54.
Adami, A. G. (2007). Modeling prosodic differences for speaker recognition. Speech Communication, 49 (4), 277–291. doi: 10.1016/j.specom.2007.02.005
Kinnunen, T., Li, H. (2010). An overview of text-independent speaker recognition: From features to supervectors. Speech Communication, 52 (1), 12–40. doi: 10.1016/j.specom.2009.08.009
Rybalsky, O. V., Solovyov, V. I. (2014). Razrabotka i issledovaniya prigodnosti ekspertnogo instrumentariya "fraktal-m" dlya identifikatsii diktora po parametram golosovyih signalov. Registraciya, hranenie i obrabrabotka dannyh, 16 (1), 79–87.
Sorokin, V. N., Tsyiplihin, A. I. (2010). Verifikatsiya diktora po spektralno-vremennyim parametram rechevogo signala. Informatsionnyie protsessyi, 10 (2), 87–104.
Rybalsky, O. V., Soloviev, V. I., Zheleznyak, V. K. (2014). Spektralnyiy analiz i sovremennyie rechevyie tehnologii. Vestnik Polotskogo gosudarstvennogo universiteta, 4, 2–6.
Ptashnik, B. Y., Simotyuk, M. M. (2009). A theorem of contribution for spaces in an unchecked order. Lviv: Publisher National University "Lviv Polytechnic", 26.
Pleonkin, A. V. (2013). Razryivyi gazodinamicheskih funktsiy v metodah skvoznogo scheta, ih algoritmicheskaya lokalizatsiya i klassifikatsiya. Мoscow, 125.
Solovev, V. I., Byelozorova, Ya. A. (2013). Ispolzovanie fraktalnoy razmernosti audiofaylov v zadache segmentatsii zvukovogo fayla. Visnik Shidnoukrayinskogo natsionainogo universitetu im. V. Dalya, 5 (194), 165–169.
Solovjov, V. I., Byelozorova, Ya. A. (2014). Multifractal approach in pattern recognition of an announcer’s voice. Tеka. Commission of motorization and energetics in agriculture, 15 (2), 13–21.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2017 Yana Byelozorova
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Наше видання використовує положення про авторські права Creative Commons CC BY для журналів відкритого доступу.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.