Виділення самоподібних структур мовних сигналів в задачах ідентифікації диктора
DOI:
https://doi.org/10.15587/2313-8416.2017.101098Ключевые слова:
мовний сигнал, самоподібні структури, фрактальна розмірність, сегментація мови, розпізнавання диктораАннотация
Досліджена задача виділення ідентифікаційних ознак диктора у вигляді параметрів частоти основного тону і розпізнавання диктора на основі кратномасштабного та фрактального перетворення. Запропоновано підхід виділення унікальних для особистості самоподібних структур і розроблені методики обробки голосового сигналу дозволяють використовувати їх для побудови систем розпізнавання мовних голосових сигналів, для створення інтелектуальних систем взаємодії користувача й комп'ютера
Библиографические ссылки
Pervushin, E. A. (2011). Obzor osnovnyih metodov raspoznavaniya diktorov. Matematicheskie strukturyi i modelirovanie, 24, 41–54.
Adami, A. G. (2007). Modeling prosodic differences for speaker recognition. Speech Communication, 49 (4), 277–291. doi: 10.1016/j.specom.2007.02.005
Kinnunen, T., Li, H. (2010). An overview of text-independent speaker recognition: From features to supervectors. Speech Communication, 52 (1), 12–40. doi: 10.1016/j.specom.2009.08.009
Rybalsky, O. V., Solovyov, V. I. (2014). Razrabotka i issledovaniya prigodnosti ekspertnogo instrumentariya "fraktal-m" dlya identifikatsii diktora po parametram golosovyih signalov. Registraciya, hranenie i obrabrabotka dannyh, 16 (1), 79–87.
Sorokin, V. N., Tsyiplihin, A. I. (2010). Verifikatsiya diktora po spektralno-vremennyim parametram rechevogo signala. Informatsionnyie protsessyi, 10 (2), 87–104.
Rybalsky, O. V., Soloviev, V. I., Zheleznyak, V. K. (2014). Spektralnyiy analiz i sovremennyie rechevyie tehnologii. Vestnik Polotskogo gosudarstvennogo universiteta, 4, 2–6.
Ptashnik, B. Y., Simotyuk, M. M. (2009). A theorem of contribution for spaces in an unchecked order. Lviv: Publisher National University "Lviv Polytechnic", 26.
Pleonkin, A. V. (2013). Razryivyi gazodinamicheskih funktsiy v metodah skvoznogo scheta, ih algoritmicheskaya lokalizatsiya i klassifikatsiya. Мoscow, 125.
Solovev, V. I., Byelozorova, Ya. A. (2013). Ispolzovanie fraktalnoy razmernosti audiofaylov v zadache segmentatsii zvukovogo fayla. Visnik Shidnoukrayinskogo natsionainogo universitetu im. V. Dalya, 5 (194), 165–169.
Solovjov, V. I., Byelozorova, Ya. A. (2014). Multifractal approach in pattern recognition of an announcer’s voice. Tеka. Commission of motorization and energetics in agriculture, 15 (2), 13–21.
Загрузки
Опубликован
Выпуск
Раздел
Лицензия
Copyright (c) 2017 Yana Byelozorova
![Лицензия Creative Commons](http://i.creativecommons.org/l/by/4.0/88x31.png)
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Наше издание использует положения об авторских правах Creative Commons CC BY для журналов открытого доступа.
Авторы, которые публикуются в этом журнале, соглашаются со следующими условиями:
1. Авторы оставляют за собой право на авторство своей работы и передают журналу право первой публикации этой работы на условиях лицензии Creative Commons CC BY, которая позволяет другим лицам свободно распространять опубликованную работу с обязательной ссылкой на авторов оригинальной работы и первую публикацию работы в этом журнале.
2. Авторы имеют право заключать самостоятельные дополнительные соглашения, которые касаются неэксклюзивного распространения работы в том виде, в котором она была опубликована этим журналом (например, размещать работу в электронном хранилище учреждения или публиковать в составе монографии), при условии сохранения ссылки на первую публикацию работы в этом журнале .