Виділення самоподібних структур мовних сигналів в задачах ідентифікації диктора
DOI:
https://doi.org/10.15587/2313-8416.2017.101098Ключевые слова:
мовний сигнал, самоподібні структури, фрактальна розмірність, сегментація мови, розпізнавання диктораАннотация
Досліджена задача виділення ідентифікаційних ознак диктора у вигляді параметрів частоти основного тону і розпізнавання диктора на основі кратномасштабного та фрактального перетворення. Запропоновано підхід виділення унікальних для особистості самоподібних структур і розроблені методики обробки голосового сигналу дозволяють використовувати їх для побудови систем розпізнавання мовних голосових сигналів, для створення інтелектуальних систем взаємодії користувача й комп'ютера
Библиографические ссылки
Pervushin, E. A. (2011). Obzor osnovnyih metodov raspoznavaniya diktorov. Matematicheskie strukturyi i modelirovanie, 24, 41–54.
Adami, A. G. (2007). Modeling prosodic differences for speaker recognition. Speech Communication, 49 (4), 277–291. doi: 10.1016/j.specom.2007.02.005
Kinnunen, T., Li, H. (2010). An overview of text-independent speaker recognition: From features to supervectors. Speech Communication, 52 (1), 12–40. doi: 10.1016/j.specom.2009.08.009
Rybalsky, O. V., Solovyov, V. I. (2014). Razrabotka i issledovaniya prigodnosti ekspertnogo instrumentariya "fraktal-m" dlya identifikatsii diktora po parametram golosovyih signalov. Registraciya, hranenie i obrabrabotka dannyh, 16 (1), 79–87.
Sorokin, V. N., Tsyiplihin, A. I. (2010). Verifikatsiya diktora po spektralno-vremennyim parametram rechevogo signala. Informatsionnyie protsessyi, 10 (2), 87–104.
Rybalsky, O. V., Soloviev, V. I., Zheleznyak, V. K. (2014). Spektralnyiy analiz i sovremennyie rechevyie tehnologii. Vestnik Polotskogo gosudarstvennogo universiteta, 4, 2–6.
Ptashnik, B. Y., Simotyuk, M. M. (2009). A theorem of contribution for spaces in an unchecked order. Lviv: Publisher National University "Lviv Polytechnic", 26.
Pleonkin, A. V. (2013). Razryivyi gazodinamicheskih funktsiy v metodah skvoznogo scheta, ih algoritmicheskaya lokalizatsiya i klassifikatsiya. Мoscow, 125.
Solovev, V. I., Byelozorova, Ya. A. (2013). Ispolzovanie fraktalnoy razmernosti audiofaylov v zadache segmentatsii zvukovogo fayla. Visnik Shidnoukrayinskogo natsionainogo universitetu im. V. Dalya, 5 (194), 165–169.
Solovjov, V. I., Byelozorova, Ya. A. (2014). Multifractal approach in pattern recognition of an announcer’s voice. Tеka. Commission of motorization and energetics in agriculture, 15 (2), 13–21.
Загрузки
Опубликован
Выпуск
Раздел
Лицензия
Copyright (c) 2017 Yana Byelozorova
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Наше издание использует положения об авторских правах Creative Commons CC BY для журналов открытого доступа.
Авторы, которые публикуются в этом журнале, соглашаются со следующими условиями:
1. Авторы оставляют за собой право на авторство своей работы и передают журналу право первой публикации этой работы на условиях лицензии Creative Commons CC BY, которая позволяет другим лицам свободно распространять опубликованную работу с обязательной ссылкой на авторов оригинальной работы и первую публикацию работы в этом журнале.
2. Авторы имеют право заключать самостоятельные дополнительные соглашения, которые касаются неэксклюзивного распространения работы в том виде, в котором она была опубликована этим журналом (например, размещать работу в электронном хранилище учреждения или публиковать в составе монографии), при условии сохранения ссылки на первую публикацию работы в этом журнале .