Виділення самоподібних структур мовних сигналів в задачах ідентифікації диктора
DOI:
https://doi.org/10.15587/2313-8416.2017.101098Słowa kluczowe:
мовний сигнал, самоподібні структури, фрактальна розмірність, сегментація мови, розпізнавання диктораAbstrakt
Досліджена задача виділення ідентифікаційних ознак диктора у вигляді параметрів частоти основного тону і розпізнавання диктора на основі кратномасштабного та фрактального перетворення. Запропоновано підхід виділення унікальних для особистості самоподібних структур і розроблені методики обробки голосового сигналу дозволяють використовувати їх для побудови систем розпізнавання мовних голосових сигналів, для створення інтелектуальних систем взаємодії користувача й комп'ютера
Bibliografia
Pervushin, E. A. (2011). Obzor osnovnyih metodov raspoznavaniya diktorov. Matematicheskie strukturyi i modelirovanie, 24, 41–54.
Adami, A. G. (2007). Modeling prosodic differences for speaker recognition. Speech Communication, 49 (4), 277–291. doi: 10.1016/j.specom.2007.02.005
Kinnunen, T., Li, H. (2010). An overview of text-independent speaker recognition: From features to supervectors. Speech Communication, 52 (1), 12–40. doi: 10.1016/j.specom.2009.08.009
Rybalsky, O. V., Solovyov, V. I. (2014). Razrabotka i issledovaniya prigodnosti ekspertnogo instrumentariya "fraktal-m" dlya identifikatsii diktora po parametram golosovyih signalov. Registraciya, hranenie i obrabrabotka dannyh, 16 (1), 79–87.
Sorokin, V. N., Tsyiplihin, A. I. (2010). Verifikatsiya diktora po spektralno-vremennyim parametram rechevogo signala. Informatsionnyie protsessyi, 10 (2), 87–104.
Rybalsky, O. V., Soloviev, V. I., Zheleznyak, V. K. (2014). Spektralnyiy analiz i sovremennyie rechevyie tehnologii. Vestnik Polotskogo gosudarstvennogo universiteta, 4, 2–6.
Ptashnik, B. Y., Simotyuk, M. M. (2009). A theorem of contribution for spaces in an unchecked order. Lviv: Publisher National University "Lviv Polytechnic", 26.
Pleonkin, A. V. (2013). Razryivyi gazodinamicheskih funktsiy v metodah skvoznogo scheta, ih algoritmicheskaya lokalizatsiya i klassifikatsiya. Мoscow, 125.
Solovev, V. I., Byelozorova, Ya. A. (2013). Ispolzovanie fraktalnoy razmernosti audiofaylov v zadache segmentatsii zvukovogo fayla. Visnik Shidnoukrayinskogo natsionainogo universitetu im. V. Dalya, 5 (194), 165–169.
Solovjov, V. I., Byelozorova, Ya. A. (2014). Multifractal approach in pattern recognition of an announcer’s voice. Tеka. Commission of motorization and energetics in agriculture, 15 (2), 13–21.
##submission.downloads##
Opublikowane
Numer
Dział
Licencja
Copyright (c) 2017 Yana Byelozorova
Utwór dostępny jest na licencji Creative Commons Uznanie autorstwa 4.0 Międzynarodowe.
Our journal abides by the Creative Commons CC BY copyright rights and permissions for open access journals.
Authors, who are published in this journal, agree to the following conditions:
1. The authors reserve the right to authorship of the work and pass the first publication right of this work to the journal under the terms of a Creative Commons CC BY, which allows others to freely distribute the published research with the obligatory reference to the authors of the original work and the first publication of the work in this journal.
2. The authors have the right to conclude separate supplement agreements that relate to non-exclusive work distribution in the form in which it has been published by the journal (for example, to upload the work to the online storage of the journal or publish it as part of a monograph), provided that the reference to the first publication of the work in this journal is included.