Автоматическое определение пола диктора на основе распределения Коши в октавной полосе частот

Sergey Omelchenko

doi:10.15587/2313-8416.2019.172408

Автоматичне визначення статі диктора на основі розподілу Коші в октавній смузі частот

Автор(и)

Sergey Omelchenko Харківський національний університет радіоелектроніки пр. Науки, 14, м. Харків, Україна, 61166, Україна https://orcid.org/0000-0002-3998-978X

DOI:

https://doi.org/10.15587/2313-8416.2019.172408

Ключові слова:

розподіл Коші, частоти формант, частоти антіформант, моментні функції, гендерне розпізнавання

Анотація

В роботі отримані алгоритми визначення статі диктора на основі використання розподілу Коші в октавній смузі частот зі середньогеометричною частотою 125 Гц. Побудовано класифікатори на основі максимуму логарифма функції правдоподібності. Розглянуто алгоритм визначення статі диктора, де враховується не тільки логарифм розподілу Коші в октавній смузі частот, але і оцінки середнього значення частот формант і частот антіформант. Проведено дослідження ймовірності правильного розпізнавання алгоритмів визначення статі диктора

Біографія автора

Sergey Omelchenko, Харківський національний університет радіоелектроніки пр. Науки, 14, м. Харків, Україна, 61166

Кандидат технічних наук, доцент

Кафедра інформаційно-мережевої інженерії

Посилання

Kalyuzhnyiy, A. Ya., Semenov, V. Yu. (2009). Metod identifikatsii pola diktora na osnove modelirovaniya akusticheskih parametrov golosa gaussovyimi smesyami. Akustichniy visnik, 12 (2), 31–38.

Scheme, E., Castillo-Guerra, E., Englehart, K., Kizhanatham, A. (2006). Practical Considerations for Real-Time Implementation of Speech-Based Gender Detection. Progress in Pattern Recognition, Image Analysis and Applications. Berlin, Heidelberg: Springer, 426–436. doi: http://doi.org/10.1007/11892755_44

Pribil, J., Pribilova, A., Matousek, J. (2016). GMM-based speaker gender and age classification after voice conversion. 2016 First International Workshop on Sensing, Processing and Learning for Intelligent Machines (SPLINE). IEEE, 1–5. doi: http://doi.org/10.1109/splim.2016.7528391

Omelchenko, S. (2018). Development of the method of automatic determination of the speaker gender on the basis of joint evaluation of frequency moments of basic tons and formant frequencies. Technology Audit and Production Reserves, 3 (2 (41)), 29–33. doi: http://doi.org/10.15587/2312-8372.2018.134977

Buyukyilmaz, M., Cibikdiken, A. O. (2016). Voice Gender Recognition Using Deep Learning. Proceedings of 2016 International Conference on Modeling, Simulation and Optimization Technologies and Applications (MSOTA2016). Atlantis Press, 409–411. doi: http://doi.org/10.2991/msota-16.2016.90

Levitan, S. I., Mishra, T., Bangalore, S. (2016). Automatic identification of gender from speech. Proceeding of Speech Prosody, 84–88. doi: http://doi.org/10.21437/speechprosody.2016-18

Faek, F. (2015). Objective Gender and Age Recognition from Speech Sentences. Aro, The Scientific Journal of Koya University, 3 (2), 24–29. doi: http://doi.org/10.14500/aro.10072

Harb, H., Liming, C. (2003). Gender identification using a general audio classifier. 2003 International Conference on Multimedia and Expo. ICME’03. Proceedings (Cat. No.03TH8698). IEEE. doi: http://doi.org/10.1109/icme.2003.1221721

Sorokin, V. N., Makarov, I. S. (2008). Opredelenie pola diktora po golosu. Akusticheskiy zhurnal, 54 (4), 659–668.

Zeng, Y., Wu, Z., Falk, T., Chan, W. (2006). Robust GMM Based Gender Classification using Pitch and RASTA-PLP Parameters of Speech. 2006 International Conference on Machine Learning and Cybernetics. Dalian, 2006. P. 3376–3379. doi: https://doi.org/10.1109/icmlc.2006.258497

Presniakov, I. N., Omel'chenko, S. V. (2003). Pomehoustoichivye algoritmy segmentacii rechi v sistemah obrabotki [Interference-free speech segmentation algorithms in processing systems]. Radiotehnika. Vseukrainskii mezhvedomstvennyi nauchno-tehnicheskii sbornik, 131, 165–173.

##submission.downloads##

PDF (Русский)

Опубліковано

2019-07-16

Номер

№ 6 (2019)

Розділ

Технічні науки

Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.

Наше видання використовує положення про авторські права Creative Commons CC BY для журналів відкритого доступу.

Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:

1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.

2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.