Автоматичне визначення статі диктора на основі розподілу Коші в октавній смузі частот
DOI:
https://doi.org/10.15587/2313-8416.2019.172408Ключові слова:
розподіл Коші, частоти формант, частоти антіформант, моментні функції, гендерне розпізнаванняАнотація
В роботі отримані алгоритми визначення статі диктора на основі використання розподілу Коші в октавній смузі частот зі середньогеометричною частотою 125 Гц. Побудовано класифікатори на основі максимуму логарифма функції правдоподібності. Розглянуто алгоритм визначення статі диктора, де враховується не тільки логарифм розподілу Коші в октавній смузі частот, але і оцінки середнього значення частот формант і частот антіформант. Проведено дослідження ймовірності правильного розпізнавання алгоритмів визначення статі диктора
Посилання
Kalyuzhnyiy, A. Ya., Semenov, V. Yu. (2009). Metod identifikatsii pola diktora na osnove modelirovaniya akusticheskih parametrov golosa gaussovyimi smesyami. Akustichniy visnik, 12 (2), 31–38.
Scheme, E., Castillo-Guerra, E., Englehart, K., Kizhanatham, A. (2006). Practical Considerations for Real-Time Implementation of Speech-Based Gender Detection. Progress in Pattern Recognition, Image Analysis and Applications. Berlin, Heidelberg: Springer, 426–436. doi: http://doi.org/10.1007/11892755_44
Pribil, J., Pribilova, A., Matousek, J. (2016). GMM-based speaker gender and age classification after voice conversion. 2016 First International Workshop on Sensing, Processing and Learning for Intelligent Machines (SPLINE). IEEE, 1–5. doi: http://doi.org/10.1109/splim.2016.7528391
Omelchenko, S. (2018). Development of the method of automatic determination of the speaker gender on the basis of joint evaluation of frequency moments of basic tons and formant frequencies. Technology Audit and Production Reserves, 3 (2 (41)), 29–33. doi: http://doi.org/10.15587/2312-8372.2018.134977
Buyukyilmaz, M., Cibikdiken, A. O. (2016). Voice Gender Recognition Using Deep Learning. Proceedings of 2016 International Conference on Modeling, Simulation and Optimization Technologies and Applications (MSOTA2016). Atlantis Press, 409–411. doi: http://doi.org/10.2991/msota-16.2016.90
Levitan, S. I., Mishra, T., Bangalore, S. (2016). Automatic identification of gender from speech. Proceeding of Speech Prosody, 84–88. doi: http://doi.org/10.21437/speechprosody.2016-18
Faek, F. (2015). Objective Gender and Age Recognition from Speech Sentences. Aro, The Scientific Journal of Koya University, 3 (2), 24–29. doi: http://doi.org/10.14500/aro.10072
Harb, H., Liming, C. (2003). Gender identification using a general audio classifier. 2003 International Conference on Multimedia and Expo. ICME’03. Proceedings (Cat. No.03TH8698). IEEE. doi: http://doi.org/10.1109/icme.2003.1221721
Sorokin, V. N., Makarov, I. S. (2008). Opredelenie pola diktora po golosu. Akusticheskiy zhurnal, 54 (4), 659–668.
Zeng, Y., Wu, Z., Falk, T., Chan, W. (2006). Robust GMM Based Gender Classification using Pitch and RASTA-PLP Parameters of Speech. 2006 International Conference on Machine Learning and Cybernetics. Dalian, 2006. P. 3376–3379. doi: https://doi.org/10.1109/icmlc.2006.258497
Presniakov, I. N., Omel'chenko, S. V. (2003). Pomehoustoichivye algoritmy segmentacii rechi v sistemah obrabotki [Interference-free speech segmentation algorithms in processing systems]. Radiotehnika. Vseukrainskii mezhvedomstvennyi nauchno-tehnicheskii sbornik, 131, 165–173.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2019 Sergey Omelchenko
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Наше видання використовує положення про авторські права Creative Commons CC BY для журналів відкритого доступу.
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.