Effectiveness of the use of algorithms and methods of artificial technologies for sign language recognition for people with disabilities

Aigulim Bayegizova; Gulden Murzabekova; Aisulu Ismailova; Ulzada Aitimova; Ayagoz Mukhanova; Zhanar Beldeubayeva; Aliya Ainagulova; Akgul Naizagarayeva

doi:10.15587/1729-4061.2022.262509

Ефективність використання алгоритмів і методів штучних технологій розпізнавання жестової мови для людей з обмеженими можливостями

Автор(и)

Aigulim Bayegizova L. N. Gumilyov Eurasian National University, Казахстан https://orcid.org/0000-0001-7236-6640
Gulden Murzabekova S. Seifullin Kazakh Agrotechnical University, Казахстан https://orcid.org/0000-0001-9807-5200
Aisulu Ismailova S. Seifullin Kazakh Agrotechnical University, Казахстан https://orcid.org/0000-0002-8958-1846
Ulzada Aitimova S. Seifullin Kazakh Agrotechnical University, Казахстан https://orcid.org/0000-0002-0803-7137
Ayagoz Mukhanova L. N. Gumilyov Eurasian National University, Казахстан https://orcid.org/0000-0003-3987-0938
Zhanar Beldeubayeva S. Seifullin Kazakh Agrotechnical University, Казахстан https://orcid.org/0000-0003-4056-6220
Aliya Ainagulova S. Seifullin Kazakh Agrotechnical University, Казахстан https://orcid.org/0000-0003-4872-2822
Akgul Naizagarayeva S. Seifullin Kazakh Agrotechnical University, Казахстан https://orcid.org/0000-0002-3616-0925

DOI:

https://doi.org/10.15587/1729-4061.2022.262509

Ключові слова:

модель нейронної мережі, згорткова нейронна мережа, LSTM-модуль, згортка, жестова мова

Анотація

За даними ВООЗ, кількість людей з обмеженими можливостями у світі перевищила 1 мільярд. При цьому 80 відсотків проживають в країнах, що розвиваються. У зв'язку з цим попит на використання додатків для людей з обмеженими можливостями зростає з кожним днем. У роботі для визначення жестової мови людей з обмеженими можливостями розглядаються нейромережеві методи, такі як MediaPipe Holistic та LSTM-модуль. Завдяки вбудованим засобам моніторингу MediaPipe продемонстрував безпрецедентно низьку затримку і високу точність відстеження в реальних умовах. Тому у даній роботі використовувався MediaPipe Holistic, що поєднує в собі управління позою, руками і обличчям з деталізованими рівнями.

Основною метою статті є показати ефективність алгоритму HAR для розпізнавання фізичної активності людини, заснованого на архітектурі глибокого навчання для класифікації дій за сімома різними класами.

Головним завданням даної роботи є високий рівень розпізнавання жестової мови людей з обмеженими можливостями при реалізації їхньої роботи у кросплатформних додатках, веб-додатках і соціальних мережах, що полегшують повсякденне життя людей з обмеженими можливостями та взаємодіють із суспільством. Для вирішення цього завдання використовувався алгоритм, що поєднує в собі архітектуру згорткової нейронної мережі (CNN) і довгої короткочасної пам'яті (LSTM) для вивчення просторових і тимчасових можливостей за тривимірними скелетними даними, взятими тільки з камери Microsoft Kinect. Така комбінація дозволяє використовувати переваги LSTM при моделюванні часових даних і CNN при моделюванні просторових даних.

Результати, отримані на основі розрахунків, виконаних додаванням нового шару до існуючої моделі, показали більш високу точність, ніж розрахунки, проведені за існуючою моделлю.

Біографії авторів

Aigulim Bayegizova, L. N. Gumilyov Eurasian National University

Candidate of Physical and Mathematical Sciences, Assistant Professor

Department of Radio Engineering, Electronics and Telecommunications