Розробка комбінованої моделі розпізнавання зображень

Автор(и)

  • Mykola Voloshyn Інститут проблем моделювання в енергетиці ім. Г. Є. Пухова Національної академії наук України, вул. Генерала Наумова, 15, м. Київ, Україна, 03164, Україна https://orcid.org/0000-0003-1290-6152

DOI:

https://doi.org/10.15587/2312-8372.2019.173122

Ключові слова:

системи комп’ютерного зору, аналіз зображень, розпізнавання та ідентифікація об’єктів

Анотація

Об’єктом дослідження є процеси ідентифікації та класифікації об’єктів у задачах комп’ютерного зору. В даний час для розпізнавання зображень найкращі результати демонструють штучні нейронні мережі. Однак, навчання нейронних мереж – це погано обумовлена задача. Погана обумовленість означає, що навіть великий набір даних може нести в собі малий обсяг інформації про задачу, що вирішується. Тому ключова роль в процесі синтезу параметрів конкретної математичної моделі нейронної мережі належить навчальним даним. Підбір репрезентативної навчальної вибірки є однією з найскладніших задач в машинному навчанні і не завжди можливий на практиці.

Запропонована у роботі нова комбінована модель розпізнавання зображень з використанням теорії несилової взаємодії володіє такими ключовими особливостями:

– призначена для обробки великої кількості даних;

– виділяє корисну інформацію з довільного потоку;

– дозволяє природно додавати нові об’єкти;

– терпима до помилок та дозволяє швидко перепрограмувати поведінку системи.

В порівнянні з існуючими аналогами, достовірність розпізнавання запропонованою моделлю в усіх експериментальних дослідженнях була вище відомих методів розпізнавання. Середня достовірність розпізнавання запропонованою моделлю склала 71,3 %; методом локальних бінарних шаблонів – 59,9 %; методом аналізу головних компонент – 65,2 %; методом лінійного дискримінантного аналізу – 65,6 %. Така достовірність розпізнавання в поєднанні з обчислювальною складністю робить даний метод прийнятним для застосування в системах, які працюють в умовах наближених до реального часу. Також такий підхід дозволяє керувати достовірністю розпізнавання. Це досягається завдяки налаштуванню кількості секторів гістограм локальних бінарних шаблонів, які використовуються при описі зображень, та кількості фрагментів зображення, які використовуються на етапі класифікації інтроформаційним підходом. Значною мірою на час класифікації впливає кількість фрагментів зображення, оскільки, в такому випадку, потрібно вираховувати попарно співставлення суміщення дій системи в кожному з можливих напрямків.

Біографія автора

Mykola Voloshyn, Інститут проблем моделювання в енергетиці ім. Г. Є. Пухова Національної академії наук України, вул. Генерала Наумова, 15, м. Київ, Україна, 03164

Аспірант

Відділення гібридних та моделюючих систем в енергетиці

Посилання

  1. Wagner, P. (2011). Principal Component Analysis and Linear Discriminant Analysis with GNU Octave. Available at: https://www.bytefish.de/blog/pca_lda_with_gnu_octave/
  2. Samal, A., Iyengar, P. A. (1992). Automatic recognition and analysis of human faces and facial expressions. Pattern Recognition, 25 (1), 65–77. doi: http://doi.org/10.1016/0031-3203(92)90007-6
  3. Ojala, T., Pietikainen, M., Maenpaa, T. (2002). Multiresolution gray-scale and rotation invariant texture classification with local binary patterns. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24 (7), 971–987. doi: http://doi.org/10.1109/tpami.2002.1017623
  4. Tomashevich, N. S. (2007). Statisticheskie metody vydeleniia priznakov. Neirokompiutery v prikladnykh zadachakh obrabotki izobrazhenii, 121–128.
  5. Volchenkov, M. P., Samonenko, I. Iu. (2005). Ob avtomaticheskom raspoznavanii lits. Intellektualnye sistemy, 9 (1-4), 135–156.
  6. Simard, P. Y., Steinkraus, D., Platt, J. C. (2003). Best practices for convolutional neural networks applied to visual document analysis. 12th International Conference on Document Analysis and Recognition, 2, 958. doi: http://doi.org/10.1109/icdar.2003.1227801
  7. LeCun, Y., Huang, F.-J., Bottou, L. (2004). Learning methods for generic objects recognition with invariance to pose and lighting. Los Alamitos. Proceedings of the Computer Vision and Pattern Recognition Conference (CVPR’04), 2, 97–104. doi: http://doi.org/10.1109/cvpr.2004.1315150
  8. Mitrofanov, C. A. (2015). Sravnenie effektivnosti razlichnykh metodov intellektualnogo analiza dannykh v zadachakh raspoznavaniia izobrazhenii. Innovatsionnaia nauka, 12 (2), 96–98.
  9. Mamontov, D. Iu., Karaseva, T. S. (2015). Reshenie zadach finansovogo analiza s pomoshchiu intellektualnykh informatsionnykh tekhnologii. ITSiT. Available at: https://studfiles.net/preview/5966499/
  10. Krizhevsky, A., Sutskever, I., Hinton, G. E. (2012). ImageNet classification with deep convolutional neural networks. Advances in Neural Information Processing Systems, 25, 1106–1114.
  11. Amsterdam Library of Object Images (ALOI). Available at: http://aloi.science.uva.nl/
  12. The Chars74K dataset. Available at: http://www.ee.surrey.ac.uk/CVSSP/demos/chars74k/
  13. The Database of Faces. Available at: http://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase.html
  14. Celebrities Data Images Set for Computer Vision. Available at: http://cdiset.blogspot.com/

##submission.downloads##

Опубліковано

2019-06-30

Як цитувати

Voloshyn, M. (2019). Розробка комбінованої моделі розпізнавання зображень. Technology Audit and Production Reserves, 3(2(47), 9–14. https://doi.org/10.15587/2312-8372.2019.173122

Номер

Розділ

Інформаційні технології: Оригінальне дослідження