Порівняльна характеристика здатності згорткових нейронних мереж до концепції трансферного навчання

Автор(и)

DOI:

https://doi.org/10.15587/2706-5448.2022.252695

Ключові слова:

нейронні мережі, трансферне навчання, згорткові нейронні мережі, обсяг комп'ютерних ресурсів

Анотація

Об'єктом дослідження є здатність комбінувати попередньо навчену модель глибинної нейронної мережі прямого поширення з даними користувача при їх використанні в задачах визначення класу одного об'єкта на зображенні. Тобто розглянуто процеси трансферного навчання в згорткових нейронних мережах в задачах класифікації. Проведені дослідження базуються на застосуванні методу порівняння теоретичних та практичних результатів, отриманих при навчанні згорткових нейронних мереж. Основним завданням даного дослідження було провести два різних процеси навчання. Традиційне навчання, під час якого на кожному етапі навчання відбувається коригування значень всіх ваг кожного шару мережі, після чого відбувається процес навчання нейронної мережі на вибірці даних, представлених зображеннями. Другим процесом є навчання з використанням методів трансферного навчання, коли при ініціалізації наперед навченої мережі «заморожують» ваги всіх її шарів за винятком останнього повнозв’язного шару. Цей шар буде замінено на новий з числом виходів, що повинно дорівнювати кількості класів у досліджуваній вибірці. Після чого ініціалізувати його параметри випадковими значеннями, розподіленими за нормальним законом. І тоді провести навчання такої згорткової нейронної мережі на заданій вибірці. Коли навчання було проведено – отримані результати пройшли процес порівняння. Як висновок, навчання згорткової нейронної мережі із застосуванням методів трансферного навчання може бути застосовано до різних завдань класифікації, починаючи з цифр та закінчуючи космічними об’єктами (зорями та квазарами). Причому такий вид навчання є більш ефективним при значно менших часових витратах. Досить важливим є також обсяг комп'ютерних ресурсів, що витрачаються на дослідження. Так як не всяку модель згорткової нейронної мережі можна повністю навчити, не маючи при цьому потужних комп’ютерних систем та великої кількості зображень в навчальній вибірці.

Біографія автора

Володимир Петрович Хоцянівський, Національний авіаційний університет

Аспірант

Кафедра авіаційних комп'ютерно-інтегрованих комплексів

Посилання

  1. Zhu, Y., Chen, Y., Lu, Z., Pan, S. J., Xue, G.-R., Yu, Y., Yang, Q. (2011). Heterogeneous Transfer Learning for Image Classification. Twenty-Fifth AAAI Conference on Artificial Intelligence, 1304–1309.
  2. Raina, R., Battle A., Lee H., Packer, B., Ng, A. Y. (2007). Self-taught Learning: Transfer Learning from Unlabeled Data. Proceedings of the 24th International conference on Machine learning, 767–774. doi: http://doi.org/10.1145/1273496.1273592
  3. Govind, L., Kumar, D. (2017). Diabetic retinopathy detection using transfer learning. Journal for advanced research in applied science, 4, 463–471.
  4. Deep Learning: Transfer learning i tonkaia nastroika glubokikh svertochnykh neironnykh setei (2016). Khabrakhabr. Available at: https://habrahabr.ru/company/microsoft/blog/314934
  5. Joey, S. (2019). Creating AlexNet on Tensorflow from Scratch. Part 2: Creati ng AlexNet. Available at: https://joeyism.medium.com/creating-alexnet-on-tensorflow-from-scratch-part-2-creating-alexnet-e0cd948d7b04
  6. Lee, H., Grosse, R., Ranganath, R., Ng, A. Y. (2009). Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. Proceedings of the 26th Annual International Conference on Machine Learning, ICML 2009. Montreal. Available at: http://robotics.stanford.edu/~ang/papers/icml09-ConvolutionalDeepBeliefNetworks.pdf
  7. VGG16 – Convolutional Network for Classification and Detection (2018). Available at: https://neurohive.io/en/popular-networks/vgg16/
  8. PyTorch Documentation (2017). Torch Contributors. Available at: http://pytorch.org/docs/0.3.0/index.html
  9. He, K., Zhang, X., Ren, S., Sun, J. (2015). Deep Residual Learning for Image Recognition. Cornell University. Available at: https://arxiv.org/abs/1512.03385v1
  10. Huang, G., Liu, Z., van der Maaten, L., Weinberger, K. Q. (2018). Densely Connected Convolutional Networks. Cornell University. Available at: https://arxiv.org/abs/1608.06993v5
  11. Wan, L., Zeiler, M., Zhang S., Cun, Y. L., Fergus, R. (2013). Regularization of Neural Networks using DropConnect. Proceedings of the 30th International Conference on Machine Learning, PMLR, 28 (3), 1058–1066.
  12. Ballan, L., Bertini, M., Del Bimbo, A., Serain, A. M., Serra, G., Zaccone. B. F. (2012). Combining generative and discriminative models for classifying social images from 101 object categories. Proceedings of the 21st International Conference on Pattern Recognition (ICPR2012), 1731–1734.

##submission.downloads##

Опубліковано

2022-02-11

Як цитувати

Хоцянівський, В. П. (2022). Порівняльна характеристика здатності згорткових нейронних мереж до концепції трансферного навчання. Technology Audit and Production Reserves, 1(2(63), 10–13. https://doi.org/10.15587/2706-5448.2022.252695

Номер

Розділ

Інформаційні технології: Звіт про науково-дослідну роботу