Розпізнавання об’єктів аерозйомки на основі наборів даних з різною агрегацією класів

Автор(и)

  • Пилип Олександрович Приставка Національний авіаційний університет, Україна https://orcid.org/0000-0002-0360-2459
  • Ксенія Костянтинівна Духновська Київський національний університет імені Тараса Шевченка, Україна https://orcid.org/0000-0002-4539-159X
  • Оксана Іванівна Ковтун Київський національний університет імені Тараса Шевченка, Україна https://orcid.org/0000-0003-0871-5097
  • Ольга Олександрівна Лещенко Київський національний університет імені Тараса Шевченка, Україна https://orcid.org/0000-0002-3997-2785
  • Ольга Геннадіївна Чолишкіна Міжрегіональна академія управління персоналом, Україна https://orcid.org/0000-0002-0681-0413
  • Вадим Олексійович Семенов Національний авіаційний університет, Україна https://orcid.org/0000-0003-3154-3115

DOI:

https://doi.org/10.15587/1729-4061.2023.272951

Ключові слова:

розпізнавання об’єктів аерозйомки, класифікація наборів даних, точність розпізнавання, нейронна мережа групи ConvNets

Анотація

Об’єктом долідження даної роботи є алгоритми розпізнавання об’єктів аерозйомки, а саме проведення аналізу точності розпізнавання на основі наборів даних з різною агрегацією класів.  

Для вирішення цієї задачі розроблено інформаційну систему  для розпізнавання об’єктів за даними аерофотозйомки. Для створення інформаційної системи була обрана та використана архітектура, що базується на архітектурах нейронних мереж групи ConvNets з модифікаціями у структурі. Використання згорткової нейронної мережі групи ConvNets в архітектурі інформаційної системи для розпізнавання об’єктів аерозйомки дає високі показники точності при навчанні інформаційної системи і валідації її результатів. Але досліджень з приводу навчання нейронної мережі групи ConvNets авторами не виявлено. Тому було прийняте рішення провести аналіз в якому разі мережа групи ConvNets надасть результати валідації з більш високою точністю, коли навчання відбувається на датасетах з агрегацією класів чи без неї.

Проведено аналіз точності розпізнавання об’єктів аерозйомки на основі наборів даних з різною агрегацією класів. Набір даних, що використовувався для навчання нейронної мережі складався з 3-канальних розмічених зображень розміру 64х64 пікселів. На основі аналізу обрана оптимальна кількість епох для навчання, що дає можливість розпізнавати об’єкти аерозйомки з більшою точністтю і швидкістю. Зроблено висновок, що більша точність при класифікації зображень досягається для вибірки без перетину даних з різних класів (без агрегації класів). Результат роботи рекомендується використовувати при автоматизації наповнення датасетів, та інформаційною фільтрацією візуальних образів

Біографії авторів

Пилип Олександрович Приставка, Національний авіаційний університет

Доктор технічних наук, професор

Кафедра прикладної математики

Ксенія Костянтинівна Духновська, Київський національний університет імені Тараса Шевченка

Кандидат технічних наук

Кафедра програмних систем і технологій

Оксана Іванівна Ковтун, Київський національний університет імені Тараса Шевченка

Кандидат фізико-математичних наук, доцент

Кафедра програмних систем і технологій

Ольга Олександрівна Лещенко, Київський національний університет імені Тараса Шевченка

Кандидат технічних наук, доцент

Кафедра мережевих та інтернет технологій

Ольга Геннадіївна Чолишкіна, Міжрегіональна академія управління персоналом

Кандидат технічних наук, доцент

Кафедра обчислювальної математики та комп’ютерного моделювання

Вадим Олексійович Семенов, Національний авіаційний університет

Кафедра прикладної математики

Посилання

  1. Abbas, A., Yadav, V., Smith, E., Ramjas, E., Rutter, S. B., Benavidez, C. et al. (2021). Computer Vision-Based Assessment of Motor Functioning in Schizophrenia: Use of Smartphones for Remote Measurement of Schizophrenia Symptomatology. Digital Biomarkers, 5 (1), 29–36. doi: https://doi.org/10.1159/000512383
  2. Minz, P. S., Saini, C. S. (2021). Comparison of computer vision system and colour spectrophotometer for colour measurement of mozzarella cheese. Applied Food Research, 1 (2), 100020. doi: https://doi.org/10.1016/j.afres.2021.100020
  3. Gao, S., Guan, H., Ma, X. (2022). A recognition method of multispectral images of soybean canopies based on neural network. Ecological Informatics, 68, 101538. doi: https://doi.org/10.1016/j.ecoinf.2021.101538
  4. Prystavka, P., Dukhnovska, K., Kovtun, O., Leshchenko, O., Cholyshkina, O., Zhultynska, A. (2021). Devising information technology for determining the redundant information content of a digital image. Eastern-European Journal of Enterprise Technologies, 6 (2 (114)), 59–70. doi: https://doi.org/10.15587/1729-4061.2021.248698
  5. Appiah, O., Asante, M., Hayfron-Acquah, J. B. (2022). Improved approximated median filter algorithm for real-time computer vision applications. Journal of King Saud University - Computer and Information Sciences, 34 (3), 782–792. doi: https://doi.org/10.1016/j.jksuci.2020.04.005
  6. Liu, L., Chen, C. L. P., Zhou, Y., You, X. (2015). A new weighted mean filter with a two-phase detector for removing impulse noise. Information Sciences, 315, 1–16. doi: https://doi.org/10.1016/j.ins.2015.03.067
  7. Belattar, S., Abdoun, O., Haimoudi, E. K. (2022). A Novel Strategy for Improving the Counter Propagation Artificial Neural Networks in Classification Tasks. Journal of Communications Software and Systems, 18 (1), 17–27. doi: https://doi.org/10.24138/jcomss-2021-0121
  8. Kravchenko, Y., Leshchenko, O., Dakhno, N., Deinega, V., Shevchenko, H., Trush, O. (2020). Intellectual Fuzzy System Air Pollution Control. 2020 IEEE 2nd International Conference on Advanced Trends in Information Theory (ATIT). doi: https://doi.org/10.1109/atit50783.2020.9349334
  9. Mahdianpari, M., Salehi, B., Rezaee, M., Mohammadimanesh, F., Zhang, Y. (2018). Very Deep Convolutional Neural Networks for Complex Land Cover Mapping Using Multispectral Remote Sensing Imagery. Remote Sensing, 10 (7), 1119. doi: https://doi.org/10.3390/rs10071119
  10. Prystavka, P., Dolgikh, S., Kozachuk, O. (2022). Terrain Image Recognition with Unsupervised Generative Representations: the Effect of Anomalies. 2022 12th International Conference on Advanced Computer Information Technologies (ACIT). doi: https://doi.org/10.1109/acit54803.2022.9913178
  11. Muhtasim, D. A., Pavel, M. I., Tan, S. Y. (2022). A Patch-Based CNN Built on the VGG-16 Architecture for Real-Time Facial Liveness Detection. Sustainability, 14 (16), 10024. doi: https://doi.org/10.3390/su141610024
  12. Zhang, H., Luo, X. (2022). The Role of Knowledge Creation-Oriented Convolutional Neural Network in Learning Interaction. Computational Intelligence and Neuroscience, 2022, 1–12. doi: https://doi.org/10.1155/2022/6493311
  13. Hong, M., Choe, Y. (2019). Wasserstein Generative Adversarial Network Based De-Blurring Using Perceptual Similarity. Applied Sciences, 9 (11), 2358. doi: https://doi.org/10.3390/app9112358
Розпізнавання об’єктів аерозйомки на основі наборів даних з різною агрегацією класів

##submission.downloads##

Опубліковано

2023-02-28

Як цитувати

Приставка, П. О., Духновська, К. К., Ковтун, О. І., Лещенко, О. О., Чолишкіна, О. Г., & Семенов, В. О. (2023). Розпізнавання об’єктів аерозйомки на основі наборів даних з різною агрегацією класів. Eastern-European Journal of Enterprise Technologies, 1(2 (121), 6–13. https://doi.org/10.15587/1729-4061.2023.272951