Розробка моделі вимірювання відстані з використанням підходу збільшення та модифікації архітектури YOLOV3
DOI:
https://doi.org/10.15587/1729-4061.2025.339774Ключові слова:
об'єкт виявлення, оцінка відстані, СДВ, монокулярна камера, YOLO, Hybrid DistАнотація
Визначення найкращої моделі для вимірювання відстані до об'єкта, відповідної формули для цієї моделі та модифікації архітектури YOLOv3 є предметом цього дослідження. Це було зроблено для вирішення проблеми похибок вимірювання відстані до об'єкта за допомогою монокулярної камери. У цьому дослідженні дослідники використали підхід збільшення та модифікували архітектуру YOLOv3, яка тоді отримала назву Hybrid Dist – YOLOv3. Запропонована модель вимірювання відстані не використовує змінні висоти камери та відстані зсуву камери, тому вона все ще може вимірювати об'єкти, які вищі за висоту камери, а час вимірювання є швидшим. Єдиною змінною у формулі виміряної відстані є зміна висоти зображення об'єкта. Що стосується модифікацій архітектури YOLOv3, існує два типи навчальних та тестових даних: початкові дані вимірювань та дані з KITTI. Навчальні дані з початкових вимірювань складалися з трьох класів, а саме: людина, пляшка та каністра, з 24, 10 та 10 вибірками відповідно. Точність виявлення при mAP0.50 становить 0.994, 1.1, з абсолютними значеннями похибки вимірювання (ɛA) –0.274, –0.153 та –0.163. Для навчальних даних KITTI є три класи об'єктів, а саме: пішохід, автомобіль та вантажівка, з 1150, 7682 та 318 вибірками відповідно. Згідно з проведеними тестами, значення ɛA для класів пішохід, автомобіль та вантажівка показують покращення порівняно з попереднім дослідженням, яке спочатку становило 1.75, 2.49 та 4.63, до 1.37, 2.25 та 3.74. Результати цього дослідження можуть бути застосовані в автомобільній промисловості для систем допомоги водієві (СДВ), футбольних роботів або подібних систем, що потребують вимірювання відстані.
Посилання
- Raj, T., Hashim, F. H., Huddin, A. B., Ibrahim, M. F., Hussain, A. (2020). A Survey on LiDAR Scanning Mechanisms. Electronics, 9 (5), 741. https://doi.org/10.3390/electronics9050741
- Ding, M., Zhang, Z., Jiang, X., Cao, Y. (2020). Vision-Based Distance Measurement in Advanced Driving Assistance Systems. Applied Sciences, 10 (20), 7276. https://doi.org/10.3390/app10207276
- Kim, J. B. (2019). Efficient Vehicle Detection and Distance Estimation Based on Aggregated Channel Features and Inverse Perspective Mapping from a Single Camera. Symmetry, 11 (10), 1205. https://doi.org/10.3390/sym11101205
- Haseeb, M. A., Guan, J., Ristić-Durrant, D., Graser, A. (2018). DisNet: A Novel Method for Distance Estimation from Monocular Camera. In 10th Planning, Perception and Navigation for Intelligent Vehicles. Madrid. Available at: https://project.inria.fr/ppniv18/files/2018/10/paper22.pdf
- Lee, S., Han, K., Park, S., Yang, X. (2022). Vehicle Distance Estimation from a Monocular Camera for Advanced Driver Assistance Systems. Symmetry, 14 (12), 2657. https://doi.org/10.3390/sym14122657
- Ali, A., Hassan, A., Ali, A. R., Ullah Khan, H., Kazmi, W., Zaheer, A. (2020). Real-time vehicle distance estimation using single view geometry. 2020 IEEE Winter Conference on Applications of Computer Vision (WACV), 1100–1109. https://doi.org/10.1109/wacv45572.2020.9093634
- Liang, H., Ma, Z., Zhang, Q. (2022). Self-Supervised Object Distance Estimation Using a Monocular Camera. Sensors, 22 (8), 2936. https://doi.org/10.3390/s22082936
- Lin, T.-Y., Maire, M., Belongie, S., Hays, J., Perona, P., Ramanan, D. et al. (2014). Microsoft COCO: Common Objects in Context. Computer Vision – ECCV 2014, 740–755. https://doi.org/10.1007/978-3-319-10602-1_48
- Jamzad, M., Foroughnassiraei, A., Chiniforooshan, E., Ghorbani, R., Kazemi, M., Chitsaz, H. et al. (2000). Middle Sized Soccer Robots: ARVAND. RoboCup-99: Robot Soccer World Cup III, 61–73. https://doi.org/10.1007/3-540-45327-x_4
- Jüngel, M., Mellmann, H., Spranger, M. (2008). Improving Vision-Based Distance Measurements Using Reference Objects. RoboCup 2007: Robot Soccer World Cup XI, 89–100. https://doi.org/10.1007/978-3-540-68847-1_8
- Joglekar, A., Joshi, D., Khemani, R., Nair, S., nd Sahare, S. (2011). Depth Estimation Using Monocular Camera. International Journal of Computer Science and Information Technologies, 2 (4), 1758–1763. Available at: https://www.ijcsit.com/docs/Volume 2/vol2issue4/ijcsit2011020480.pdf
- Venu Gopala Krishnan, J., Manoharan, N., Sheela Rani, B. (2010). Estimation of Distance To Texture Surface Using Complex Log Mapping. J. Comput. Appl., 3 (3), 16–21. Available at: https://d1wqtxts1xzle7.cloudfront.net/30862784/50116157_vol3i3p4-libre.pdf?1392203742=&response-content-disposition=inline%3B+filename%3DEstimation_Of_Distance_to_Texture_Surfac.pdf&Expires=1764668791&Signature=HuHi4o78VYI164-U6Swdr~e5-p6cYWI92CSjmgVeRncJDw8ozK8aHhi5gpCo2sgdVRTsUqMdDArIQmvy2QnPDWsKKriFM7lR4TDt056Sb7~ZCP3hv-YDwZFxT~0nC8fjSOGZhkoVx6NJe0HYeuh87m5VSwtOSb0i0nlrx3N72n4CtoiUXFkKo1Wr4kDaYvi4H~CnwlRZRxHbLKY82fPcIKwAGX9M0oKH76LmuhHw~h1ZEoh2~ntoH6PR9-nRv3dfJu0jIxPNip-q6BZsceOBE0Ksyl4FPjw9tPL4NsIA2kJRv2rA-ecSM2TxHN1xzF19uHoe0newY30eGu~QlT8kBQ__&Key-Pair-Id=APKAJLOHF5GGSLRBV4ZA
- Megalingam, R. K., Shriram, V., Likhith, B., Rajesh, G., Ghanta, S. (2016). Monocular distance estimation using pinhole camera approximation to avoid vehicle crash and back-over accidents. 2016 10th International Conference on Intelligent Systems and Control (ISCO). https://doi.org/10.1109/isco.2016.7727017
- Tram, V. T. B., Yoo, M. (2018). Vehicle-to-Vehicle Distance Estimation Using a Low-Resolution Camera Based on Visible Light Communications. IEEE Access, 6, 4521–4527. https://doi.org/10.1109/access.2018.2793306
- Qi, S. H., Li, J., Sun, Z. P., Zhang, J. T., Sun, Y. (2019). Distance Estimation of Monocular Based on Vehicle Pose Information. Journal of Physics: Conference Series, 1168, 032040. https://doi.org/10.1088/1742-6596/1168/3/032040
- Liu, J., Zhang, R., Hou, S. (2020). Inter-vehicle distance estimation considering camera attitude angles based on monocular vision. Proceedings of the Institution of Mechanical Engineers, Part D: Journal of Automobile Engineering, 235 (2-3), 894–900. https://doi.org/10.1177/0954407020941399
- Zhu, J., Fang, Y. (2019). Learning Object-Specific Distance From a Monocular Image. 2019 IEEE/CVF International Conference on Computer Vision (ICCV), 3838–3847. https://doi.org/10.1109/iccv.2019.00394
- Zhang, Y., Ding, L., Li, Y., Lin, W., Zhao, M., Yu, X., Zhan, Y. (2021). A regional distance regression network for monocular object distance estimation. Journal of Visual Communication and Image Representation, 79, 103224. https://doi.org/10.1016/j.jvcir.2021.103224
- Vajgl, M., Hurtik, P., Nejezchleba, T. (2022). Dist-YOLO: Fast Object Detection with Distance Estimation. Applied Sciences, 12 (3), 1354. https://doi.org/10.3390/app12031354
- Ahishali, M., Yamac, M., Kiranyaz, S., Gabbouj, M. (2023). Representation based regression for object distance estimation. Neural Networks, 158, 15–29. https://doi.org/10.1016/j.neunet.2022.11.011
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2025 Herdianto Herdianto, Poltak Sihombing, Fahmi Fahmi, Tulus Tulus

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.
Ліцензійний договір – це документ, в якому автор гарантує, що володіє усіма авторськими правами на твір (рукопис, статтю, тощо).
Автори, підписуючи Ліцензійний договір з ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР», мають усі права на подальше використання свого твору за умови посилання на наше видання, в якому твір опублікований. Відповідно до умов Ліцензійного договору, Видавець ПП «ТЕХНОЛОГІЧНИЙ ЦЕНТР» не забирає ваші авторські права та отримує від авторів дозвіл на використання та розповсюдження публікації через світові наукові ресурси (власні електронні ресурси, наукометричні бази даних, репозитарії, бібліотеки тощо).
За відсутності підписаного Ліцензійного договору або за відсутністю вказаних в цьому договорі ідентифікаторів, що дають змогу ідентифікувати особу автора, редакція не має права працювати з рукописом.
Важливо пам’ятати, що існує і інший тип угоди між авторами та видавцями – коли авторські права передаються від авторів до видавця. В такому разі автори втрачають права власності на свій твір та не можуть його використовувати в будь-який спосіб.






