Переваги наскрізної архітектури Hybrid AWRED за ефективністю виявлення візуальних аномалій в умовах дефіциту навчальних даних порівняно з класичним ансамблем CNN + One-Class SVM
DOI:
https://doi.org/10.15587/2706-5448.2026.362237Ключові слова:
наскрізна архітектура, Hybrid AWRED, One-Class SVM, динамічне зважування, дисбаланс класів, візуальний контрольАнотація
Об’єктом дослідження є процес виявлення візуальних аномалій у зображеннях в умовах скорочення навчальної вибірки та дисбалансу класів, актуальний для систем візуального моніторингу ІТ-інфраструктури й телекомунікаційного обладнання, зокрема розпізнавання мікротріщин на друкованих платах, корозії на антенах базових станцій чи пошкоджень волоконно-оптичних ліній зв'язку. Проблема полягає в тому, що за малого обсягу навчальних даних традиційні двохетапні підходи втрачають стійкість і це призводить до зниження точності розпізнавання дефектів. Це стосується схем, у яких згортковий автокодувальник поєднується із зовнішнім класифікатором, One-Class SVM. За таких умов латентне подання формується менш якісно, а ранжування аномалій стає менш надійним.
Як альтернативу використано наскрізну архітектуру Hybrid AWRED v4, у якій виявлення аномалій виконується безпосередньо у просторі похибок реконструкції без зовнішнього класифікатора. В основу підходу покладено цільову функцію, яка поєднує динамічне зважування похибки та адаптивний поріг відсікання.
Перевірку проведено на трьох наборах даних обсягом 800, 107 і 54 зображення. Для кожного набору виконано по вісім незалежних прогонів. На вибірці N = 800 архітектура CNN + AWRED показала кращі значення Precision, F1-Score та MCC порівняно з ансамблем CNN + SVM. За N = 107 перевага запропонованого підходу проявилася за AUC-ROC і AP.
Для мікровибірки N = 54 порогові метрики двох підходів виявилися близькими. Водночас AUC-ROC і AP залишилися вищими у базової моделі. Це свідчить, що за такого обсягу даних обидва підходи наближаються до межі своєї ефективності без додаткового розширення вибірки. Також встановлено, що Hybrid AWRED раніше досягає критерію ранньої зупинки, а її теплові карти формують чіткіші зони відгуку в областях дефектів. Підхід є перспективним для автоматизації візуального контролю за дефіциту навчальних даних.
Посилання
- Cao, Y., Xiang, H., Zhang, H., Zhu, Y., Ting, K. M. (2025). Anomaly Detection Based on Isolation Mechanisms: A Survey. Machine Intelligence Research, 22 (5), 849–865. https://doi.org/10.1007/s11633-025-1554-4
- Tao, X., Gong, X., Zhang, X., Yan, S., Adak, C. (2022). Deep Learning for Unsupervised Anomaly Localization in Industrial Images: A Survey. IEEE Transactions on Instrumentation and Measurement, 71, 1–21. https://doi.org/10.1109/tim.2022.3196436
- Mehta, D., Klarmann, N. (2023). Autoencoder-Based Visual Anomaly Localization for Manufacturing Quality Control. Machine Learning and Knowledge Extraction, 6 (1), 1–17. https://doi.org/10.3390/make6010001
- Paolini, D., Dini, P., Soldaini, E., Saponara, S. (2025). One-Class Anomaly Detection for Industrial Applications: A Comparative Survey and Experimental Study. Computers, 14 (7), 281. https://doi.org/10.3390/computers14070281
- Saeedi, J., Giusti, A. (2022). Anomaly Detection for Industrial Inspection using Convolutional Autoencoder and Deep Feature-based One-class Classification. Proceedings of the 17th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications, 85–96. https://doi.org/10.5220/0010780200003124
- Yang, M., Liu, J., Yang, Z., Wu, Z. (2024). SLSG: Industrial image anomaly detection with improved feature embeddings and one-class classification. Pattern Recognition, 156, 110862. https://doi.org/10.1016/j.patcog.2024.110862
- Liu, J., Xie, G., Wang, J., Li, S., Wang, C., Zheng, F., Jin, Y. (2024). Deep Industrial Image Anomaly Detection: A Survey. Machine Intelligence Research, 21 (1), 104–135. https://doi.org/10.1007/s11633-023-1459-z
- Li, Z., Yan, Y., Wang, X., Ge, Y., Meng, L. (2025). A survey of deep learning for industrial visual anomaly detection. Artificial Intelligence Review, 58 (9). https://doi.org/10.1007/s10462-025-11287-7
- Wang, X., Chen, Y., Zhu, W. (2021). A Survey on Curriculum Learning. IEEE Transactions on Pattern Analysis and Machine Intelligence, 44 (9). https://doi.org/10.1109/tpami.2021.3069908
- Dovzhenko, T. (2026). Hybrid awred: synergy of adaptive reconstruction and topological clustering for anomaly detection in multimodal data. Zviazok, 1, 80–88. https://doi.org/10.31673/2412-9070.2026.017405
- Dovzhenko, T. P., Zinchenko, O. V. (2026). Robustness of Deep Intrusion Detection Models Under Massive Cyberattacks: Stress-Testing and Architectural Features of Hybrid AWRED. Telecommunication and Information Technologies, 90 (1), 199–207. https://doi.org/10.31673/2412-4338.2026.019019
- Dovzhenko, T. (2026). Topological anchoring and adaptive penalties: the HYBRID AWRED architecture for defect recognition in contaminated visual data. Connectivity, 180 (2), 62–71. https://doi.org/10.31673/2412-9070.2026.027603
- Saha, B. (2022). Caltech-101 dataset. Available at: https://www.kaggle.com/datasets/imbikramsaha/caltech-101
- Belhadri, A., Benchennane, I. (2025). Optimizing deep learning models: A review. Multiagent and Grid Systems, 21 (2), 73–95. https://doi.org/10.1177/15741702251370052
- Wang, X., Jin, Y., Schmitt, S., Olhofer, M. (2023). Recent Advances in Bayesian Optimization. ACM Computing Surveys, 55 (13s), 1–36. https://doi.org/10.1145/3582078
- Chicco, D., Jurman, G. (2023). The Matthews correlation coefficient (MCC) should replace the ROC AUC as the standard metric for assessing binary classification. BioData Mining, 16 (1). https://doi.org/10.1186/s13040-023-00322-4
- Jung, S., Dagobert, T., Morel, J.-M., Facciolo, G. (2024). A Review of t-SNE. Image Processing on Line, 14, 250–270. https://doi.org/10.5201/ipol.2024.528
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2026 Tymur Dovzhenko, Kamila Storchak

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.




