Прогнозування успішності B2B-замовлень в умовах нестабільності: оцінка стійкості архітектур машинного навчання до концептуального дрейфу

Автор(и)

DOI:

https://doi.org/10.31498/2225-6733.53.2.2026.359931

Ключові слова:

машинне навчання, прогнозування успішності, потокове навчання, концептуальний дрейф, ансамблі дерев рішень, преквенційна симуляція, ERP-системи, обробка часових ознак

Анотація

Прогнозування успішності B2B-замовлень є критичним завданням у системах планування ресурсів підприємства (ERP). Традиційні моделі пакетного навчання демонструють стійку вразливість до концептуального дрейфу, спричиненого макроекономічними збуреннями або зміною поведінкових патернів контрагентів. У статті порівнюється прогностична ефективність алгоритмів статичного пакетного та потокового навчання на масиві з 86 786 B2B-транзакцій реальної промислової ERP-системи. Бенчмаркінг охопив 15 алгоритмів: оптимізовані ансамблі дерев (XGBoost, LightGBM, Random Forest), лінійні та імовірнісні моделі, а також інкрементальні потокові архітектури, зокрема Adaptive Random Forest з екосистеми River. Оцінювання проводилось у двох режимах: глобальне тестування на стаціонарних вибірках та преквенційна симуляція для відтворення структурних зсувів у даних. Окремо досліджено вплив порядкового та циклічного кодування часових ознак. Встановлено, що циклічне кодування систематично знижує роздільну здатність алгоритмів на базі дерев рішень через ускладнення ортогональних розбиттів; порядкове кодування є оптимальним для таких архітектур. За стаціонарних умов пакетні моделі демонструють вищу глобальну точність (XGBoost, ROC-AUC = 0,9039). Однак під час симуляції макроекономічних збурень дискретність перенавчання знижує Recall пакетної моделі до ~60%, а частку хибних класифікацій підвищує до 35–36%. Потокова модель River ARF_Prequential завдяки потранзакційній адаптації утримує частку помилок у межах 14–17% та Recall > 0,95. Результати підтверджують наявність компромісу між точністю пакетних і реактивністю потокових моделей, що обґрунтовує розробку гібридних прогностичних архітектур для промислових ERP

Посилання

  1. Yang Y., Wang H. Random Forest-Based Machine Failure Prediction: A Performance Comparison. Applied Sciences. 2025. Vol. 15, no. 16. Article 8841. DOI: https://doi.org/10.3390/app15168841.
  2. Abd El-Aziz R. A., Hassan A. S. Machine learning-driven optimization of enterprise resource planning (ERP) systems: a comprehensive review. Beni-Suef University Journal of Basic and Applied Sciences. 2024. Vol. 13, no. 1. DOI: https://doi.org/10.1186/s43088-023-00460-y.
  3. Machine Learning and Deep Learning Models for Demand Forecasting in Supply Chain Management: A Critical Review / K. Douaioui et al. Applied System Innovation. 2024. Vol. 7, no. 5. Article 93. DOI: https://doi.org/10.3390/asi7050093.
  4. Kraus A., van der Aa H. Machine learning-based detection of concept drift in business processes. Process Science. 2025. Vol. 2, no. 1. DOI: https://doi.org/10.1007/s44311-025-00012-w.
  5. Suárez-Cetrulo A. L., Quintana D., Cervantes A. A survey on machine learning for recurring concept drifting data streams. Expert Systems with Applications. 2022. Volume 213, Part A. Article 118934. DOI: https://doi.org/10.1016/j.eswa.2022.118934.
  6. Domingos P., Hulten G. Mining high-speed data streams. Knowledge discovery and data mining: Proceedings of the sixth ACM SIGKDD international conference, Boston, Massachusetts, United States, 20–23 August 2000. Pp. 71-80. DOI: https://doi.org/10.1145/347090.34710.
  7. Adaptive random forests for evolving data stream classification / H. M. Gomes et al. Machine Learning. 2017. Vol. 106, no. 9-10. Pp. 1469–1495. DOI: https://doi.org/10.1007/s10994-017-5642-8.
  8. River: machine learning for streaming data in Python / J. Montiel et al. Journal of Machine Learning Research. 2021. Vol. 22, no. 110. Pp. 1–8.
  9. S. B. Jadhav, D. V. Kodavade, V. D. Kulkarni. Data Stream Learning Evaluation: Experimenting with Prequential Approach Over Real Data Streams. Journal of Information Systems Engineering and Management. 2025. Vol. 10, no. 9s. Pp. 230–237. DOI: https://doi.org/10.52783/jisem.v10i9s.1206.
  10. Machine learning for streaming data / H. M. Gomes et al. ACM SIGKDD Explorations Newsletter. 2019. Vol. 21, no. 2. Pp. 6–22. DOI: https://doi.org/10.1145/3373464.3373470.
  11. Review of automated time series forecasting pipelines / S. Meisenbacher et al. WIREs Data Mining and Knowledge Discovery. 2022. Vol. 12, no. 6, p. e1475. DOI: https://doi.org/10.1002/widm.1475.
  12. Lewinson E. Three Approaches to Encoding Time Information as Features for ML Models. NVIDIA Technical Blog. 2022. URL: https://developer.nvidia.com/blog/three-approaches-to-encoding-time-information-as-features-for-ml-models/ (дата звернення: 20.02.2026).
  13. Chakraborty D., Elzarka H. Advanced machine learning techniques for building performance simulation: a comparative analysis. Journal of Building Performance Simulation. 2019. Vol. 12, No. 2. Pp. 193–207. DOI: https://doi.org/10.1080/19401493.2018.1498538.
  14. Mahajan T., Singh G., Bruns G. An Experimental Assessment of Treatments for Cyclical Data. Computer Science Conference for CSU Undergraduates, California State University Northridge, 2021. Pp. 1-5.
  15. Bansal A., Balaji K., Lalani Z. Temporal Encoding Strategies for Energy Time Series Prediction. arXiv:2503.15456. 2020. Preprint. DOI: https://doi.org/10.48550/arXiv.2503.15456.

##submission.downloads##

Опубліковано

2026-03-26

Як цитувати

Мірошниченко , С. (2026). Прогнозування успішності B2B-замовлень в умовах нестабільності: оцінка стійкості архітектур машинного навчання до концептуального дрейфу. Вісник Приазовського Державного Технічного Університету. Серія: Технічні науки, 2(53), 75–85. https://doi.org/10.31498/2225-6733.53.2.2026.359931

Номер

Розділ

151 Автоматизація та комп’ютерно-інтегровані технології