Прогнозування успішності B2B-замовлень в умовах нестабільності: оцінка стійкості архітектур машинного навчання до концептуального дрейфу
DOI:
https://doi.org/10.31498/2225-6733.53.2.2026.359931Ключові слова:
машинне навчання, прогнозування успішності, потокове навчання, концептуальний дрейф, ансамблі дерев рішень, преквенційна симуляція, ERP-системи, обробка часових ознакАнотація
Прогнозування успішності B2B-замовлень є критичним завданням у системах планування ресурсів підприємства (ERP). Традиційні моделі пакетного навчання демонструють стійку вразливість до концептуального дрейфу, спричиненого макроекономічними збуреннями або зміною поведінкових патернів контрагентів. У статті порівнюється прогностична ефективність алгоритмів статичного пакетного та потокового навчання на масиві з 86 786 B2B-транзакцій реальної промислової ERP-системи. Бенчмаркінг охопив 15 алгоритмів: оптимізовані ансамблі дерев (XGBoost, LightGBM, Random Forest), лінійні та імовірнісні моделі, а також інкрементальні потокові архітектури, зокрема Adaptive Random Forest з екосистеми River. Оцінювання проводилось у двох режимах: глобальне тестування на стаціонарних вибірках та преквенційна симуляція для відтворення структурних зсувів у даних. Окремо досліджено вплив порядкового та циклічного кодування часових ознак. Встановлено, що циклічне кодування систематично знижує роздільну здатність алгоритмів на базі дерев рішень через ускладнення ортогональних розбиттів; порядкове кодування є оптимальним для таких архітектур. За стаціонарних умов пакетні моделі демонструють вищу глобальну точність (XGBoost, ROC-AUC = 0,9039). Однак під час симуляції макроекономічних збурень дискретність перенавчання знижує Recall пакетної моделі до ~60%, а частку хибних класифікацій підвищує до 35–36%. Потокова модель River ARF_Prequential завдяки потранзакційній адаптації утримує частку помилок у межах 14–17% та Recall > 0,95. Результати підтверджують наявність компромісу між точністю пакетних і реактивністю потокових моделей, що обґрунтовує розробку гібридних прогностичних архітектур для промислових ERP
Посилання
- Yang Y., Wang H. Random Forest-Based Machine Failure Prediction: A Performance Comparison. Applied Sciences. 2025. Vol. 15, no. 16. Article 8841. DOI: https://doi.org/10.3390/app15168841.
- Abd El-Aziz R. A., Hassan A. S. Machine learning-driven optimization of enterprise resource planning (ERP) systems: a comprehensive review. Beni-Suef University Journal of Basic and Applied Sciences. 2024. Vol. 13, no. 1. DOI: https://doi.org/10.1186/s43088-023-00460-y.
- Machine Learning and Deep Learning Models for Demand Forecasting in Supply Chain Management: A Critical Review / K. Douaioui et al. Applied System Innovation. 2024. Vol. 7, no. 5. Article 93. DOI: https://doi.org/10.3390/asi7050093.
- Kraus A., van der Aa H. Machine learning-based detection of concept drift in business processes. Process Science. 2025. Vol. 2, no. 1. DOI: https://doi.org/10.1007/s44311-025-00012-w.
- Suárez-Cetrulo A. L., Quintana D., Cervantes A. A survey on machine learning for recurring concept drifting data streams. Expert Systems with Applications. 2022. Volume 213, Part A. Article 118934. DOI: https://doi.org/10.1016/j.eswa.2022.118934.
- Domingos P., Hulten G. Mining high-speed data streams. Knowledge discovery and data mining: Proceedings of the sixth ACM SIGKDD international conference, Boston, Massachusetts, United States, 20–23 August 2000. Pp. 71-80. DOI: https://doi.org/10.1145/347090.34710.
- Adaptive random forests for evolving data stream classification / H. M. Gomes et al. Machine Learning. 2017. Vol. 106, no. 9-10. Pp. 1469–1495. DOI: https://doi.org/10.1007/s10994-017-5642-8.
- River: machine learning for streaming data in Python / J. Montiel et al. Journal of Machine Learning Research. 2021. Vol. 22, no. 110. Pp. 1–8.
- S. B. Jadhav, D. V. Kodavade, V. D. Kulkarni. Data Stream Learning Evaluation: Experimenting with Prequential Approach Over Real Data Streams. Journal of Information Systems Engineering and Management. 2025. Vol. 10, no. 9s. Pp. 230–237. DOI: https://doi.org/10.52783/jisem.v10i9s.1206.
- Machine learning for streaming data / H. M. Gomes et al. ACM SIGKDD Explorations Newsletter. 2019. Vol. 21, no. 2. Pp. 6–22. DOI: https://doi.org/10.1145/3373464.3373470.
- Review of automated time series forecasting pipelines / S. Meisenbacher et al. WIREs Data Mining and Knowledge Discovery. 2022. Vol. 12, no. 6, p. e1475. DOI: https://doi.org/10.1002/widm.1475.
- Lewinson E. Three Approaches to Encoding Time Information as Features for ML Models. NVIDIA Technical Blog. 2022. URL: https://developer.nvidia.com/blog/three-approaches-to-encoding-time-information-as-features-for-ml-models/ (дата звернення: 20.02.2026).
- Chakraborty D., Elzarka H. Advanced machine learning techniques for building performance simulation: a comparative analysis. Journal of Building Performance Simulation. 2019. Vol. 12, No. 2. Pp. 193–207. DOI: https://doi.org/10.1080/19401493.2018.1498538.
- Mahajan T., Singh G., Bruns G. An Experimental Assessment of Treatments for Cyclical Data. Computer Science Conference for CSU Undergraduates, California State University Northridge, 2021. Pp. 1-5.
- Bansal A., Balaji K., Lalani Z. Temporal Encoding Strategies for Energy Time Series Prediction. arXiv:2503.15456. 2020. Preprint. DOI: https://doi.org/10.48550/arXiv.2503.15456.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Журнал "Вісник Приазовського державного технічного університету. Серія: Технічні науки" видається під ліцензією СС-BY (Ліцензія «Із зазначенням авторства»).
Дана ліцензія дозволяє поширювати, редагувати, поправляти і брати твір за основу для похідних навіть на комерційній основі із зазначенням авторства. Це найзручніша з усіх пропонованих ліцензій. Рекомендується для максимального поширення і використання неліцензійних матеріалів.
Автори, які публікуються в цьому журналі, погоджуються з наступними умовами:
1. Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, яка дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи в цьому журналі.
2. Автори мають право укладати самостійні додаткові угоди, які стосуються неексклюзивного поширення роботи в тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи в цьому журналі.






