Розробка методу адаптивного керування простежуваністю даних для ресурсно-орієнтованої потокової обробки в режимі реального часу

Автор(и)

  • Роман Орестович Моравський Національний Університет «Львівська Політехніка», Україна https://orcid.org/0000-0002-6695-1920
  • Євгенія Василівна Левус Національний Університет «Львівська Політехніка», Україна https://orcid.org/0000-0001-5109-7533

DOI:

https://doi.org/10.15587/2706-5448.2026.362294

Ключові слова:

потокова обробка даних, простежуваність даних, Apache Flink, розподілені системи

Анотація

Об’єктом дослідження є процес управління простежуваністю у системах потокової обробки даних в режимі реального часу. Предметом дослідження є адаптивний метод простежуваності з урахуванням ресурсів, який змінює її детальність під час виконання без впливу на результати обробки.

У цій роботі вирішувалася проблема перевантаження системних ресурсів під час збору детальної простежуваності. Запропоновано метод адаптивного відстеження походження даних у режимі реального часу. Його особливість полягає у динамічному виборі рівня деталізації простежуваності на основі показників процесора та пам'яті купи.

Метод оцінювався на 5000 змодельованих IoT-датчиках із 60-секундним вікном обробки. Експерименти відбувалися при цільовій частоті 15000 записів на секунду у 3-, 15- та 30-хвилинних запусках. Отримані результати показують, що цей метод тримає пропускну здатність близькою до базових запусків, водночас суттєво знижуючи навантаження на використання процесора порівняно з повною простежуваністю. За однакових навантажень адаптивні запуски споживають приблизно у 34 рази більше ресурсів процесора, ніж базові запуски. У той самий час повна простежуваність потребує близько 69 разів більше, оскільки контролер знижує рівень під тиском і повертає детальний режим лише після відновлення ресурсів. Пам'ять купи є слабшим показником, оскільки відображає лише частину пам'яті та може змінюватися під час її періодичного очищення.

Запропонований метод найбільш корисний під час аномалій, інцидентів або аудитів, де потрібна вибіркова простежуваність даних. Така адаптивність робить його доцільним для IoT-шлюзів, граничних пристроїв та регульованих галузей, що працюють в умовах жорстких ресурсних обмежень.

Біографії авторів

Роман Орестович Моравський, Національний Університет «Львівська Політехніка»

Аспірант, асистент

Кафедра програмного забезпечення

Євгенія Василівна Левус, Національний Університет «Львівська Політехніка»

Кандидат технічних наук, доцент

Кафедра програмного забезпечення

Посилання

  1. Herschel, M., Diestelkämper, R., Ben Lahmar, H. (2017). A survey on provenance: What for? What form? What from? The VLDB Journal, 26 (6), 881–906. https://doi.org/10.1007/s00778-017-0486-1
  2. Bashtovyi, A., Fechan, A. (2025). Development of a standardized approach for evaluating business insights in stream processing systems based on technical metrics. Technology Audit and Production Reserves, 2 (2 (82)), 15–20. https://doi.org/10.15587/2706-5448.2025.325717
  3. Palyvos-Giannas, D., Gulisano, V., Papatriantafilou, M. (2018). GeneaLog: Fine-Grained Data Streaming Provenance at the Edge. Proceedings of the 19th International Middleware Conference, 227–238. https://doi.org/10.1145/3274808.3274826
  4. Palyvos-Giannas, D., Havers, B., Papatriantafilou, M., Gulisano, V. (2020). Ananke: a streaming framework for live forward provenance. Proceedings of the VLDB Endowment, 14 (3), 391–403. https://doi.org/10.14778/3430915.3430928
  5. Gordani Shahri, M., Erlandsson, A., Palyvos-Giannas, D., Gulisano, V. (2021). Poster: Twins, a Middleware for Adaptive Streaming Provenance at the Edge. Proceedings of the 22nd International Conference on Distributed Computing and Networking. New York, 235–236. https://doi.org/10.1145/3427796.3433931
  6. Wang, L., Shen, X., Li, W., LI, Z., Sekar, R., Liu, H., Chen, Y. (2025). Incorporating Gradients to Rules: Towards Lightweight, Adaptive Provenance-based Intrusion Detection. Proceedings 2025 Network and Distributed System Security Symposium. https://doi.org/10.14722/ndss.2025.230822
  7. Fernando, L., Kim, T., Daudjee, K., Rabl, T. (2025). Enjima: A Resource-Adaptive Stream Processing System. Proceedings of the ACM on Management of Data, 3 (6), 1–27. https://doi.org/10.1145/3769790
  8. Moravskyi, R., Levus, Y. (2024). Analysis of Real-time Processing Approaches for Large Data Volumes in Metering Infrastructure. Journal of Lviv Polytechnic National University: Information Systems and Networks, 15, 169–183. https://doi.org/10.23939/sisn2024.15.169
  9. Mohamed, Z. (2023). Data streaming provenance in advanced metering infrastructures. [Master’s thesis; Chalmers University of Technology]. Available at: https://hdl.handle.net/2077/79292
  10. Taube, J., Johnsson, W. (2022). Streaming analytics with provenance in the advanced metering infrastructure. [Master’s thesis; Chalmers University of Technology]. Available at: https://odr.chalmers.se/handle/20.500.12380/305852
  11. Ye, Q., Lu, M. (2021). s2p: Provenance Research for Stream Processing System. Applied Sciences, 11 (12), 5523. https://doi.org/10.3390/app11125523
  12. Räth, T., Schlegel, M., Sattler, K.-U. (2024). Everything Everyway All at Once – Time Traveling Debugging for Stream Processing Applications. 2024 IEEE 40th International Conference on Data Engineering (ICDE), 1606–1618. https://doi.org/10.1109/icde60146.2024.00131
  13. Goyal, A., Liu, J., Bates, A., Wang, G. (2024). ORCHID: Streaming threat detection over versioned provenance graphs. arXiv:2408.13347v1. https://doi.org/10.48550/arXiv.2408.13347
Development of an adaptive data provenance control method for resource-aware real-time stream processing

##submission.downloads##

Опубліковано

2026-05-29

Як цитувати

Моравський, Р. О., & Левус, Є. В. (2026). Розробка методу адаптивного керування простежуваністю даних для ресурсно-орієнтованої потокової обробки в режимі реального часу. Technology Audit and Production Reserves, 3(2(89), 60–65. https://doi.org/10.15587/2706-5448.2026.362294

Номер

Розділ

Інформаційні технології