Розробка методу онтологічно опосередкованого семантичного контролю для підвищення надійності інфраструктури як коду, згенерованої великими мовними моделями

Автор(и)

  • Ігор Євгенович Бібічков Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0003-1424-6960
  • Олена Леонідівна Шевченко Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0003-3177-5530
  • Олександр Юрійович Шевченко Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0002-0068-4698
  • Олександр Сергійович Стьопін Харківський національний університет радіоелектроніки, Україна https://orcid.org/0009-0002-3074-3772

DOI:

https://doi.org/10.15587/2706-5448.2026.365453

Ключові слова:

Семантична Інфраструктура як Код, граф інфраструктури, семантичний контроль, SHACL/SPARQL-валідація, повнота залежностей

Анотація

Об’єктом дослідження є процес генерації Infrastructure-as-Code (IaC) для хмарного розгортання за підтримки великих мовних моделей. Проблема полягає в тому, що великі мовні моделі можуть перетворювати запити користувача на синтаксично коректний IaC, але такий згенерований IaC не забезпечує успішного розгортання. Це пов’язано з тим, що такі артефакти часто не містять необхідних хмарних зв’язків або порушують обмеження політик, неточно інтерпретують наміри користувача чи не мають логіки відкату. У зв’язку з цим дане дослідження пропонує конвеєр Semantic Infrastructure-as-Code (SIaC), у якому замість фінального IaC велика мовна модель спочатку генерує кандидатний граф інфраструктури. Далі цей граф доповнюється та перевіряється за допомогою онтологічного логічного виведення, SHACL/SPARQL-валідації та інших формальних процедур перед генерацією фінального backend-артефакту. За результатами 60 сценаріїв, орієнтованих на AWS ECS/Fargate і протестованих у LocalStack-based середовищі емуляції AWS, Full SIaC досяг 74,4% успішних розгортань у sandbox-середовищі порівняно з 43,6% для direct LLM-to-IaC і 59,0% для LLM+RAG-to-IaC. Порівняно з базовими методами, SIaC покращив покриття семантичного наміру, повноту залежностей і відповідність політикам. Він також зменшив кількість некоректних залежностей і потребу в ручних виправленнях. Це пояснюється тим, що надійність перевіряється через придатний для аналізу граф знань, а не лише через промпти та згенерований текст. Такий граф допомагає виявляти й виправляти залежності, розміщення ресурсів, політики та питання безпеки ще до розгортання. Окрім вищого рівня успішності розгортання, SIaC також забезпечує більш контрольований і керований шлях перетворення від наміру, сформульованого природною мовою, до виконуваної інфраструктури.

Цей метод є придатним у випадках, коли вимоги користувача можна відобразити на актуальні онтології провайдера, а додатковий час, витрачений на аналіз, вважається прийнятною платою за підвищення надійності, придатності до аудиту та зменшення витрат на супровід.

Біографії авторів

Ігор Євгенович Бібічков, Харківський національний університет радіоелектроніки

Старший викладач

Кафедра штучного інтелекту

Олена Леонідівна Шевченко, Харківський національний університет радіоелектроніки

Кандидат технічних наук, доцент

Кафедра програмної інженерії

Олександр Юрійович Шевченко, Харківський національний університет радіоелектроніки

Кандидат технічних наук, професор

Кафедра штучного інтелекту

Олександр Сергійович Стьопін, Харківський національний університет радіоелектроніки

Старший викладач

Кафедра штучного інтелекту

Посилання

  1. Terraform language documentation. HashiCorp Developer. Available at: https://developer.hashicorp.com/terraform/language
  2. Getting started. OpenTofu. Available at: https://opentofu.org/docs/intro/
  3. Zhang, T., Pan, S., Zhang, Z., Xing, Z., Sun, X. (2025). Deployability-Centric Infrastructure-as-Code Generation: Fail, Learn, Refine, and Succeed through LLM-Empowered DevOps Simulation. arXiv:2506.05623. https://doi.org/10.48550/arXiv.2506.05623
  4. Davidson, S., Sun, L., Bhasker, B., Callot, L., Deoras, A. (2025). Multi-IaC-Eval: Benchmarking Cloud Infrastructure as Code Across Multiple Formats. arXiv:2509.05303. https://doi.org/10.48550/arXiv.2509.05303
  5. Dependency graph. Terraform Internals. HashiCorp Developer. Available at: https://developer.hashicorp.com/terraform/internals/graph
  6. Shevchenko, A. Yu., Shevchenko, E. L. (2012). How to bring artificial intelligence into the clouds. Eastern-European Journal of Enterprise Technologies, 3 (12 (51)), 66–70. Available at: https://journals.uran.ua/eejet/article/view/2472
  7. Topology and Orchestration Specification for Cloud Applications (TOSCA) Version 2.0. (2025). OASIS Standard. Available at: https://docs.oasis-open.org/tosca/TOSCA/v2.0/TOSCA-v2.0.html
  8. Vasileiou, Z., Kumara, I., Meditskos, G., Tokmakov, K., Radolović, D., Cruz, J. G. et al. (2025). A knowledge-based approach for guided development of Infrastructure as Code. Software and Systems Modeling, 25 (2), 515–548. https://doi.org/10.1007/s10270-025-01294-1
  9. Bibichkov, I., Sokol, V., Shevchenko, O. (2017). Ontological knowledge bases productivity optimization through the use of reasoner combination. Eastern-European Journal of Enterprise Technologies, 5 (2 (89)), 49–54. https://doi.org/10.15587/1729-4061.2017.112347
  10. Kon, P., Liu, J., Qiu, Y., Fan, W., He, T., Lin, L. et al. (2024). IaC-Eval: A Code Generation Benchmark for Cloud Infrastructure-as-Code Programs. Advances in Neural Information Processing Systems 37, 134488–134506. https://doi.org/10.52202/079017-4273
  11. Khan, R. N. H., Wasif, D., Cho, J.-H., Butt, A. (2025). Multi-agent code-orchestrated generation for reliable Infrastructure-as-Code. arXiv:2510.03902v1. https://doi.org/10.48550/arXiv.2510.03902
  12. Qiu, Y., Kon, P. T. J., Beckett, R., Chen, A. (2024). Unearthing Semantic Checks for Cloud Infrastructure-as-Code Programs. Proceedings of the ACM SIGOPS 30th Symposium on Operating Systems Principles, 574–589. https://doi.org/10.1145/3694715.3695974
  13. Open Policy Agent documentation. Open Policy Agent. Available at: https://www.openpolicyagent.org/docs
  14. What is AWS CloudFormation Guard? Amazon Web Services. Available at: https://docs.aws.amazon.com/cfn-guard/latest/ug/what-is-guard.html
  15. Shevchenko, O. L. (2013). Semantic annotations similarity measure to compare processes profiles. Eastern-European Journal of Enterprise Technologies, 3 (2 (63)), 48–52. https://doi.org/10.15587/1729-4061.2013.14445
  16. SIaC Supplementary Artifacts. GitHub. Available at: https://github.com/shevchenko-oleksandr/SIaC
  17. Nekrasov, R., Fossati, S., Kumara, I., Tamburri, D. A., van den Heuvel, W.-J. (2026). IaC Generation with LLMs: An Error Taxonomy and A Study on Configuration Knowledge Injection. ACM Transactions on Software Engineering and Methodology. https://doi.org/10.1145/3817608
  18. Fliahin, V., Turuta, O., Turuta, O. (2025). Approaching LLM alignment using agents with RAG. Proceedings of the 5th International Workshop of IT-professionals on Artificial Intelligence (ProfIT AI 2025). CEUR Workshop Proceedings, 4164, 207–215. Available at: https://ceur-ws.org/Vol-4164/short6.pdf
  19. COST (European Cooperation in Science and Technology). Available at: https://www.cost.eu
Developing an ontology-mediated semantic control method for improving the reliability of LLM-generated Infrastructure-as-Code

##submission.downloads##

Опубліковано

2026-06-25

Як цитувати

Бібічков, І. Є., Шевченко, О. Л., Шевченко, О. Ю., & Стьопін, О. С. (2026). Розробка методу онтологічно опосередкованого семантичного контролю для підвищення надійності інфраструктури як коду, згенерованої великими мовними моделями. Technology Audit and Production Reserves, 3(2(89), 121–133. https://doi.org/10.15587/2706-5448.2026.365453

Номер

Розділ

Системи та процеси керування