Developing an ontology-mediated semantic control method for improving the reliability of LLM-generated Infrastructure-as-Code

Ігор Євгенович Бібічков; Олена Леонідівна Шевченко; Олександр Юрійович Шевченко; Олександр Сергійович Стьопін

doi:10.15587/2706-5448.2026.365453

Автор(и)

Ігор Євгенович Бібічков Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0003-1424-6960
Олена Леонідівна Шевченко Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0003-3177-5530
Олександр Юрійович Шевченко Харківський національний університет радіоелектроніки, Україна https://orcid.org/0000-0002-0068-4698
Олександр Сергійович Стьопін Харківський національний університет радіоелектроніки, Україна https://orcid.org/0009-0002-3074-3772

DOI:

https://doi.org/10.15587/2706-5448.2026.365453

Ключові слова:

Семантична Інфраструктура як Код, граф інфраструктури, семантичний контроль, SHACL/SPARQL-валідація, повнота залежностей

Анотація

Об’єктом дослідження є процес генерації Infrastructure-as-Code (IaC) для хмарного розгортання за підтримки великих мовних моделей. Проблема полягає в тому, що великі мовні моделі можуть перетворювати запити користувача на синтаксично коректний IaC, але такий згенерований IaC не забезпечує успішного розгортання. Це пов’язано з тим, що такі артефакти часто не містять необхідних хмарних зв’язків або порушують обмеження політик, неточно інтерпретують наміри користувача чи не мають логіки відкату. У зв’язку з цим дане дослідження пропонує конвеєр Semantic Infrastructure-as-Code (SIaC), у якому замість фінального IaC велика мовна модель спочатку генерує кандидатний граф інфраструктури. Далі цей граф доповнюється та перевіряється за допомогою онтологічного логічного виведення, SHACL/SPARQL-валідації та інших формальних процедур перед генерацією фінального backend-артефакту. За результатами 60 сценаріїв, орієнтованих на AWS ECS/Fargate і протестованих у LocalStack-based середовищі емуляції AWS, Full SIaC досяг 74,4% успішних розгортань у sandbox-середовищі порівняно з 43,6% для direct LLM-to-IaC і 59,0% для LLM+RAG-to-IaC. Порівняно з базовими методами, SIaC покращив покриття семантичного наміру, повноту залежностей і відповідність політикам. Він також зменшив кількість некоректних залежностей і потребу в ручних виправленнях. Це пояснюється тим, що надійність перевіряється через придатний для аналізу граф знань, а не лише через промпти та згенерований текст. Такий граф допомагає виявляти й виправляти залежності, розміщення ресурсів, політики та питання безпеки ще до розгортання. Окрім вищого рівня успішності розгортання, SIaC також забезпечує більш контрольований і керований шлях перетворення від наміру, сформульованого природною мовою, до виконуваної інфраструктури.

Цей метод є придатним у випадках, коли вимоги користувача можна відобразити на актуальні онтології провайдера, а додатковий час, витрачений на аналіз, вважається прийнятною платою за підвищення надійності, придатності до аудиту та зменшення витрат на супровід.

Біографії авторів

Ігор Євгенович Бібічков, Харківський національний університет радіоелектроніки

Старший викладач

Кафедра штучного інтелекту

Олена Леонідівна Шевченко, Харківський національний університет радіоелектроніки

Кандидат технічних наук, доцент

Кафедра програмної інженерії

Олександр Юрійович Шевченко, Харківський національний університет радіоелектроніки

Кандидат технічних наук, професор

Кафедра штучного інтелекту

Олександр Сергійович Стьопін, Харківський національний університет радіоелектроніки

Старший викладач

Кафедра штучного інтелекту

Посилання

Terraform language documentation. HashiCorp Developer. Available at: https://developer.hashicorp.com/terraform/language
Getting started. OpenTofu. Available at: https://opentofu.org/docs/intro/
Zhang, T., Pan, S., Zhang, Z., Xing, Z., Sun, X. (2025). Deployability-Centric Infrastructure-as-Code Generation: Fail, Learn, Refine, and Succeed through LLM-Empowered DevOps Simulation. arXiv:2506.05623. https://doi.org/10.48550/arXiv.2506.05623
Davidson, S., Sun, L., Bhasker, B., Callot, L., Deoras, A. (2025). Multi-IaC-Eval: Benchmarking Cloud Infrastructure as Code Across Multiple Formats. arXiv:2509.05303. https://doi.org/10.48550/arXiv.2509.05303
Dependency graph. Terraform Internals. HashiCorp Developer. Available at: https://developer.hashicorp.com/terraform/internals/graph
Shevchenko, A. Yu., Shevchenko, E. L. (2012). How to bring artificial intelligence into the clouds. Eastern-European Journal of Enterprise Technologies, 3 (12 (51)), 66–70. Available at: https://journals.uran.ua/eejet/article/view/2472
Topology and Orchestration Specification for Cloud Applications (TOSCA) Version 2.0. (2025). OASIS Standard. Available at: https://docs.oasis-open.org/tosca/TOSCA/v2.0/TOSCA-v2.0.html
Vasileiou, Z., Kumara, I., Meditskos, G., Tokmakov, K., Radolović, D., Cruz, J. G. et al. (2025). A knowledge-based approach for guided development of Infrastructure as Code. Software and Systems Modeling, 25 (2), 515–548. https://doi.org/10.1007/s10270-025-01294-1
Bibichkov, I., Sokol, V., Shevchenko, O. (2017). Ontological knowledge bases productivity optimization through the use of reasoner combination. Eastern-European Journal of Enterprise Technologies, 5 (2 (89)), 49–54. https://doi.org/10.15587/1729-4061.2017.112347
Kon, P., Liu, J., Qiu, Y., Fan, W., He, T., Lin, L. et al. (2024). IaC-Eval: A Code Generation Benchmark for Cloud Infrastructure-as-Code Programs. Advances in Neural Information Processing Systems 37, 134488–134506. https://doi.org/10.52202/079017-4273
Khan, R. N. H., Wasif, D., Cho, J.-H., Butt, A. (2025). Multi-agent code-orchestrated generation for reliable Infrastructure-as-Code. arXiv:2510.03902v1. https://doi.org/10.48550/arXiv.2510.03902
Qiu, Y., Kon, P. T. J., Beckett, R., Chen, A. (2024). Unearthing Semantic Checks for Cloud Infrastructure-as-Code Programs. Proceedings of the ACM SIGOPS 30th Symposium on Operating Systems Principles, 574–589. https://doi.org/10.1145/3694715.3695974
Open Policy Agent documentation. Open Policy Agent. Available at: https://www.openpolicyagent.org/docs
What is AWS CloudFormation Guard? Amazon Web Services. Available at: https://docs.aws.amazon.com/cfn-guard/latest/ug/what-is-guard.html
Shevchenko, O. L. (2013). Semantic annotations similarity measure to compare processes profiles. Eastern-European Journal of Enterprise Technologies, 3 (2 (63)), 48–52. https://doi.org/10.15587/1729-4061.2013.14445
SIaC Supplementary Artifacts. GitHub. Available at: https://github.com/shevchenko-oleksandr/SIaC
Nekrasov, R., Fossati, S., Kumara, I., Tamburri, D. A., van den Heuvel, W.-J. (2026). IaC Generation with LLMs: An Error Taxonomy and A Study on Configuration Knowledge Injection. ACM Transactions on Software Engineering and Methodology. https://doi.org/10.1145/3817608
Fliahin, V., Turuta, O., Turuta, O. (2025). Approaching LLM alignment using agents with RAG. Proceedings of the 5th International Workshop of IT-professionals on Artificial Intelligence (ProfIT AI 2025). CEUR Workshop Proceedings, 4164, 207–215. Available at: https://ceur-ws.org/Vol-4164/short6.pdf
COST (European Cooperation in Science and Technology). Available at: https://www.cost.eu