Розробка методу онтологічно опосередкованого семантичного контролю для підвищення надійності інфраструктури як коду, згенерованої великими мовними моделями
DOI:
https://doi.org/10.15587/2706-5448.2026.365453Ключові слова:
Семантична Інфраструктура як Код, граф інфраструктури, семантичний контроль, SHACL/SPARQL-валідація, повнота залежностейАнотація
Об’єктом дослідження є процес генерації Infrastructure-as-Code (IaC) для хмарного розгортання за підтримки великих мовних моделей. Проблема полягає в тому, що великі мовні моделі можуть перетворювати запити користувача на синтаксично коректний IaC, але такий згенерований IaC не забезпечує успішного розгортання. Це пов’язано з тим, що такі артефакти часто не містять необхідних хмарних зв’язків або порушують обмеження політик, неточно інтерпретують наміри користувача чи не мають логіки відкату. У зв’язку з цим дане дослідження пропонує конвеєр Semantic Infrastructure-as-Code (SIaC), у якому замість фінального IaC велика мовна модель спочатку генерує кандидатний граф інфраструктури. Далі цей граф доповнюється та перевіряється за допомогою онтологічного логічного виведення, SHACL/SPARQL-валідації та інших формальних процедур перед генерацією фінального backend-артефакту. За результатами 60 сценаріїв, орієнтованих на AWS ECS/Fargate і протестованих у LocalStack-based середовищі емуляції AWS, Full SIaC досяг 74,4% успішних розгортань у sandbox-середовищі порівняно з 43,6% для direct LLM-to-IaC і 59,0% для LLM+RAG-to-IaC. Порівняно з базовими методами, SIaC покращив покриття семантичного наміру, повноту залежностей і відповідність політикам. Він також зменшив кількість некоректних залежностей і потребу в ручних виправленнях. Це пояснюється тим, що надійність перевіряється через придатний для аналізу граф знань, а не лише через промпти та згенерований текст. Такий граф допомагає виявляти й виправляти залежності, розміщення ресурсів, політики та питання безпеки ще до розгортання. Окрім вищого рівня успішності розгортання, SIaC також забезпечує більш контрольований і керований шлях перетворення від наміру, сформульованого природною мовою, до виконуваної інфраструктури.
Цей метод є придатним у випадках, коли вимоги користувача можна відобразити на актуальні онтології провайдера, а додатковий час, витрачений на аналіз, вважається прийнятною платою за підвищення надійності, придатності до аудиту та зменшення витрат на супровід.
Посилання
- Terraform language documentation. HashiCorp Developer. Available at: https://developer.hashicorp.com/terraform/language
- Getting started. OpenTofu. Available at: https://opentofu.org/docs/intro/
- Zhang, T., Pan, S., Zhang, Z., Xing, Z., Sun, X. (2025). Deployability-Centric Infrastructure-as-Code Generation: Fail, Learn, Refine, and Succeed through LLM-Empowered DevOps Simulation. arXiv:2506.05623. https://doi.org/10.48550/arXiv.2506.05623
- Davidson, S., Sun, L., Bhasker, B., Callot, L., Deoras, A. (2025). Multi-IaC-Eval: Benchmarking Cloud Infrastructure as Code Across Multiple Formats. arXiv:2509.05303. https://doi.org/10.48550/arXiv.2509.05303
- Dependency graph. Terraform Internals. HashiCorp Developer. Available at: https://developer.hashicorp.com/terraform/internals/graph
- Shevchenko, A. Yu., Shevchenko, E. L. (2012). How to bring artificial intelligence into the clouds. Eastern-European Journal of Enterprise Technologies, 3 (12 (51)), 66–70. Available at: https://journals.uran.ua/eejet/article/view/2472
- Topology and Orchestration Specification for Cloud Applications (TOSCA) Version 2.0. (2025). OASIS Standard. Available at: https://docs.oasis-open.org/tosca/TOSCA/v2.0/TOSCA-v2.0.html
- Vasileiou, Z., Kumara, I., Meditskos, G., Tokmakov, K., Radolović, D., Cruz, J. G. et al. (2025). A knowledge-based approach for guided development of Infrastructure as Code. Software and Systems Modeling, 25 (2), 515–548. https://doi.org/10.1007/s10270-025-01294-1
- Bibichkov, I., Sokol, V., Shevchenko, O. (2017). Ontological knowledge bases productivity optimization through the use of reasoner combination. Eastern-European Journal of Enterprise Technologies, 5 (2 (89)), 49–54. https://doi.org/10.15587/1729-4061.2017.112347
- Kon, P., Liu, J., Qiu, Y., Fan, W., He, T., Lin, L. et al. (2024). IaC-Eval: A Code Generation Benchmark for Cloud Infrastructure-as-Code Programs. Advances in Neural Information Processing Systems 37, 134488–134506. https://doi.org/10.52202/079017-4273
- Khan, R. N. H., Wasif, D., Cho, J.-H., Butt, A. (2025). Multi-agent code-orchestrated generation for reliable Infrastructure-as-Code. arXiv:2510.03902v1. https://doi.org/10.48550/arXiv.2510.03902
- Qiu, Y., Kon, P. T. J., Beckett, R., Chen, A. (2024). Unearthing Semantic Checks for Cloud Infrastructure-as-Code Programs. Proceedings of the ACM SIGOPS 30th Symposium on Operating Systems Principles, 574–589. https://doi.org/10.1145/3694715.3695974
- Open Policy Agent documentation. Open Policy Agent. Available at: https://www.openpolicyagent.org/docs
- What is AWS CloudFormation Guard? Amazon Web Services. Available at: https://docs.aws.amazon.com/cfn-guard/latest/ug/what-is-guard.html
- Shevchenko, O. L. (2013). Semantic annotations similarity measure to compare processes profiles. Eastern-European Journal of Enterprise Technologies, 3 (2 (63)), 48–52. https://doi.org/10.15587/1729-4061.2013.14445
- SIaC Supplementary Artifacts. GitHub. Available at: https://github.com/shevchenko-oleksandr/SIaC
- Nekrasov, R., Fossati, S., Kumara, I., Tamburri, D. A., van den Heuvel, W.-J. (2026). IaC Generation with LLMs: An Error Taxonomy and A Study on Configuration Knowledge Injection. ACM Transactions on Software Engineering and Methodology. https://doi.org/10.1145/3817608
- Fliahin, V., Turuta, O., Turuta, O. (2025). Approaching LLM alignment using agents with RAG. Proceedings of the 5th International Workshop of IT-professionals on Artificial Intelligence (ProfIT AI 2025). CEUR Workshop Proceedings, 4164, 207–215. Available at: https://ceur-ws.org/Vol-4164/short6.pdf
- COST (European Cooperation in Science and Technology). Available at: https://www.cost.eu
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2026 Ihor Bibichkov, Olena Shevchenko, Oleksandr Shevchenko, Oleksandr Stopin

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.





