Теоретична розробка алгоритму у вигляді дерева прийняття рішень для вибору ефективного типу сховища великих наборів даних

Автор(и)

  • Софія Василівна Материнська Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0000-0002-5746-4899
  • Вадим Сергійович Яременко Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0000-0001-8557-6938
  • Валерій Станіславович Рогоза Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0000-0003-2327-156X

DOI:

https://doi.org/10.15587/2706-5448.2022.251281

Ключові слова:

великі набори даних, нереляційна база даних, колонково-орієнтована база даних, документно-орієнтована база даних

Анотація

Об’єктом дослідження є методи та підходи щодо підвищення ефективності зберігання та оптимізації доступу до великих обсягів даних. Важливість даного дослідження полягає в широкому поширенні великих даних та необхідності правильного підбору технологій, що допоможе покращити ефективність систем обробки великих даних. Складність вибору викликає значна кількість різних сховищ та баз даних, тому для прийняття найкращого рішення необхідне глибоке розуміння переваг, недоліків та особливостей кожного з них. А також складність полягає у відсутності універсального алгоритму для прийняття рішень про вибір оптимального сховища даних. Відповідно, на основі проведених експериментів, аналізу існуючих проєктів та наукових праць було запропоновано алгоритм ухвалення рішень, що визначає найкращий спосіб зберігання великих даних, залежно від їх характеристик та додаткових вимог до системи. Це необхідно для спрощення проєктування системи на початкових етапах проєктів, пов’язаних з обробкою великих даних. Таким чином, шляхом виокремлення ключових відмінностей, а також недоліків та переваг кожного з типів сховищ та баз, створено список основних характеристик даних та майбутньої системи, що варто взяти до уваги при її проєктуванні.

Розроблений алгоритм є теоретичною пропозицією на основі вивчених наукових робіт. Відповідно, використовуючи даний алгоритм на етапі проєктування системи, можна було б швидко та чітко визначити оптимальний тип сховища великих обсягів даних. В роботі розглянуто колонково-орієнтовані, документно-орієнтовані, графові та типу ключ-значення бази даних, а також розподілені файлові системи та хмарні сервіси

Біографії авторів

Софія Василівна Материнська, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Кафедра системного проектування

Вадим Сергійович Яременко, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Аспірант, асистент

Кафедра системного проектування

Валерій Станіславович Рогоза, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Доктор технічних наук, професор

Кафедра системного проектування

Посилання

  1. Dash, S., Shakyawar, S. K., Sharma, M., Kaushik, S. (2019). Big data in healthcare: management, analysis and future prospects. Journal of Big Data, 6 (1). doi: http://doi.org/10.1186/s40537-019-0217-0
  2. Raghupathi, W., Raghupathi, V. (2014). Big data analytics in healthcare: promise and potential. Health Information Science and Systems, 2 (1). doi: http://doi.org/10.1186/2047-2501-2-3
  3. Raja, R., Mukherjee, I., Sarkar, B. K. (2020). A Systematic Review of Healthcare Big Data. Scientific Programming, 2020, 1–15. doi: http://doi.org/10.1155/2020/5471849
  4. Siddiqa, A., Karim, A., Gani, A. (2017). Big data storage technologies: a survey. Frontiers of Information Technology & Electronic Engineering, 18 (8), 1040–1070. doi: http://doi.org/10.1631/fitee.1500441
  5. Kumar, S., Singh, M. (2019). Big data analytics for healthcare industry: impact, applications, and tools. Big Data Mining and Analytics, 2 (1), 48–57. doi: http://doi.org/10.26599/bdma.2018.9020031
  6. Alonso, S. G., de la Torre Díez, I., Rodrigues, J. J. P. C., Hamrioui, S., López-Coronado, M. (2017). A Systematic Review of Techniques and Sources of Big Data in the Healthcare Sector. Journal of Medical Systems, 41 (11). doi: http://doi.org/10.1007/s10916-017-0832-2
  7. Pandey, M. K., Subbiah, K. (2016). A Novel Storage Architecture for Facilitating Efficient Analytics of Health Informatics Big Data in Cloud. 2016 IEEE International Conference on Computer and Information Technology (CIT). doi: http://doi.org/10.1109/cit.2016.86
  8. Olaronke, I., Oluwaseun, O. (2016). Big data in healthcare: Prospects, challenges and resolutions. 2016 Future Technologies Conference (FTC). doi: http://doi.org/10.1109/ftc.2016.7821747
  9. Suthakar, U., Magnoni, L., Smith, D. R., Khan, A., Andreeva, J. (2016). An efficient strategy for the collection and storage of large volumes of data for computation. Journal of Big Data, 3 (1). doi: http://doi.org/10.1186/s40537-016-0056-1
  10. Geihs, M., Buchmann, J.; Lee, K. (Ed.) (2019). ELSA: Efficient Long-Term Secure Storage of Large Datasets. Information Security and Cryptology – ICISC 2018. ICISC 2018. Lecture Notes in Computer Science. Cham: Springer, 269–286. doi: https://doi.org/10.1007/978-3-030-12146-4_17

##submission.downloads##

Опубліковано

2022-01-19

Як цитувати

Материнська, С. В., Яременко, В. С., & Рогоза, В. С. (2022). Теоретична розробка алгоритму у вигляді дерева прийняття рішень для вибору ефективного типу сховища великих наборів даних. Technology Audit and Production Reserves, 1(2(63), 6–9. https://doi.org/10.15587/2706-5448.2022.251281

Номер

Розділ

Інформаційні технології: Звіт про науково-дослідну роботу