Теоретична розробка алгоритму у вигляді дерева прийняття рішень для вибору ефективного типу сховища великих наборів даних
DOI:
https://doi.org/10.15587/2706-5448.2022.251281Ключові слова:
великі набори даних, нереляційна база даних, колонково-орієнтована база даних, документно-орієнтована база данихАнотація
Об’єктом дослідження є методи та підходи щодо підвищення ефективності зберігання та оптимізації доступу до великих обсягів даних. Важливість даного дослідження полягає в широкому поширенні великих даних та необхідності правильного підбору технологій, що допоможе покращити ефективність систем обробки великих даних. Складність вибору викликає значна кількість різних сховищ та баз даних, тому для прийняття найкращого рішення необхідне глибоке розуміння переваг, недоліків та особливостей кожного з них. А також складність полягає у відсутності універсального алгоритму для прийняття рішень про вибір оптимального сховища даних. Відповідно, на основі проведених експериментів, аналізу існуючих проєктів та наукових праць було запропоновано алгоритм ухвалення рішень, що визначає найкращий спосіб зберігання великих даних, залежно від їх характеристик та додаткових вимог до системи. Це необхідно для спрощення проєктування системи на початкових етапах проєктів, пов’язаних з обробкою великих даних. Таким чином, шляхом виокремлення ключових відмінностей, а також недоліків та переваг кожного з типів сховищ та баз, створено список основних характеристик даних та майбутньої системи, що варто взяти до уваги при її проєктуванні.
Розроблений алгоритм є теоретичною пропозицією на основі вивчених наукових робіт. Відповідно, використовуючи даний алгоритм на етапі проєктування системи, можна було б швидко та чітко визначити оптимальний тип сховища великих обсягів даних. В роботі розглянуто колонково-орієнтовані, документно-орієнтовані, графові та типу ключ-значення бази даних, а також розподілені файлові системи та хмарні сервіси
Посилання
- Dash, S., Shakyawar, S. K., Sharma, M., Kaushik, S. (2019). Big data in healthcare: management, analysis and future prospects. Journal of Big Data, 6 (1). doi: http://doi.org/10.1186/s40537-019-0217-0
- Raghupathi, W., Raghupathi, V. (2014). Big data analytics in healthcare: promise and potential. Health Information Science and Systems, 2 (1). doi: http://doi.org/10.1186/2047-2501-2-3
- Raja, R., Mukherjee, I., Sarkar, B. K. (2020). A Systematic Review of Healthcare Big Data. Scientific Programming, 2020, 1–15. doi: http://doi.org/10.1155/2020/5471849
- Siddiqa, A., Karim, A., Gani, A. (2017). Big data storage technologies: a survey. Frontiers of Information Technology & Electronic Engineering, 18 (8), 1040–1070. doi: http://doi.org/10.1631/fitee.1500441
- Kumar, S., Singh, M. (2019). Big data analytics for healthcare industry: impact, applications, and tools. Big Data Mining and Analytics, 2 (1), 48–57. doi: http://doi.org/10.26599/bdma.2018.9020031
- Alonso, S. G., de la Torre Díez, I., Rodrigues, J. J. P. C., Hamrioui, S., López-Coronado, M. (2017). A Systematic Review of Techniques and Sources of Big Data in the Healthcare Sector. Journal of Medical Systems, 41 (11). doi: http://doi.org/10.1007/s10916-017-0832-2
- Pandey, M. K., Subbiah, K. (2016). A Novel Storage Architecture for Facilitating Efficient Analytics of Health Informatics Big Data in Cloud. 2016 IEEE International Conference on Computer and Information Technology (CIT). doi: http://doi.org/10.1109/cit.2016.86
- Olaronke, I., Oluwaseun, O. (2016). Big data in healthcare: Prospects, challenges and resolutions. 2016 Future Technologies Conference (FTC). doi: http://doi.org/10.1109/ftc.2016.7821747
- Suthakar, U., Magnoni, L., Smith, D. R., Khan, A., Andreeva, J. (2016). An efficient strategy for the collection and storage of large volumes of data for computation. Journal of Big Data, 3 (1). doi: http://doi.org/10.1186/s40537-016-0056-1
- Geihs, M., Buchmann, J.; Lee, K. (Ed.) (2019). ELSA: Efficient Long-Term Secure Storage of Large Datasets. Information Security and Cryptology – ICISC 2018. ICISC 2018. Lecture Notes in Computer Science. Cham: Springer, 269–286. doi: https://doi.org/10.1007/978-3-030-12146-4_17
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2022 Sofiia Materynska, Vadym Yaremenko, Walery Rogoza
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.