Оцінка продуктивності декомпозиції матриці LU за допомогою стандарту SYCL
DOI:
https://doi.org/10.15587/2706-5448.2023.284518Ключові слова:
стандартні засоби SYCL, паралельні обчислення, декомпозиція LU, продуктивність SYCL, чисельні методиАнотація
Об’єктом дослідження є продуктивність стандартних засобів SYCL при розв’язанні задачі декомпозиції матриці LU. SYCL є досить новою технологією паралельних обчислень у гетерогенних системах, тому тема оцінки продуктивності стандарту на конкретних завданнях у сфері паралельних обчислень є актуальною. У дослідженні було реалізовано алгоритм розпаралеленої LU-декомпозиції квадратної матриці за допомогою стандарту SYCL і стандарту C++, а також проведено експеримент для перевірки реалізації в гетерогенній системі з кількома типами процесорів. Під час тестування програма отримувала на вхід квадратні матриці різної розмірності, а на виході був час виконання розкладу LU на обраному процесорі. Отримані результати, представлені у вигляді табличних і графічних даних, показують перевагу реалізації стандарту SYCL над звичайним C++ більш ніж у 2 рази при використанні графічного процесора. Експериментально показано, що реалізація на SYCL практично не поступається за швидкістю реалізації на звичайному C++ при виконанні на центральному процесорі. Такі результати обумовлені як високою можливістю розпаралелення самого алгоритму розкладу LU, так і великою роботою розробників стандарту по його оптимізації.
Отримані результати вказують на можливість прискорення розв’язання LU декомпозиції матриці та подібних алгоритмів за допомогою SYCL при використанні гетерогенних систем з процесорами, оптимізованими для паралелізму даних. Результати дослідження можуть бути використані при обґрунтуванні вибору технології розв’язування задач декомпозиції матриці LU або задач з подібною схемою розпаралелювання.
Посилання
- Alpay, A., Heuveline, V. (2020). SYCL beyond OpenCL: The architecture, current state and future direction of hipSYCL. Proceedings of the International Workshop on OpenCL. doi: https://doi.org/10.1145/3388333.3388658
- Lal, S., Alpay, A., Salzmann, P., Cosenza, B., Hirsch, A., Stawinoga, N. et al. (2020). SYCL-Bench: A Versatile Cross-Platform Benchmark Suite for Heterogeneous Computing. Lecture Notes in Computer Science. Cham: Springer, 629–644. doi: https://doi.org/10.1007/978-3-030-57675-2_39
- Diop, T., Gurfinkel, S., Anderson, J., Jerger, N. E. (2013). DistCL: A Framework for the Distributed Execution of OpenCL Kernels. 2013 IEEE 21st International Symposium on Modelling, Analysis and Simulation of Computer and Telecommunication Systems, 556–566. doi: https://doi.org/10.1109/mascots.2013.77
- Ozcan, C., Sen, B. (2012). Investigation of the performance of LU decomposition method using CUDA. Procedia Technology, 1, 50–54. doi: https://doi.org/10.1016/j.protcy.2012.02.011
- Ghysels, P., Synk, R. (2022). High performance sparse multifrontal solvers on modern GPUs. Parallel Computing, 110, 102897. doi: https://doi.org/10.1016/j.parco.2022.102897
- Mittal, R. C., Al-Kurdi, A. (2002). LU-decomposition and numerical structure for solving large sparse nonsymmetric linear systems. Computers & Mathematics with Applications, 43 (1-2), 131–155. doi: https://doi.org/10.1016/s0898-1221(01)00279-6
- Lambers, J. (2021). «The LU Decomposition» in MAT 610 – Numerical Linear Algebra, Sec. 3.2. Available at: https://www.math.usm.edu/lambers/mat610/class0125.pdf
- Yang, A., Liu, C., Chang, J., Guo, X. (2020). Research on Parallel LU Decomposition Method and its Application in Circle Transportation. Journal of Software, 5, 1250–1255. doi: https://doi.org/10.4304/jsw.5.11.1250-1255
- Peng, S., Tan, S. X.-D. (2020). GLU3.0: Fast GPU-based Parallel Sparse LU Factorization for Circuit Simulation. IEEE Design & Test, 37 (3), 78–90. doi: https://doi.org/10.1109/mdat.2020.2974910
- SYCL Working Group, «SYCL™ 2020 Specification (revision 7)» (2023). The Khronos Group. Available at: https://registry.khronos.org/SYCL/specs/sycl-2020/pdf/sycl-2020.pdf
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2023 Dmytro Nasikan, Vadym Yaremenko
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Закріплення та умови передачі авторських прав (ідентифікація авторства) здійснюється у Ліцензійному договорі. Зокрема, автори залишають за собою право на авторство свого рукопису та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons CC BY. При цьому вони мають право укладати самостійно додаткові угоди, що стосуються неексклюзивного поширення роботи у тому вигляді, в якому вона була опублікована цим журналом, але за умови збереження посилання на першу публікацію статті в цьому журналі.