Оцінка продуктивності декомпозиції матриці LU за допомогою стандарту SYCL

Автор(и)

  • Дмитро Юрійович Насікан Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0009-0007-1840-4344
  • Вадим Сергійович Яременко Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0000-0001-8557-6938

DOI:

https://doi.org/10.15587/2706-5448.2023.284518

Ключові слова:

стандартні засоби SYCL, паралельні обчислення, декомпозиція LU, продуктивність SYCL, чисельні методи

Анотація

Об’єктом дослідження є продуктивність стандартних засобів SYCL при розв’язанні задачі декомпозиції матриці LU. SYCL є досить новою технологією паралельних обчислень у гетерогенних системах, тому тема оцінки продуктивності стандарту на конкретних завданнях у сфері паралельних обчислень є актуальною. У дослідженні було реалізовано алгоритм розпаралеленої LU-декомпозиції квадратної матриці за допомогою стандарту SYCL і стандарту C++, а також проведено експеримент для перевірки реалізації в гетерогенній системі з кількома типами процесорів. Під час тестування програма отримувала на вхід квадратні матриці різної розмірності, а на виході був час виконання розкладу LU на обраному процесорі. Отримані результати, представлені у вигляді табличних і графічних даних, показують перевагу реалізації стандарту SYCL над звичайним C++ більш ніж у 2 рази при використанні графічного процесора. Експериментально показано, що реалізація на SYCL практично не поступається за швидкістю реалізації на звичайному C++ при виконанні на центральному процесорі. Такі результати обумовлені як високою можливістю розпаралелення самого алгоритму розкладу LU, так і великою роботою розробників стандарту по його оптимізації.

Отримані результати вказують на можливість прискорення розв’язання LU декомпозиції матриці та подібних алгоритмів за допомогою SYCL при використанні гетерогенних систем з процесорами, оптимізованими для паралелізму даних. Результати дослідження можуть бути використані при обґрунтуванні вибору технології розв’язування задач декомпозиції матриці LU або задач з подібною схемою розпаралелювання.

Біографії авторів

Дмитро Юрійович Насікан, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Кафедра системного проектування

Вадим Сергійович Яременко, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Аспірант, асистент

Кафедра системного проектування

Посилання

  1. Alpay, A., Heuveline, V. (2020). SYCL beyond OpenCL: The architecture, current state and future direction of hipSYCL. Proceedings of the International Workshop on OpenCL. doi: https://doi.org/10.1145/3388333.3388658
  2. Lal, S., Alpay, A., Salzmann, P., Cosenza, B., Hirsch, A., Stawinoga, N. et al. (2020). SYCL-Bench: A Versatile Cross-Platform Benchmark Suite for Heterogeneous Computing. Lecture Notes in Computer Science. Cham: Springer, 629–644. doi: https://doi.org/10.1007/978-3-030-57675-2_39
  3. Diop, T., Gurfinkel, S., Anderson, J., Jerger, N. E. (2013). DistCL: A Framework for the Distributed Execution of OpenCL Kernels. 2013 IEEE 21st International Symposium on Modelling, Analysis and Simulation of Computer and Telecommunication Systems, 556–566. doi: https://doi.org/10.1109/mascots.2013.77
  4. Ozcan, C., Sen, B. (2012). Investigation of the performance of LU decomposition method using CUDA. Procedia Technology, 1, 50–54. doi: https://doi.org/10.1016/j.protcy.2012.02.011
  5. Ghysels, P., Synk, R. (2022). High performance sparse multifrontal solvers on modern GPUs. Parallel Computing, 110, 102897. doi: https://doi.org/10.1016/j.parco.2022.102897
  6. Mittal, R. C., Al-Kurdi, A. (2002). LU-decomposition and numerical structure for solving large sparse nonsymmetric linear systems. Computers & Mathematics with Applications, 43 (1-2), 131–155. doi: https://doi.org/10.1016/s0898-1221(01)00279-6
  7. Lambers, J. (2021). «The LU Decomposition» in MAT 610 – Numerical Linear Algebra, Sec. 3.2. Available at: https://www.math.usm.edu/lambers/mat610/class0125.pdf
  8. Yang, A., Liu, C., Chang, J., Guo, X. (2020). Research on Parallel LU Decomposition Method and its Application in Circle Transportation. Journal of Software, 5, 1250–1255. doi: https://doi.org/10.4304/jsw.5.11.1250-1255
  9. Peng, S., Tan, S. X.-D. (2020). GLU3.0: Fast GPU-based Parallel Sparse LU Factorization for Circuit Simulation. IEEE Design & Test, 37 (3), 78–90. doi: https://doi.org/10.1109/mdat.2020.2974910
  10. SYCL Working Group, «SYCL™ 2020 Specification (revision 7)» (2023). The Khronos Group. Available at: https://registry.khronos.org/SYCL/specs/sycl-2020/pdf/sycl-2020.pdf
Performance evaluation of LU matrix decomposition using the SYCL standard

##submission.downloads##

Опубліковано

2023-06-30

Як цитувати

Насікан, Д. Ю., & Яременко, В. С. (2023). Оцінка продуктивності декомпозиції матриці LU за допомогою стандарту SYCL. Technology Audit and Production Reserves, 3(2(71), 6–9. https://doi.org/10.15587/2706-5448.2023.284518

Номер

Розділ

Інформаційні технології