Method for Software Pipelining on Graphical Processing Units

dc.contributor.authorVinokurov, Artemii
dc.contributor.authorSergiyenko, Anatoliy
dc.date.accessioned2026-02-05T07:39:52Z
dc.date.available2026-02-05T07:39:52Z
dc.date.issued2025
dc.description.abstractGraphics Processing Units (GPUs) play a significant role in high-end computations, including artificial intelligence. However, the GPU hardware is often underloaded. This forces an increased volume of GPU hardware to maintain a high throughput for task execution. The low loading of the GPU resources remains an actual problem and it needs to be solved now. Therefore, it is essential to seek methods that enhance GPU loading. The research object is computational processes in modern processors, especially in GPUs. The purpose of this study is to review the software pipelining approach, its advantages and disadvantages, the techniques that can be used in it, including both instruction-level and decoupled versions, and to assess the effectiveness of this approach for the GPU. To satisfy the requirements, different analysis methods were used. First, the architectural requirements to apply software pipelining were reviewed. Second, the original formulation and historical development of the approach were examined. Third, different levels of parallelisation to implement software pipelining were explored. Finally, C-slowing was proposed as an optimisation technique to overcome the adversities of the underutilisation of computational resources. The research has revealed the abundance of proper software pipelining for GPU implementations. Whereas existing works review the possibilities of this technique, they are often overlooked in contrast to simpler multi-threading techniques. However, investigated researchers have defined the crucial limiting factor to computational resources as a constraint by memory overloading, specifically the pipelining registers. To address this, the C-slowing approach was suggested and theoretically evaluated. It demonstrated a possible increase of over 30% in GPU loading for the analysed algorithm, proving its applicability. In conclusion, the software pipelining approach shows decent potential to optimise GPU algorithms, requiring further investigation. C-slowing could be utilised to handle the problem of underutilisation of computation.
dc.description.abstractotherГрафічні співпроцесори (GPU) відіграють значну роль у високопродуктивних обчисленнях, включаючи штучний інтелект. Однак апаратне забезпечення GPU часто недовантажене. Це змушує збільшувати обсяг апаратного забезпечення GPU для підтримки високої пропускної здатності для виконання завдань. І тому низьке завантаження ресурсів GPU залишається актуальною проблемою, яка вимагає вирішення. Важливо шукати методи, що підвищують завантаження GPU. Об'єктом дослідження є обчислювальні процеси в сучасних процесорах, особливо в GPU. Метою цього дослідження є огляд підходів удосконалення програмного забезпечення за допомогою програмної конвеєризації, включаючи як версії конвеєризації на рівні команд, так іна рівні програмних потоків, а також оцінка ефективності цього підходу для GPU. Було розглянуто архітектурні вимоги до застосування конвеєрної обробки програмного забезпечення, розглянуто оригінальне формулювання та історичний розвиток підходу, було досліджено різні рівні паралелізмудля реалізації конвеєрної організаціїпрограмного забезпечення. Нарешті, було запропоновано метод ресинхронізації з уповільненням як метод оптимізації для подолання недоліків недостатнього використання обчислювальних ресурсів. Виявлено достатню кількість досліджень, присвячених конвеєрному виконанню програмного забезпечення для реалізацій на GPU. Хоча існуючі роботи розглядають можливості цього методу, вони часто ігноруються на відміну від простіших методів багатопотокової обробки. Однак, в роботахвизначили вирішальним обмежувальним фактором обчислювальних ресурсів як обмеження, спричинене перевантаженням пам'яті,зокрема регістрами конвеєрної обробки. Для вирішення цієї проблеми було запропоновано та теоретично оцінено підхід ресинхронізації з уповільненням. Він продемонстрував можливе збільшення завантаження GPU більш ніж на 30% для аналізованого алгоритму, що доводить його перспективи застосування.На завершення, підхід до конвеєрної обробки програмного забезпечення демонструє непоганий потенціал для оптимізації алгоритмів для GPU, що потребує подальшого дослідження. Ресинхронізація з уповільненням може бути використана для вирішення проблеми прискорення обчислень на GPU.
dc.format.pagerangeP. 27-41
dc.identifier.citationVinokurov, A. Method for Software Pipelining on Graphical Processing Units /Artemii Vinokurov, Anatoliy Sergiyenko // Information, Computing and Intelligent systems. – 2025. – No. 6. – P. 27-41. – Bibliogr.: 33 ref.
dc.identifier.doihttps://doi.org/10.20535/2786-8729.6.2025.331193
dc.identifier.orcid0009-0006-7861-5138
dc.identifier.orcid0000-0001-5965-1789
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/78655
dc.language.isoen
dc.publisherNational Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
dc.publisher.placeKyiv
dc.relation.ispartofInformation, Computing and Intelligent systems, No.6, 2025
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectsoftware pipelining
dc.subjectGraphic Processing Unit
dc.subjectC-slowing
dc.subjectretiming
dc.subjectsynchronous dataflow
dc.subjectпрограмна конвеєризація
dc.subjectграфічний співпроцесор
dc.subjectресинхронізація
dc.subjectграф синхронних потоків даних
dc.subject.udc004.8:004.94
dc.titleMethod for Software Pipelining on Graphical Processing Units
dc.title.alternativeМетод програмної конвейєризації для графічних співпроцесорів
dc.typeArticle

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
27-41.pdf
Розмір:
984.64 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: