Method for Software Pipelining on Graphical Processing Units
| dc.contributor.author | Vinokurov, Artemii | |
| dc.contributor.author | Sergiyenko, Anatoliy | |
| dc.date.accessioned | 2026-02-05T07:39:52Z | |
| dc.date.available | 2026-02-05T07:39:52Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Graphics Processing Units (GPUs) play a significant role in high-end computations, including artificial intelligence. However, the GPU hardware is often underloaded. This forces an increased volume of GPU hardware to maintain a high throughput for task execution. The low loading of the GPU resources remains an actual problem and it needs to be solved now. Therefore, it is essential to seek methods that enhance GPU loading. The research object is computational processes in modern processors, especially in GPUs. The purpose of this study is to review the software pipelining approach, its advantages and disadvantages, the techniques that can be used in it, including both instruction-level and decoupled versions, and to assess the effectiveness of this approach for the GPU. To satisfy the requirements, different analysis methods were used. First, the architectural requirements to apply software pipelining were reviewed. Second, the original formulation and historical development of the approach were examined. Third, different levels of parallelisation to implement software pipelining were explored. Finally, C-slowing was proposed as an optimisation technique to overcome the adversities of the underutilisation of computational resources. The research has revealed the abundance of proper software pipelining for GPU implementations. Whereas existing works review the possibilities of this technique, they are often overlooked in contrast to simpler multi-threading techniques. However, investigated researchers have defined the crucial limiting factor to computational resources as a constraint by memory overloading, specifically the pipelining registers. To address this, the C-slowing approach was suggested and theoretically evaluated. It demonstrated a possible increase of over 30% in GPU loading for the analysed algorithm, proving its applicability. In conclusion, the software pipelining approach shows decent potential to optimise GPU algorithms, requiring further investigation. C-slowing could be utilised to handle the problem of underutilisation of computation. | |
| dc.description.abstractother | Графічні співпроцесори (GPU) відіграють значну роль у високопродуктивних обчисленнях, включаючи штучний інтелект. Однак апаратне забезпечення GPU часто недовантажене. Це змушує збільшувати обсяг апаратного забезпечення GPU для підтримки високої пропускної здатності для виконання завдань. І тому низьке завантаження ресурсів GPU залишається актуальною проблемою, яка вимагає вирішення. Важливо шукати методи, що підвищують завантаження GPU. Об'єктом дослідження є обчислювальні процеси в сучасних процесорах, особливо в GPU. Метою цього дослідження є огляд підходів удосконалення програмного забезпечення за допомогою програмної конвеєризації, включаючи як версії конвеєризації на рівні команд, так іна рівні програмних потоків, а також оцінка ефективності цього підходу для GPU. Було розглянуто архітектурні вимоги до застосування конвеєрної обробки програмного забезпечення, розглянуто оригінальне формулювання та історичний розвиток підходу, було досліджено різні рівні паралелізмудля реалізації конвеєрної організаціїпрограмного забезпечення. Нарешті, було запропоновано метод ресинхронізації з уповільненням як метод оптимізації для подолання недоліків недостатнього використання обчислювальних ресурсів. Виявлено достатню кількість досліджень, присвячених конвеєрному виконанню програмного забезпечення для реалізацій на GPU. Хоча існуючі роботи розглядають можливості цього методу, вони часто ігноруються на відміну від простіших методів багатопотокової обробки. Однак, в роботахвизначили вирішальним обмежувальним фактором обчислювальних ресурсів як обмеження, спричинене перевантаженням пам'яті,зокрема регістрами конвеєрної обробки. Для вирішення цієї проблеми було запропоновано та теоретично оцінено підхід ресинхронізації з уповільненням. Він продемонстрував можливе збільшення завантаження GPU більш ніж на 30% для аналізованого алгоритму, що доводить його перспективи застосування.На завершення, підхід до конвеєрної обробки програмного забезпечення демонструє непоганий потенціал для оптимізації алгоритмів для GPU, що потребує подальшого дослідження. Ресинхронізація з уповільненням може бути використана для вирішення проблеми прискорення обчислень на GPU. | |
| dc.format.pagerange | P. 27-41 | |
| dc.identifier.citation | Vinokurov, A. Method for Software Pipelining on Graphical Processing Units /Artemii Vinokurov, Anatoliy Sergiyenko // Information, Computing and Intelligent systems. – 2025. – No. 6. – P. 27-41. – Bibliogr.: 33 ref. | |
| dc.identifier.doi | https://doi.org/10.20535/2786-8729.6.2025.331193 | |
| dc.identifier.orcid | 0009-0006-7861-5138 | |
| dc.identifier.orcid | 0000-0001-5965-1789 | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/78655 | |
| dc.language.iso | en | |
| dc.publisher | National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" | |
| dc.publisher.place | Kyiv | |
| dc.relation.ispartof | Information, Computing and Intelligent systems, No.6, 2025 | |
| dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | software pipelining | |
| dc.subject | Graphic Processing Unit | |
| dc.subject | C-slowing | |
| dc.subject | retiming | |
| dc.subject | synchronous dataflow | |
| dc.subject | програмна конвеєризація | |
| dc.subject | графічний співпроцесор | |
| dc.subject | ресинхронізація | |
| dc.subject | граф синхронних потоків даних | |
| dc.subject.udc | 004.8:004.94 | |
| dc.title | Method for Software Pipelining on Graphical Processing Units | |
| dc.title.alternative | Метод програмної конвейєризації для графічних співпроцесорів | |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: