A comparative study of task formulations for detecting propaganda using large language models
| dc.contributor.author | Oliinyk, V. | |
| dc.contributor.author | Zakharchyn, N. | |
| dc.date.accessioned | 2025-11-28T13:56:01Z | |
| dc.date.available | 2025-11-28T13:56:01Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | This paper extends existing studies on propaganda detection using large language models by examiningseveral approaches to task formulation and applying them on different LLMs, namely, GPT-4o mini and Gemma / Gemma 2, aiming to find the most effective approach.Using a combination of two text corpora in English and Russian languages with 18 propaganda techniques, we fine-tune models on character-based, phrase-based and class-?fication -only variationsof this dataset with corresponding instructions to define which ins truction yields the best performance. We conducted experiments and evaluated performance across classification, span identification, and joint tasks, demonstrating the clear superiority of the phrase-based approach over the character-based one. At the same time, our findings indi cate that fine-tuning significantly improved model performance on span identification and joint tasks, while offering limited benefit for the classification task alone. | |
| dc.description.abstractother | Стаття доповнює наявні дослідження на тему виявлення пропаганди за допомогою великих мовних моделей, вивчаючи декілька підходів до формулювання задачі та їх використання з різними моделями, зокрема, GPT-4o mini and Gemma / Gemma 2, ставлячи за мету знаходження найбільш ефективного підходу. Використовуючи комбінацію двох текстових корпусів англійською та російською мовами з 18-ма техніками пропаганди, було доналаштовано моделі на символьній, фразовій та класифікаційній варіації набору даних з відповідними інструкціями, щоб визначити, яка з інструкцій приносить найкращі результати. Було проведено експерименти та порівняно результати на завданнях класифікації, ідентифікації проміжків та об’єднаному завданні, та продемонстровано явну перевагу підходу на основі фраз над підходом на основі символьних проміжків. Окрім того, отримані дані показують, що точне налаштування значно покращило ефективність моделей на завданні ідентифікації проміжків та об’єднаному завданні, водночас надаючи обмежений ефект для самостійної задачі класифікації. | |
| dc.format.pagerange | С. 14-24 | |
| dc.identifier.citation | Oliinyk, V. A comparative study of task formulations for detecting propaganda using large language models / V. Oliinyk, N. Zakharchyn // Адаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник. – 2025. – № 2 (47). – С. 14-24. – Бібліогр.: 12 назв. | |
| dc.identifier.doi | https://doi.org/10.20535/1560-8956.47.2025.340158 | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/77438 | |
| dc.language.iso | en | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.relation.ispartof | Адаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник, № 2 (47), 2025 | |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/4.0/ | |
| dc.subject | propaganda detection | |
| dc.subject | Large Language Models | |
| dc.subject | propaganda techniques | |
| dc.subject | fine-tuning | |
| dc.subject | natural language processing | |
| dc.subject | виявлення пропаганди | |
| dc.subject | великі мовні моделі | |
| dc.subject | методи пропаганди | |
| dc.subject | точне налаштування | |
| dc.subject | обробка природної мови | |
| dc.subject.udc | 004.8 | |
| dc.title | A comparative study of task formulations for detecting propaganda using large language models | |
| dc.title.alternative | Порівняльне дослідження формулювань задачі виявлення пропаганди з використанням великих мовних моделей | |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: