Програмне забезпечення для генерації текстів українською мовою
Вантажиться...
Дата
2026
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Зростання ролі систем обробки природної мови (NLP) створює високий попит на програмне забезпечення, здатне генерувати якісні тексти українською мовою. Однак складна морфологічна структура, багата словозміна, синтаксична гнучкість та брак достатніх мовних ресурсів роблять цю задачу вкрай нетривіальною. Наявні великі мовні моделі (LLM), як-от GPT або LLaMA, хоча і демонструють чудові результати в англомовному середовищі, часто не забезпечують високої якості при роботі з українською мовою. Ця проблема актуальна в таких сферах, як створення навчальних, офіційних і наукових текстів. Запропоноване рішення орієнтоване на усунення цих обмежень шляхом інтеграції LLM із морфологічним аналізом та інструментами виправлення граматичних помилок, зокрема LanguageTool, що дозволяє суттєво підвищити стилістичну й граматичну коректність згенерованих текстів. Робота присвячена розробці програмного забезпечення для генерації українськомовних текстів на основі інтеграції великих мовних моделей, морфологічного аналізу та тематичного моделювання, в результаті чого реалізовано масштабовану архітектуру. Проведено дослідження ефективності запропонованого підходу та здійснено fine-tuning моделей GPT-3.5 та LLaMA-3 для української мови. Програмне забезпечення реалізоване мовами Python та Java з використанням бібліотек spaCy, Gensim, LanguageTool, Airflow та OpenAI API.
Опис
Ключові слова
генерація тексту, Big Data, українська мова, NLP, великі мовні моделі, морфологічний аналіз, LDA, синтаксичний аналіз, тематичне моделювання, перевірка граматики, spaCy, LanguageTool
Бібліографічний опис
Довгополюк, Р. Програмне забезпечення для генерації текстів українською мовою / Р. Довгополюк, Ю. Олійник, М. Кувічка // Адаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник. – 2026. – № 1 (48). – С. 107-119. – Бібліогр.: 19 назв.