Вплив стратегій декодування токенів у великих мовних моделях на якість Text-to-SQL парсингу

Ескіз

Дата

2025

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

У роботі досліджується вплив стратегій декодування токенів у великих мовних моделях на якість генерації SQL-запитів у задачі Text-to-SQL. На основі моделі Qwen2.5-3B-Instruct проведено порівняння базових (Greedy, Beam, Top-k, Top-p) та покращених execution-guided стратегій (EG-Beam, EGLA-Beam, EFG-Beam) на наборі даних mini_dev із колекції BIRD-Bench. Для оцінювання використано метрики Execution Accuracy, String Match Accuracy, Component Match Accuracy, AST Similarity та середній час генерації. Результати показали, що інтеграція виконувальних перевірок і механізмів самокорекції суттєво підвищує частку семантично коректних і виконуваних запитів без зміни самої моделі.

Опис

Ключові слова

Text-to-SQL, великі мовні моделі, стратегії декодування, execution-guided декодування, SQL-парсинг

Бібліографічний опис

Курганський, Л. С. Вплив стратегій декодування токенів у великих мовних моделях на якість Text-to-SQL парсингу / Курганський Л. С., Шаптала Р. В. // Системні науки та інформатика : збірка доповідей ІV науково-практичної конференції, [Київ], 1–5 грудня 2025 р. / Навчально-науковий Інститут прикладного системного аналізу КПІ ім. Ігоря Сікорського. – Київ, 2025. – С. 189-193.

ORCID

DOI