Вплив стратегій декодування токенів у великих мовних моделях на якість Text-to-SQL парсингу

Курганський, Л. С.; Шаптала, Р. В.

Вплив стратегій декодування токенів у великих мовних моделях на якість Text-to-SQL парсингу

Файли

sni2025_P-189-193.pdf (924.28 KB)

Дата

2025

Автори

Курганський, Л. С.

Шаптала, Р. В.

Видавець

КПІ ім. Ігоря Сікорського

Анотація

У роботі досліджується вплив стратегій декодування токенів у великих мовних моделях на якість генерації SQL-запитів у задачі Text-to-SQL. На основі моделі Qwen2.5-3B-Instruct проведено порівняння базових (Greedy, Beam, Top-k, Top-p) та покращених execution-guided стратегій (EG-Beam, EGLA-Beam, EFG-Beam) на наборі даних mini_dev із колекції BIRD-Bench. Для оцінювання використано метрики Execution Accuracy, String Match Accuracy, Component Match Accuracy, AST Similarity та середній час генерації. Результати показали, що інтеграція виконувальних перевірок і механізмів самокорекції суттєво підвищує частку семантично коректних і виконуваних запитів без зміни самої моделі.

Ключові слова

Text-to-SQL, великі мовні моделі, стратегії декодування, execution-guided декодування, SQL-парсинг

Бібліографічний опис

Курганський, Л. С. Вплив стратегій декодування токенів у великих мовних моделях на якість Text-to-SQL парсингу / Курганський Л. С., Шаптала Р. В. // Системні науки та інформатика : збірка доповідей ІV науково-практичної конференції, [Київ], 1–5 грудня 2025 р. / Навчально-науковий Інститут прикладного системного аналізу КПІ ім. Ігоря Сікорського. – Київ, 2025. – С. 189-193.

URI

https://ela.kpi.ua/handle/123456789/77910

Зібрання

Системні науки та інформатика (4 ; Київ ; 2025)

Повна інформація про документ

Вплив стратегій декодування токенів у великих мовних моделях на якість Text-to-SQL парсингу

Файли

Дата

Автори

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

ORCID

URI

DOI

Зібрання