Розпізнавання іменованих сутностей в українських текстах в умовах обмеженої розмітки

dc.contributor.authorКашперова, С. В.
dc.contributor.authorШаповал, Н. В.
dc.date.accessioned2026-01-07T10:32:12Z
dc.date.available2026-01-07T10:32:12Z
dc.date.issued2025
dc.description.abstractУ даній роботі досліджено проблему розпізнавання іменованих сутностей (NER) в україномовних текстах в zero-shot та few-shot режимах. Метою дослідження є розробка компактної та ефективної моделі на основі архітектури GliNER, здатної підтримувати zeroshot та few-shot режими розпізнавання. Запропоновано модифікації базової архітектури, включаючи інтеграцію Post-Fusion блоку з Mixture-of-Experts (MoE), використання функції активації GoLU та оптимізатора Sophia-G для стабілізації навчання. Базовим текстовим енкодером обрано Snowflake Arctic-Embed 2.0-L. Створено український корпус few-shot NER на базі публічних джерел з використанням GPT-4o для анотації. Експериментальне порівняння підтвердило, що запропонована архітектура має ефективну продуктивність (F1 = 0.7891). Результатом є модель, що демонструє здатність до узагальнення, актуальну для малоресурсних мов.
dc.format.pagerangeС. 303-307
dc.identifier.citationКашперова, С. В. Розпізнавання іменованих сутностей в українських текстах в умовах обмеженої розмітки / Кашперова С. В., Шаповал Н. В. // Системні науки та інформатика : збірка доповідей ІV науково-практичної конференції, [Київ], 1–5 грудня 2025 р. / Навчально-науковий Інститут прикладного системного аналізу КПІ ім. Ігоря Сікорського. – Київ, 2025. – С. 303-307.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/77957
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.relation.ispartofСистемні науки та інформатика : збірка доповідей ІV науково-практичної конференції, 1–5 грудня 2025 року, м. Київ, Україна
dc.subjectNER
dc.subjectвекторні подання токенів
dc.subjectzero-shot та few-shot розпізнавання
dc.subjectсуміш експертів
dc.subjectGoLU
dc.subjectSophia-G
dc.subjectукраїнська мова
dc.titleРозпізнавання іменованих сутностей в українських текстах в умовах обмеженої розмітки
dc.typeArticle

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
sni2025_P-303-307.pdf
Розмір:
986.82 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: