Розпізнавання іменованих сутностей в українських текстах в умовах обмеженої розмітки
| dc.contributor.author | Кашперова, С. В. | |
| dc.contributor.author | Шаповал, Н. В. | |
| dc.date.accessioned | 2026-01-07T10:32:12Z | |
| dc.date.available | 2026-01-07T10:32:12Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | У даній роботі досліджено проблему розпізнавання іменованих сутностей (NER) в україномовних текстах в zero-shot та few-shot режимах. Метою дослідження є розробка компактної та ефективної моделі на основі архітектури GliNER, здатної підтримувати zeroshot та few-shot режими розпізнавання. Запропоновано модифікації базової архітектури, включаючи інтеграцію Post-Fusion блоку з Mixture-of-Experts (MoE), використання функції активації GoLU та оптимізатора Sophia-G для стабілізації навчання. Базовим текстовим енкодером обрано Snowflake Arctic-Embed 2.0-L. Створено український корпус few-shot NER на базі публічних джерел з використанням GPT-4o для анотації. Експериментальне порівняння підтвердило, що запропонована архітектура має ефективну продуктивність (F1 = 0.7891). Результатом є модель, що демонструє здатність до узагальнення, актуальну для малоресурсних мов. | |
| dc.format.pagerange | С. 303-307 | |
| dc.identifier.citation | Кашперова, С. В. Розпізнавання іменованих сутностей в українських текстах в умовах обмеженої розмітки / Кашперова С. В., Шаповал Н. В. // Системні науки та інформатика : збірка доповідей ІV науково-практичної конференції, [Київ], 1–5 грудня 2025 р. / Навчально-науковий Інститут прикладного системного аналізу КПІ ім. Ігоря Сікорського. – Київ, 2025. – С. 303-307. | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/77957 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.relation.ispartof | Системні науки та інформатика : збірка доповідей ІV науково-практичної конференції, 1–5 грудня 2025 року, м. Київ, Україна | |
| dc.subject | NER | |
| dc.subject | векторні подання токенів | |
| dc.subject | zero-shot та few-shot розпізнавання | |
| dc.subject | суміш експертів | |
| dc.subject | GoLU | |
| dc.subject | Sophia-G | |
| dc.subject | українська мова | |
| dc.title | Розпізнавання іменованих сутностей в українських текстах в умовах обмеженої розмітки | |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- sni2025_P-303-307.pdf
- Розмір:
- 986.82 KB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: