Алгоритмічно-програмний метод датування англомовного тексту з використанням трансформерних нейронних мереж

Вантажиться...
Ескіз

Дата

2025

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Працюючи в таких сферах, як історія, лінгвістика, літературознавство тощо фахівці часто стикаються з задачею визначення дати написання тексту. Часто ця задача потребує значних зусиль та експертних навичок. Виникає потреба у розробленні програмного забезпечення, що зможе автоматизовано датувати текст з високою точністю. Трансформерні нейронні мережі добре пристосовані для різних задач обробки природнього мовлення, і тому підходять для цієї задачі. У магістерській дисертації представлено алгоритмічно-програмний метод, який включає збирання навчального набору даних та тонке налаштування попередньо навчених на великих корпусах текстів трансформерних нейронних мереж для задачі класифікації текстів за десятиліттями. Наведено результати точності передбачень, а також рекомендації для подальшого вдосконалення методу. Для програмної реалізації методу було використано мову програмування Python, фреймворк FastAPI, бібліотеки PyTorch, Transformers та tkinter. Згідно з отриманими результатами дослідження, використання запропонованого методу дозволяє визначати приблизне десятиліття написання англомовного тексту з точністю 86% та похибкою до 30ти років на часовому проміжку XIV-XX ст.

Опис

Ключові слова

інженерія програмного забезпечення, алгоритмічнопрограмний метод, програмна обробка природнього мовлення (NLP), машинне навчання, трансформерні нейронні мережі (TNN), передавальне навчання, BERT, датування тексту

Бібліографічний опис

Литвин, М. О. Алгоритмічно-програмний метод датування англомовного тексту з використанням трансформерних нейронних мереж : магістерська дис. : 121 Інженерія програмного забезпечення / Литвин Михайло Олегович. – Київ, 2025. – 153 с.

ORCID

DOI