Алгоритмічно-програмний метод датування англомовного тексту з використанням трансформерних нейронних мереж
Вантажиться...
Дата
2025
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Працюючи в таких сферах, як історія, лінгвістика, літературознавство тощо фахівці часто стикаються з задачею визначення дати написання тексту. Часто ця задача потребує значних зусиль та експертних навичок. Виникає потреба у розробленні програмного забезпечення, що зможе автоматизовано датувати текст з високою точністю. Трансформерні нейронні мережі добре пристосовані для різних задач обробки природнього мовлення, і тому підходять для цієї задачі.
У магістерській дисертації представлено алгоритмічно-програмний метод, який включає збирання навчального набору даних та тонке налаштування попередньо навчених на великих корпусах текстів трансформерних нейронних мереж для задачі класифікації текстів за десятиліттями. Наведено результати точності передбачень, а також рекомендації для подальшого вдосконалення методу.
Для програмної реалізації методу було використано мову програмування Python, фреймворк FastAPI, бібліотеки PyTorch, Transformers та tkinter. Згідно з отриманими результатами дослідження, використання запропонованого методу дозволяє визначати приблизне десятиліття написання англомовного тексту з точністю 86% та похибкою до 30ти років на часовому проміжку XIV-XX ст.
Опис
Ключові слова
інженерія програмного забезпечення, алгоритмічнопрограмний метод, програмна обробка природнього мовлення (NLP), машинне навчання, трансформерні нейронні мережі (TNN), передавальне навчання, BERT, датування тексту
Бібліографічний опис
Литвин, М. О. Алгоритмічно-програмний метод датування англомовного тексту з використанням трансформерних нейронних мереж : магістерська дис. : 121 Інженерія програмного забезпечення / Литвин Михайло Олегович. – Київ, 2025. – 153 с.