Алгоритмічно-програмний метод датування англомовного тексту з використанням трансформерних нейронних мереж
| dc.contributor.advisor | Олещенко, Любов Михайлівна | |
| dc.contributor.author | Литвин, Михайло Олегович | |
| dc.date.accessioned | 2025-10-16T08:54:22Z | |
| dc.date.available | 2025-10-16T08:54:22Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Працюючи в таких сферах, як історія, лінгвістика, літературознавство тощо фахівці часто стикаються з задачею визначення дати написання тексту. Часто ця задача потребує значних зусиль та експертних навичок. Виникає потреба у розробленні програмного забезпечення, що зможе автоматизовано датувати текст з високою точністю. Трансформерні нейронні мережі добре пристосовані для різних задач обробки природнього мовлення, і тому підходять для цієї задачі. У магістерській дисертації представлено алгоритмічно-програмний метод, який включає збирання навчального набору даних та тонке налаштування попередньо навчених на великих корпусах текстів трансформерних нейронних мереж для задачі класифікації текстів за десятиліттями. Наведено результати точності передбачень, а також рекомендації для подальшого вдосконалення методу. Для програмної реалізації методу було використано мову програмування Python, фреймворк FastAPI, бібліотеки PyTorch, Transformers та tkinter. Згідно з отриманими результатами дослідження, використання запропонованого методу дозволяє визначати приблизне десятиліття написання англомовного тексту з точністю 86% та похибкою до 30ти років на часовому проміжку XIV-XX ст. | |
| dc.description.abstractother | Professionals working in fields such as history, linguistics, and literary studies often face the task of determining the date a text was written. This task frequently requires considerable effort and expert skills. Therefore, there is a need to develop software capable of automatically dating texts with high accuracy. Transformer neural networks are well-suited for various natural language processing tasks, making them appropriate for this challenge. This master's thesis presents an algorithmic and software method that includes collecting a training dataset and fine-tuning pre-trained transformer neural networks—originally trained on large text corpora—for the task of classifying texts by decade. The thesis provides the results of prediction accuracy and offers recommendations for further improvement of the method. For the software implementation, Python was used along with the FastAPI framework, and the PyTorch, Transformers, and tkinter libraries. According to the research results, the proposed method makes it possible to estimate the approximate decade in which an English-language text was written with an accuracy of 86% and an error margin of up to 30 years over the time span from the 14th to the 20th century. | |
| dc.format.extent | 153 с. | |
| dc.identifier.citation | Литвин, М. О. Алгоритмічно-програмний метод датування англомовного тексту з використанням трансформерних нейронних мереж : магістерська дис. : 121 Інженерія програмного забезпечення / Литвин Михайло Олегович. – Київ, 2025. – 153 с. | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/76892 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.subject | інженерія програмного забезпечення | |
| dc.subject | алгоритмічнопрограмний метод | |
| dc.subject | програмна обробка природнього мовлення (NLP) | |
| dc.subject | машинне навчання | |
| dc.subject | трансформерні нейронні мережі (TNN) | |
| dc.subject | передавальне навчання | |
| dc.subject | BERT | |
| dc.subject | датування тексту | |
| dc.subject.udc | 004.934.2 | |
| dc.title | Алгоритмічно-програмний метод датування англомовного тексту з використанням трансформерних нейронних мереж | |
| dc.type | Master Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Lytvyn_magistr.pdf
- Розмір:
- 3.17 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: