Аналіз впливу машинного перекладу на метрики анотування текстів

dc.contributor.advisorПишнограєв, Іван Олександрович
dc.contributor.authorДумайло, Тарас Михайлович
dc.date.accessioned2025-09-10T14:17:03Z
dc.date.available2025-09-10T14:17:03Z
dc.date.issued2025
dc.description.abstractДипломна робота: 86 стор., 10 рис., 8 табл., 18 посилань, 2 додатки. У роботі досліджується вплив машинного перекладу на якість автоматичного анотування текстів за допомогою сучасних нейронних моделей. Основну увагу приділено оцінці змін у результатах сумаризації після перекладу текстів з англійської на українську мову та навпаки. Для аналізу використовуються різні метрики якості — ROUGE, BLEU, BERTScore та інші. Побудовано експериментальний пайплайн, що включає збір даних, автоматичне узагальнення текстів, машинний переклад, а також обчислення метрик та візуалізацію результатів. Об’єктом дослідження є процес автоматичного анотування текстів у контексті багатомовного середовища. Предметом дослідження виступає зміна метрик якості сумаризації в результаті застосування машинного перекладу. Актуальність роботи зумовлена широким використанням автоматичних систем обробки текстів у багатомовних інформаційних середовищах, де якість узагальнень може значно залежати від проміжного перекладу. Проаналізовано вплив типових систем машинного перекладу на результати сумаризації, зокрема на лексичні та семантичні відповідності між оригінальними й перекладеними текстами. Показано, як різні метрики реагують на перекладні зміни та які моделі виявляються найбільш стійкими до таких змін. Робота робить внесок у розуміння впливу мовної трансформації на автоматичну обробку текстів та відкриває перспективи для підвищення точності багатомовних NLP-систем.
dc.description.abstractotherThesis: 86 pages, 10 figures, 8 tables, 18 references, 2 appendices. This thesis explores the impact of machine translation on the quality of automatic text annotation using modern neural models. The main focus is on evaluating changes in summarization results after translation texts from English to Ukrainian and vice versa. Various quality metrics — ROUGE, BLEU, BERTScore, and others — are used for analysis. An experimental pipeline is developed, including data collection, automatic summarization, machine translation, metric computation, and result visualization. The object of the research is the process of automatic text annotation in a multilingual context. The subject of the research is variation in quality metrics summarization resulting from use of machine translation. The urgency of this research arises from the widespread application of automatic text processing systems in multilingual digital environments, where the quality of summaries can be significantly affected by intermediate translation. The impact of typical machine translation systems on summarization results, in particular on lexical and semantic correspondence between original and translated texts, is analyzed. How different metrics respond to translation-induced changes and which models are most resilient to such transformations is demonstrated in this thesis. This research contributes to a better understanding of the effects of language transformation on automatic text processing and introduces prospects for improving the accuracy of multilingual NLP systems.
dc.format.extent86 с.
dc.identifier.citationДумайло, Т. М. Аналіз впливу машинного перекладу на метрики анотування текстів : дипломна робота … бакалавра : 122 Комп'ютерні науки / Думайло Тарас Михайлович. – Київ, 2025. – 86 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/75925
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectмашинний переклад
dc.subjectанотування текстів
dc.subjectметрики якості
dc.subjectсумаризація
dc.subjectнейронні моделі
dc.titleАналіз впливу машинного перекладу на метрики анотування текстів
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Dumailo_bakalavr.pdf
Розмір:
2.11 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: