Метод системної інженерії систем нейронного машинного перекладу

dc.contributor.authorМаслянко, П. П.
dc.contributor.authorСєльський, Є. П.
dc.date.accessioned2023-08-09T06:47:13Z
dc.date.available2023-08-09T06:47:13Z
dc.date.issued2021
dc.description.abstractПроблематика. На ринку існує не так багато компаній-розробників систем машинного перекладу (СМП), продукти яких користуються попитом. Це, наприклад, “GoogleTranslate”, “DeepLTranslator”, “ModernMT”, “Apertium”, “Trident” тощо. Існує потреба в упорядкованих і систематизованих методів розроблення СМП, а також потрібні науково обґрунтовані методи інженерії систем нейронного машинного перекладу (СНМП), щоб якнайшвидше отримати якісний і конкурентоспроможний продукт. Мета дослідження. Застосувати бізнес-профіль Еріксона–Пенкера для розроблення та формалізації методу системної інженерії СНМП. Методика реалізації. Методологія системної інженерії і бізнес-профіль Еріксона–Пенкера для формалізації впорядкованого способу розроблення СНМП. Результати дослідження. Метод розроблення СНМП на основі застосування технік системної інженерії складається з трьох основних етапів. На першому етапі структуру СНМП моделюють як бізнес-профіль Еріксона–Пенкера, на другому – визначають множину процесів, характерну для класу систем Data Science та міжнародного стандарту CRISP-DM, а на третьому проводять верифікацію та валідацію розробленої СНМП. Висновки. Запропоновано метод системної інженерії СНМП, що базується на модифікованому бізнес-профілі Еріксона–Пенкера представлення системи на метарівні, а також міжнародних стандартів процесів DataScience та DataMining. Досліджено ефективність застосування методу на прикладі розроблення системи двоспрямованого англійсько-українського нейронного машинного перекладу EUMT (English-Ukrainian Machine Translator) і встановлено, що система EUMT щонайменше не поступається за якістю англійсько-українського перекладу популярному перекладачеві “GoogleTranslate”. Повний код версії системи EUMT опублікований на платформі GitHub та доступний за посиланням: https://github.com/EugeneSel/EUMT.uk
dc.description.abstractotherПроблематика. На рынке существует не так много компаний-разработчиков систем машинного перевода (СМП), продукты которых пользуются спросом. Это, например, “GoogleTranslate”, “DeepLTranslator”, “ModernMT”, “Apertium”, “Trident” и другие. Существует потребность в упорядоченных и систематизированных методах разработки СМП, а также нужны научно обоснованные методы инженерии систем нейронного машинного перевода (СНМП), чтобы как можно быстрее получить качественный и конкурентоспособный продукт. Цель исследования. Применить бизнес-профиль Эриксона–Пенкера для разработки и формализации метода системной инженерии СНМП. Методика реализации. Методология системной инженерии и бизнес-профиль Эриксона–Пенкера для формализации упорядоченного способа разработки СНМП. Результаты исследования. Метод разработки СНМП на основе применения техник системной инженерии состоит из трех основных этапов. На первом этапе структуру СНМП моделируют в виде бизнес-профиля Эриксона–Пенкера; на втором – определяют множество процессов, характерное для класса систем Data Science и международного стандарта CRISP-DM, а на третьем проводят верификацию и валидацию разработанной СНМП. Выводы. Предложен метод системной инженерии СНМП, основанный на модифицированном бизнес-профиле Эриксона– Пенкера представления системы на метауровне, а также международных стандартов процессов Data Science и Data Mining. Ис следована эффективность применения метода на примере разработки системы двунаправленного англо-украинского НМП EUMT (English-Ukrainian Machine Translator) и установлено, что система EUMT по меньшей мере не уступает по качеству англо-украинского перевода популярному переводчику “GoogleTranslate”. Полный код версии системы EUMT опубликован на платформе GitHub и доступен по ссылке: https://github.com/EugeneSel/EUMT.uk
dc.description.abstractotherBackground. There are not many machine translation companies on the market whose products are in demand. These are, for example, free and commercial products such as “GoogleTranslate”, “DeepLTranslator”, “ModernMT”, “Apertium”, “Trident”, to name a few. To implement a more efficient and productive process for developing high-quality neural machine translation systems (NMTS), appropriate scientifically based methods of NMTS engineering are needed in order to get a high-quality and competitive product as quickly as possible. Objective. The purpose of this article is to apply the Eriksson-Penker business profile to the development and formalization of a method for system engineering of NMTS. Methods. The idea behind the neural machine translation system engineering method is to apply the Eriksson-Penker system engineering methodology and business profile to formalize an ordered way to develop NMT systems. Results. The method of developing NMT systems based on the use of system engineering techniques consists of three main stages. At the first stage, the structure of the NMT system is modelled in the form of an Eriksson-Penker business profile. At the second stage, a set of processes is determined that is specific to the class of Data Science systems, and the international CRISP-DM standard. At the third stage, verification and validation of the developed NMTS is carried out. Conclusions. The article proposes a method of system engineering of NMTS based on the modified Erickson-Penker business profile representation of the system at the meta-level, as well as international process standards of Data Science and Data Mining. The effectiveness of using this method was studied on the example of developing a bidirectional English-Ukrainian NMTS EUMT (Eng lish-Ukrainian Machine Translator) and it was found that the EUMT system is at least as good as the quality of English-Ukrainian transla tion of the popular Google Translate translator. The full version code of the EUMT system is published on the GitHub platform and is available at: https://github.com/EugeneSel/EUMT.uk
dc.format.pagerangePp. 46-55uk
dc.identifier.citationМаслянко, П. П. Метод системної інженерії систем нейронного машинного перекладу / П. П. Маслянко, Є. П. Сєльський // Наукові вісті КПІ : міжнародний науково-технічний журнал. – 2021. – № 2(132). – С. 46–55. – Бібліогр.: 19 назв.uk
dc.identifier.doihttps://doi.org/10.20535/kpisn.2021.2.236939
dc.identifier.orcid0000-0003-4001-7811uk
dc.identifier.orcid0000-0003-4930-8009uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/59046
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.relation.ispartofНаукові вісті КПІ: міжнародний науково-технічний журнал, № 2(132)uk
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectметодuk
dc.subjectсистема нейронного машинного перекладуuk
dc.subjectсистемна інженеріяuk
dc.subjectметод Еріксона–Пенкераuk
dc.subjectсистема нейронного машинного переводаuk
dc.subjectсистемная инженерияuk
dc.subjectметод Эриксона–Пенкераuk
dc.subjectmethoduk
dc.subjectneural machine translation systemuk
dc.subjectsystem engineeringuk
dc.subjectEriksson-Penker methoduk
dc.subject.udc007: 658.5uk
dc.titleМетод системної інженерії систем нейронного машинного перекладуuk
dc.title.alternativeМетод системной инженерии систем нейронного машинного переводаuk
dc.title.alternativeMethod of system engineering of neural machine translation systemsuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
236939-549328-1-10-20210830.pdf
Розмір:
820.3 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
1.71 KB
Формат:
Item-specific license agreed upon to submission
Опис: