Comparison of automatic systems of terms’ extraction

dc.contributor.authorHavrylenko, Valeriia
dc.date.accessioned2023-05-11T08:21:26Z
dc.date.available2023-05-11T08:21:26Z
dc.date.issued2019
dc.description.abstractNowadays the processes of translation become more unified, and translators depend not only on their knowledge and sense of language, but also on various software, which facilitate the process of translation. The following article is devoted to one branch of such software, the systems of automatic extraction, which are an essential part in the process of lexicographic sources development of translation of text, which include a variety of terms. Consequently, the necessity to choose among the variety of different programs arose and the results of this research i.e. the comparison of functions of different programs, are described in our article. Several criteria, by which the quality of terms extraction can be measured, have been compared, e.g., the speed of extraction, the “purity” of the output list of terms, whether the extracted lexical material corresponded to the requirements to terms, the quality of irrelevant choices, extracted by automatic extraction systems, and the factors, influencing this quality, etc. The advantages and disadvantages of cloud and desktop services have been investigated and compared. It was noted that the main difficulty is that programs still are not able to distinguish between word forms, thus the texts that undergo the extraction process, require auxiliary procedures such as POS-marking, lemmatization and tokenization. The other obstacle was the inability of certain programs to distinguish between compound terms and simple word combinations. The key points of the research may be used in the course of translation studies, in researches devoted to “smart” or electronic lexicography and by translators in general as they may use these systems of terms extraction during the process of translation for the purpose of forming or unifying the required glossary.uk
dc.description.abstractotherПроцес перекладу стає дедалі більш уніфікованим і перекладачі мають покладатись не лише на власні знання і відчуття мови, а й на різноманітне програмне забезпечення, яке полегшує процес перекладу. В статті подаються результати дослідження однієї з галузей такого програмного забезпечення (ПЗ) – програм для автоматичного видобутку термінів – які є невід’ємною частиною процесу укладання лексикографічних джерел, а також перекладу текстів, насичених термінологічними одиницями. Наслідком такої різноманітності є необхідність порівняння різних типів програмного забезпечення з метою визначення їх переваг та недоліків. Проаналізовано критерії, за якими можна порівнювати програми автоматичного видобутку термінів: швидкість видобутку, «чистота» кінцевого списку термінів, відповідність відібраних одиниць критеріям термінологічності, якість і значення нерелевантних відборів та фактори, які впливають на якість відібраних одиниць. Були досліджені і порівняні переваги і недоліки десктопних програм і хмарних сервісів. Окремо було зазначено, що програми у більшості випадків не відрізняють словоформи, а тому тексти, які опрацьовуються, мають також проходити первинні процедури (а саме – POSмаркування, лематизацію і токенізацію). Також в статті обґрунтовується необхідність здійснення комплексного відбору, не лише автоматичними засобами, через нездатність ПЗ відрізняти складні термінологічні сполуки від простих словосполучень. Основні положення статті можуть бути використані під час перекладознавчих студій, в дослідженнях, присвячених «смарт» або електронній лексикографії, і спеціалістами-перекладачами в цілому, оскільки останні можуть використовувати системи автоматичного видобутку термінів для уніфікації робочих глосаріїв.uk
dc.format.pagerangePp. 29-33uk
dc.identifier.citationHavrylenko, V. Comparison of automatic systems of terms’ extraction / Valeriia Havrylenko // Advanced Linguistics. – 2019. – № 4. – Pр. 29-33. – Bibliogr.: 7 ref.uk
dc.identifier.doihttps://www.doi.org/10.20535/2617-5339.2019.4.189753
dc.identifier.orcid0000-0001-6873-093Xuk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/55553
dc.language.isoenuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.relation.ispartofAdvanced Linguistics 4 / 2019uk
dc.subjectterminologyuk
dc.subjectterms extractionuk
dc.subjectautomatic extraction systemsuk
dc.subjectextraction softwareuk
dc.subjectterms extraction softwareuk
dc.subjecttranslation of termsuk
dc.subjectтермінологіяuk
dc.subjectвидобуток термінівuk
dc.subjectавтоматичний видобуток термінівuk
dc.subjectПЗ для видобутку термінівuk
dc.subjectпереклад термінівuk
dc.subject.udc81.11’255.2:62uk
dc.titleComparison of automatic systems of terms’ extractionuk
dc.title.alternativeПорівняння автоматичних систем вилучення термінівuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
AL_2019_4_P29-33.pdf
Розмір:
373.1 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: