Comparison of automatic systems of terms’ extraction
dc.contributor.author | Havrylenko, Valeriia | |
dc.date.accessioned | 2023-05-11T08:21:26Z | |
dc.date.available | 2023-05-11T08:21:26Z | |
dc.date.issued | 2019 | |
dc.description.abstract | Nowadays the processes of translation become more unified, and translators depend not only on their knowledge and sense of language, but also on various software, which facilitate the process of translation. The following article is devoted to one branch of such software, the systems of automatic extraction, which are an essential part in the process of lexicographic sources development of translation of text, which include a variety of terms. Consequently, the necessity to choose among the variety of different programs arose and the results of this research i.e. the comparison of functions of different programs, are described in our article. Several criteria, by which the quality of terms extraction can be measured, have been compared, e.g., the speed of extraction, the “purity” of the output list of terms, whether the extracted lexical material corresponded to the requirements to terms, the quality of irrelevant choices, extracted by automatic extraction systems, and the factors, influencing this quality, etc. The advantages and disadvantages of cloud and desktop services have been investigated and compared. It was noted that the main difficulty is that programs still are not able to distinguish between word forms, thus the texts that undergo the extraction process, require auxiliary procedures such as POS-marking, lemmatization and tokenization. The other obstacle was the inability of certain programs to distinguish between compound terms and simple word combinations. The key points of the research may be used in the course of translation studies, in researches devoted to “smart” or electronic lexicography and by translators in general as they may use these systems of terms extraction during the process of translation for the purpose of forming or unifying the required glossary. | uk |
dc.description.abstractother | Процес перекладу стає дедалі більш уніфікованим і перекладачі мають покладатись не лише на власні знання і відчуття мови, а й на різноманітне програмне забезпечення, яке полегшує процес перекладу. В статті подаються результати дослідження однієї з галузей такого програмного забезпечення (ПЗ) – програм для автоматичного видобутку термінів – які є невід’ємною частиною процесу укладання лексикографічних джерел, а також перекладу текстів, насичених термінологічними одиницями. Наслідком такої різноманітності є необхідність порівняння різних типів програмного забезпечення з метою визначення їх переваг та недоліків. Проаналізовано критерії, за якими можна порівнювати програми автоматичного видобутку термінів: швидкість видобутку, «чистота» кінцевого списку термінів, відповідність відібраних одиниць критеріям термінологічності, якість і значення нерелевантних відборів та фактори, які впливають на якість відібраних одиниць. Були досліджені і порівняні переваги і недоліки десктопних програм і хмарних сервісів. Окремо було зазначено, що програми у більшості випадків не відрізняють словоформи, а тому тексти, які опрацьовуються, мають також проходити первинні процедури (а саме – POSмаркування, лематизацію і токенізацію). Також в статті обґрунтовується необхідність здійснення комплексного відбору, не лише автоматичними засобами, через нездатність ПЗ відрізняти складні термінологічні сполуки від простих словосполучень. Основні положення статті можуть бути використані під час перекладознавчих студій, в дослідженнях, присвячених «смарт» або електронній лексикографії, і спеціалістами-перекладачами в цілому, оскільки останні можуть використовувати системи автоматичного видобутку термінів для уніфікації робочих глосаріїв. | uk |
dc.format.pagerange | Pp. 29-33 | uk |
dc.identifier.citation | Havrylenko, V. Comparison of automatic systems of terms’ extraction / Valeriia Havrylenko // Advanced Linguistics. – 2019. – № 4. – Pр. 29-33. – Bibliogr.: 7 ref. | uk |
dc.identifier.doi | https://www.doi.org/10.20535/2617-5339.2019.4.189753 | |
dc.identifier.orcid | 0000-0001-6873-093X | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/55553 | |
dc.language.iso | en | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.relation.ispartof | Advanced Linguistics 4 / 2019 | uk |
dc.subject | terminology | uk |
dc.subject | terms extraction | uk |
dc.subject | automatic extraction systems | uk |
dc.subject | extraction software | uk |
dc.subject | terms extraction software | uk |
dc.subject | translation of terms | uk |
dc.subject | термінологія | uk |
dc.subject | видобуток термінів | uk |
dc.subject | автоматичний видобуток термінів | uk |
dc.subject | ПЗ для видобутку термінів | uk |
dc.subject | переклад термінів | uk |
dc.subject.udc | 81.11’255.2:62 | uk |
dc.title | Comparison of automatic systems of terms’ extraction | uk |
dc.title.alternative | Порівняння автоматичних систем вилучення термінів | uk |
dc.type | Article | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- AL_2019_4_P29-33.pdf
- Розмір:
- 373.1 KB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: