Queries structuring for solving grammar and lexical semantic problems by means of corpus tools
dc.contributor.author | Fokin, Serhii | |
dc.date.accessioned | 2023-05-11T08:16:31Z | |
dc.date.available | 2023-05-11T08:16:31Z | |
dc.date.issued | 2019 | |
dc.description.abstract | In spite of the rapid development of textual corpora along with that of the tools of processing them, many potential users are not fully aware of their utility for solving a wide range of text formulating problems. Beyond a quite straightforward strategy such as usage of asterisks and checking out collocations, the modern corpus tools are characterised by a high potential in solving also a wide range of semantic issues regarding grammar and vocabulary. Knowing the usage of search masks, part-of-speech, morphological and semantic tags are of great help in formulating pertinent queries. Although the semantic tagging in actual corpora is quite rare, it is a very promising feature; its application is still hindered by polysemy of semantic tags. Before being “translated” into a formal query language, a logical solution should be found on the basis of formal properties of linguistic signs by applying analysis of distributional (colligational and collocational) potentiality, substitution, calque, and morphological analysis. Substitution allows to extrapolate properties from one unit to another within the same semantic group; distribution offers the possibility to unveil several semantic components in the context, and, vice versa, to find out an expected lexeme by its hypothetical surrounding; calque is a powerful tool within the trial and error strategy for finding potential equivalents; analysis of frequency is helpful at the stage of results’ interpretation and evaluation of their reliability. Combination of these methods allows users to solve orthographic, punctuation, morphological, syntactic and lexical problems arising either in monolingual communication, translation or perform data mining. | uk |
dc.description.abstractother | Попри стрімкий розвиток корпусів текстів та знарядь для їхнього опрацювання, багато потенційних користувачів не повною мірою усвідомлюють і використовують потенціал корпусів у розв'язанні широкого кола проблем на етапі формулювання текстів. Окрім можливості доволі елементарного застосування (використання символу-зірочки замість пропущених символів або простої перевірки сполучуваності словоформ), сучасні корпуси характеризуються набором корисних функцій для розв’язання широкого кола і семантико-граматичних, і лексико-семантичних проблем. Вміння використовувати маски пошуку, частиномовну, морфологічну і семантичну розмітку може стати вартісною допомогою у формулювання запитів. На етапі перед формулюванням запиту необхідно знайти логічне розв’язання проблеми на основі формальних властивостей мовних знаків та аналізу дистрибуції (як колігації, так і колокації), субституції, кальки та морфологічного аналізу. Метод субституції дозволяє проводити екстраполяцію властивостей однієї одиниці на іншу одиницю з подібної семантичної групи; метод дистрибуції дає змогу виявляти окремі семантичні компоненти в контексті і, навпаки, віднаходити відповідну лексему за її оточенням; калька є цінним знаряддям стратегії спроб і помилок для пошуку потенційних еквівалентів у перекладі; аналіз частоти вживання корисний на етапі інтерпретації результатів та оцінювання їхньої достовірності. Поєднання зазначених методів дозволяє користувачеві розв’язувати орфографічні, пунктуаційні, морфологічні, синтаксичні і лексичні проблеми під час формулювання текстів як в одномовному спілкуванні, так і під час перекладу, а також здійснювати добування даних за допомогою корпусів. | uk |
dc.format.pagerange | Pp. 18-28 | uk |
dc.identifier.citation | Fokin, S. Queries structuring for solving grammar and lexical semantic problems by means of corpus tools / Serhii Fokin // Advanced Linguistics. – 2019. – № 4. – Pр. 18-28. – Bibliogr.: 25 ref. | uk |
dc.identifier.doi | https://www.doi.org/10.20535/2617-5339.2019.4.182393 | |
dc.identifier.orcid | 0000-0003-3920-1785 | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/55552 | |
dc.language.iso | en | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.relation.ispartof | Advanced Linguistics 4 / 2019 | uk |
dc.subject | textual corpora | uk |
dc.subject | semantic analysis | uk |
dc.subject | distribution | uk |
dc.subject | search mask | uk |
dc.subject | query language | uk |
dc.subject | data mining | uk |
dc.subject | корпус текстів | uk |
dc.subject | семантичний аналіз | uk |
dc.subject | дистрибуція | uk |
dc.subject | маска пошуку | uk |
dc.subject | мова запитів | uk |
dc.subject | добування даних | uk |
dc.subject.udc | 811.111’33 | uk |
dc.title | Queries structuring for solving grammar and lexical semantic problems by means of corpus tools | uk |
dc.title.alternative | Структурування запитів для розв’язання граматичних та лексикосемантичних проблем за допомогою корпусних інструментів | uk |
dc.type | Article | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- AL_2019_4_P18-28.pdf
- Розмір:
- 423.89 KB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: