Queries structuring for solving grammar and lexical semantic problems by means of corpus tools

dc.contributor.authorFokin, Serhii
dc.date.accessioned2023-05-11T08:16:31Z
dc.date.available2023-05-11T08:16:31Z
dc.date.issued2019
dc.description.abstractIn spite of the rapid development of textual corpora along with that of the tools of processing them, many potential users are not fully aware of their utility for solving a wide range of text formulating problems. Beyond a quite straightforward strategy such as usage of asterisks and checking out collocations, the modern corpus tools are characterised by a high potential in solving also a wide range of semantic issues regarding grammar and vocabulary. Knowing the usage of search masks, part-of-speech, morphological and semantic tags are of great help in formulating pertinent queries. Although the semantic tagging in actual corpora is quite rare, it is a very promising feature; its application is still hindered by polysemy of semantic tags. Before being “translated” into a formal query language, a logical solution should be found on the basis of formal properties of linguistic signs by applying analysis of distributional (colligational and collocational) potentiality, substitution, calque, and morphological analysis. Substitution allows to extrapolate properties from one unit to another within the same semantic group; distribution offers the possibility to unveil several semantic components in the context, and, vice versa, to find out an expected lexeme by its hypothetical surrounding; calque is a powerful tool within the trial and error strategy for finding potential equivalents; analysis of frequency is helpful at the stage of results’ interpretation and evaluation of their reliability. Combination of these methods allows users to solve orthographic, punctuation, morphological, syntactic and lexical problems arising either in monolingual communication, translation or perform data mining.uk
dc.description.abstractotherПопри стрімкий розвиток корпусів текстів та знарядь для їхнього опрацювання, багато потенційних користувачів не повною мірою усвідомлюють і використовують потенціал корпусів у розв'язанні широкого кола проблем на етапі формулювання текстів. Окрім можливості доволі елементарного застосування (використання символу-зірочки замість пропущених символів або простої перевірки сполучуваності словоформ), сучасні корпуси характеризуються набором корисних функцій для розв’язання широкого кола і семантико-граматичних, і лексико-семантичних проблем. Вміння використовувати маски пошуку, частиномовну, морфологічну і семантичну розмітку може стати вартісною допомогою у формулювання запитів. На етапі перед формулюванням запиту необхідно знайти логічне розв’язання проблеми на основі формальних властивостей мовних знаків та аналізу дистрибуції (як колігації, так і колокації), субституції, кальки та морфологічного аналізу. Метод субституції дозволяє проводити екстраполяцію властивостей однієї одиниці на іншу одиницю з подібної семантичної групи; метод дистрибуції дає змогу виявляти окремі семантичні компоненти в контексті і, навпаки, віднаходити відповідну лексему за її оточенням; калька є цінним знаряддям стратегії спроб і помилок для пошуку потенційних еквівалентів у перекладі; аналіз частоти вживання корисний на етапі інтерпретації результатів та оцінювання їхньої достовірності. Поєднання зазначених методів дозволяє користувачеві розв’язувати орфографічні, пунктуаційні, морфологічні, синтаксичні і лексичні проблеми під час формулювання текстів як в одномовному спілкуванні, так і під час перекладу, а також здійснювати добування даних за допомогою корпусів.uk
dc.format.pagerangePp. 18-28uk
dc.identifier.citationFokin, S. Queries structuring for solving grammar and lexical semantic problems by means of corpus tools / Serhii Fokin // Advanced Linguistics. – 2019. – № 4. – Pр. 18-28. – Bibliogr.: 25 ref.uk
dc.identifier.doihttps://www.doi.org/10.20535/2617-5339.2019.4.182393
dc.identifier.orcid0000-0003-3920-1785uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/55552
dc.language.isoenuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.relation.ispartofAdvanced Linguistics 4 / 2019uk
dc.subjecttextual corporauk
dc.subjectsemantic analysisuk
dc.subjectdistributionuk
dc.subjectsearch maskuk
dc.subjectquery languageuk
dc.subjectdata mininguk
dc.subjectкорпус текстівuk
dc.subjectсемантичний аналізuk
dc.subjectдистрибуціяuk
dc.subjectмаска пошукуuk
dc.subjectмова запитівuk
dc.subjectдобування данихuk
dc.subject.udc811.111’33uk
dc.titleQueries structuring for solving grammar and lexical semantic problems by means of corpus toolsuk
dc.title.alternativeСтруктурування запитів для розв’язання граматичних та лексикосемантичних проблем за допомогою корпусних інструментівuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
AL_2019_4_P18-28.pdf
Розмір:
423.89 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: