Методи виявлення образ в коротких текстах

dc.contributor.advisorДорогий, Ярослав Юрійович
dc.contributor.authorПопко, Андрій Валентинович
dc.date.accessioned2018-05-22T09:05:10Z
dc.date.available2018-05-22T09:05:10Z
dc.date.issued2018
dc.description.abstractМагістерська дисертація на тему “Методи виявлення образ в коротких текстах”: 132 ст., 23 рис., 25 табл., 2 додатки, 37 джерел. Об’єктом дослідження виступає процес бінарної класифікації коротких текстів. Предметом дослідження являються методи та засоби штучного інтелекту, що застосовуються в даній сфері. Метою дисертації являється пошук рішення для можливості бінарної класифікації коротких текстів за наявністю в них образ, а також її дослідження та вибір засобів покращення, що дозволять отримати кращу математичну модель. В ній розглянуто питання вибору математичних засобів для рішення задачі ідентифікації коротких текстів як образливих та реалізації програмного модулю по моделі. Досліджено декілька варіантів моделі. На практиці доведена дієздатність дослідженого методу, що дозволяє отримати високі якісні показники в класифікації. Методи та підходи, що досліджуються, відносяться до методів машинного навчання по прецедентам. Розроблено додаток на основі математичної моделі на мові Python з використанням бібліотек. Отримана базова система має потенціал для розвитку та може застосовуватись у сфер і адміністрування сайтів, веб-ресурсів, бути частиною інших комерційних продуктів, де необхідно піклуватись про ввічливість спілкування в переписках. На основі результатів було розроблено базовий план для стартап-проекту. Прогнозні припущення про розвиток дослідження – комбінація з іншими методами машинного навчання та аналізу даних.uk
dc.description.abstractenMaster's dissertation on the theme "Methods of revealing image in short texts": 132 pages, 23 figures, 25 tables, 2 appendices, 37 sources. The object of research is the process of binary classification of short texts. The subject of the study is the methods and means of artificial intelligence used in this field. modernization and search solution for the possibility of binary classification of short texts The purpose of the dissertation is to find a solution for the possibility of binary classification of short texts on insults presence, its investigation and the choice of means of improvement, which will allow to obtain a better mathematical model. It discusses the choice of mathematical tools for solving the problem of identifying short texts as offensive and implementing a program module by model. Several variant s of the model have been explored. In practice, the feasibility of the investigated method is proved, which allows obtaining high qualitative indicators in the classification. The methods and approaches being studied relate to the methods of machine learning by precedents. The application is developed on the basis of a mathematical model in Python using libraries. The resulting base system has the potential for development and can be applied in the area of administration of sites, web resources, to be a part of other commercial products, where it is necessary to care about the courtesy of communication in the correspondence. Based on the results, a baseline for the startup project was developed. Foreseeable assumptions about the development of the study are combination of other methods of machine learning and methods of data analysis.uk
dc.description.abstractruМагистерская диссертация содержит описание выбора математической модели для решения задачи классификации коротких текстов на наличие в них оскорблений. В работе кратко описано исследование методов их обнаружения. Предложенная улучшенная модель классификации с описанием усовершенствований, улучшающих эффективность ее работы.uk
dc.format.page133 с.uk
dc.identifier.citationПопко, А. В. Методи виявлення образ в коротких текстах : магістерська дис. : 151 Автоматизація та комп’ютерно-інтегровані технології / Попко Андрій Валентинович. – Київ, 2018. – 133 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/23001
dc.language.isoukuk
dc.publisher.placeКиївuk
dc.subjectкласифікація текстівuk
dc.subjectмашинне навчанняuk
dc.subjectметоди машинного навчанняuk
dc.subjectмашинне навчання за прецедентамиuk
dc.subjectclassification of textsuk
dc.subjectmachine learninguk
dc.subjectmachine learning methodsuk
dc.subjectmachine training by precedentsuk
dc.subject.udc004.855.5uk
dc.titleМетоди виявлення образ в коротких текстахuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Popko_magistr.pdf
Розмір:
1.7 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
7.74 KB
Формат:
Item-specific license agreed upon to submission
Опис: