Система мультимодального текстового пошуку

dc.contributor.advisorІгнатенко, Олексій Петрович
dc.contributor.authorШевченко, Тарас Петрович
dc.date.accessioned2018-07-06T09:29:22Z
dc.date.available2018-07-06T09:29:22Z
dc.date.issued2018
dc.description.abstractenMaster’s thesis: 93 p., 11 fig., 32 tabl., 40 sources and 2 appendices. Over the last two centuries, mankind increases data volumes all around the world. This process increases requirements on speed and quality of search engines. Serious research around search engines started since 1954. In this years has been introduced the first Vector Space model. In 2013 Google announced “Word2Vec” model which is a de-facto standard in Vector Space representation of words. The task is to devel multimodal text search system for search relevance evaluation. In this work were implemented and examined methods of Multimodal Information Retrieval compared different algorithms for spatial retrieval, frequency counting, and topic modeling. The object is text search systems. The subject is multimodal text search systems. Results: - implemented multimodal text search system, which is based on asynchronous model; - implemented disk-based spatial retrieval; - generic implementation of document storage and retrieval. Results of this work are applicable for as a search engine for Internet-stores, catalogs, informational websites, filesystems and everywhere, where there is need in high qulity search. In the future it is useful to increase the number of ranking factors and extend existing language for working with data and retrieval operations.uk
dc.description.abstractukМагістерська дисертація: 93 ст., 11 рис., 32 табл., 40 джерел та 2 додатки. Протягом останніх двох століть людство експотенційно накопичує об’єми текстових даних. Зростання об’ємів накопичених документів ставить нові вимоги до швидкості та якості пошуку. З 1954-го року проводяться дослідженні в області семантичного аналізу текстів. Новітні результати у даній області ведуться шляхом покращення моделі “Word2Vec”, анонсовоної компанією Google у 2013-му році. Метою даної роботи є розробка системи мультимодального текстового пошуку. У роботі проаналізовано методи вирішення задачі обробки текстів, побудови векторного простору для врахування семантики слів, також розглянуто задачі знаходження тем документу на основі багатьох модальностей. Об’єктом дослідження є системи текстового пошуку, предметом дослідження - системи мультимодального пошуку та їх компоненти. Деякі результати даної роботи опубліковано на міжнародній конференції “ICTERI 2018”. Результати роботи: - реалізовано систему мультимодального текстового пошуку; - реалізовано методи пошуку у баготовимірних розріджених просторах; - вдосконалено існуючі алгоритми текстового пошуку. Результати даної роботи рекомендовано до використання у пошуку по Інтернет-магазинах, каталогах продукції, інформаційних веб-сайтах, файлових системах, користувацьких повідомленнях. Проведено вимірювання, перевірено гіпотези, що підтверджують практичну значимість результатів та можливості їхнього застосування. При подальшому розвитку системи доцільно додати нові методи оцінки релевантності документів, а також створити більш гнучку мову для керування даними.uk
dc.format.page93 с.uk
dc.identifier.citationШевченко, Т. П. Система мультимодального текстового пошуку : магістерська дис. : 124 Системний аналіз / Шевченко Тарас Петрович. – Київ, 2018. – 93 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/23800
dc.language.isoukuk
dc.publisher.placeКиївuk
dc.subjectмультимодальний текстовий пошукuk
dc.subjectінформаційний пошукuk
dc.subjectмашинне навчанняuk
dc.subjectповнотекстовий пошукuk
dc.subjectokapi-BM25uk
dc.subjectEM-алгоритмuk
dc.subjectймовірнісний висновокuk
dc.subjectсемантичний аналіз текстівuk
dc.subjectmultimodal information retrievaluk
dc.subjectinformation retrievauk
dc.subjectmachine learninguk
dc.subjectfull-text searchuk
dc.subjectprobabilistic inferenceuk
dc.subjectsemantic text analysisuk
dc.subjectokapi-BM25uk
dc.subjectEM-algorithmsuk
dc.subject.udc51-74uk
dc.titleСистема мультимодального текстового пошукуuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Shevchenko_magistr.pdf
Розмір:
906.96 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
7.74 KB
Формат:
Item-specific license agreed upon to submission
Опис: