Система мультимодального текстового пошуку
dc.contributor.advisor | Ігнатенко, Олексій Петрович | |
dc.contributor.author | Шевченко, Тарас Петрович | |
dc.date.accessioned | 2018-07-06T09:29:22Z | |
dc.date.available | 2018-07-06T09:29:22Z | |
dc.date.issued | 2018 | |
dc.description.abstracten | Master’s thesis: 93 p., 11 fig., 32 tabl., 40 sources and 2 appendices. Over the last two centuries, mankind increases data volumes all around the world. This process increases requirements on speed and quality of search engines. Serious research around search engines started since 1954. In this years has been introduced the first Vector Space model. In 2013 Google announced “Word2Vec” model which is a de-facto standard in Vector Space representation of words. The task is to devel multimodal text search system for search relevance evaluation. In this work were implemented and examined methods of Multimodal Information Retrieval compared different algorithms for spatial retrieval, frequency counting, and topic modeling. The object is text search systems. The subject is multimodal text search systems. Results: - implemented multimodal text search system, which is based on asynchronous model; - implemented disk-based spatial retrieval; - generic implementation of document storage and retrieval. Results of this work are applicable for as a search engine for Internet-stores, catalogs, informational websites, filesystems and everywhere, where there is need in high qulity search. In the future it is useful to increase the number of ranking factors and extend existing language for working with data and retrieval operations. | uk |
dc.description.abstractuk | Магістерська дисертація: 93 ст., 11 рис., 32 табл., 40 джерел та 2 додатки. Протягом останніх двох століть людство експотенційно накопичує об’єми текстових даних. Зростання об’ємів накопичених документів ставить нові вимоги до швидкості та якості пошуку. З 1954-го року проводяться дослідженні в області семантичного аналізу текстів. Новітні результати у даній області ведуться шляхом покращення моделі “Word2Vec”, анонсовоної компанією Google у 2013-му році. Метою даної роботи є розробка системи мультимодального текстового пошуку. У роботі проаналізовано методи вирішення задачі обробки текстів, побудови векторного простору для врахування семантики слів, також розглянуто задачі знаходження тем документу на основі багатьох модальностей. Об’єктом дослідження є системи текстового пошуку, предметом дослідження - системи мультимодального пошуку та їх компоненти. Деякі результати даної роботи опубліковано на міжнародній конференції “ICTERI 2018”. Результати роботи: - реалізовано систему мультимодального текстового пошуку; - реалізовано методи пошуку у баготовимірних розріджених просторах; - вдосконалено існуючі алгоритми текстового пошуку. Результати даної роботи рекомендовано до використання у пошуку по Інтернет-магазинах, каталогах продукції, інформаційних веб-сайтах, файлових системах, користувацьких повідомленнях. Проведено вимірювання, перевірено гіпотези, що підтверджують практичну значимість результатів та можливості їхнього застосування. При подальшому розвитку системи доцільно додати нові методи оцінки релевантності документів, а також створити більш гнучку мову для керування даними. | uk |
dc.format.page | 93 с. | uk |
dc.identifier.citation | Шевченко, Т. П. Система мультимодального текстового пошуку : магістерська дис. : 124 Системний аналіз / Шевченко Тарас Петрович. – Київ, 2018. – 93 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/23800 | |
dc.language.iso | uk | uk |
dc.publisher.place | Київ | uk |
dc.subject | мультимодальний текстовий пошук | uk |
dc.subject | інформаційний пошук | uk |
dc.subject | машинне навчання | uk |
dc.subject | повнотекстовий пошук | uk |
dc.subject | okapi-BM25 | uk |
dc.subject | EM-алгоритм | uk |
dc.subject | ймовірнісний висновок | uk |
dc.subject | семантичний аналіз текстів | uk |
dc.subject | multimodal information retrieval | uk |
dc.subject | information retrieva | uk |
dc.subject | machine learning | uk |
dc.subject | full-text search | uk |
dc.subject | probabilistic inference | uk |
dc.subject | semantic text analysis | uk |
dc.subject | okapi-BM25 | uk |
dc.subject | EM-algorithms | uk |
dc.subject.udc | 51-74 | uk |
dc.title | Система мультимодального текстового пошуку | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Shevchenko_magistr.pdf
- Розмір:
- 906.96 KB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 7.74 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: