Using Stochastic Automaton for Data Consolidation

dc.contributor.authorKoval, O. V.
dc.contributor.authorKuzminykh, V. A.
dc.contributor.authorKhaustov, D. V.
dc.contributor.authorКоваль, Олександр Васильович
dc.contributor.authorКузьміних, Валерій Олександрович
dc.contributor.authorХаустов, Дмитро Вікторович
dc.contributor.authorКоваль, Александр Васильевич
dc.contributor.authorКузьминых, Валерий Александрович
dc.contributor.authorХаустов, Дмитрий Викторович
dc.date.accessioned2018-08-21T09:14:26Z
dc.date.available2018-08-21T09:14:26Z
dc.date.issued2017
dc.description.abstractenBackground. Development of methods and algorithms for efficient search of relevant information on demand. The article deals with the consolidation of data for subsequent use in the information and analytical systems. Objective. The aim of the paper is to identify capabilities and build relevant information search algorithms from disparate sources by analyzing the probability information identifying the possible presence of relevant documents in these sources. Methods. To find the relevant information for search queries the approach based on the use of probability estimates of relevant documents available in the sources of further increasing the number of selected documents from these sources to analyze their relevance to the query is used. Results. A stochastic programmable automaton structure to ensure selection of the most possible information sources by relevance parameters and information retrieval algorithm based on the use of stochastic automaton were developed. Conclusions. The described algorithm using stochastic automaton for data consolidation allows developing a set of software tools, provides plenty full and holistic data consolidation problem-solving for diverse systems which search for information from information sources different in composition and presentation type.uk
dc.description.abstractruПроблематика. Разработка методов и алгоритмов эффективного поиска релевантной информации по запросам. В статье рассматриваются вопросы консолидации данных для дальнейшего их использования в информационно-аналитических системах. Цель исследования. Определение возможности и построение алгоритмов поиска релевантной информации из разнородных источников на основе анализа вероятностной информации, которая определяет возможность наличия релевантных документов в этих источниках. Методика реализации. Для поиска релевантной информации по поисковым запросам используется подход, который построен на использовании оценок вероятностей наличии релевантных документов в источниках с последующим увеличением числа выбираемых из этих источников документов для анализа их релевантности запросу. Результаты исследований. Разработаны структура программируемого стохастического автомата для обеспечения выбора наиболее вероятных по параметрам релевантности источников информации и алгоритм поиска информации на основе использования стохастического автомата. Выводы. Приведенный алгоритм с использованием стохастического автомата для консолидации данных позволяет разработать комплекс программных средств, обеспечивает достаточно полное и целостное решение задач консолидации данных для различных систем, которые осуществляют поиск информации из различных по составу и виду представления источников информации.uk
dc.description.abstractukПроблематика. Розробка методів і алгоритмів ефективного пошуку релевантної інформації за запитами. У статті розглядаються питання консолідації даних для подальшого їх використання в інформаційно-аналітичних системах. Мета дослідження. Виявлення можливості та побудова алгоритмів пошуку релевантної інформації з різнорідних джерел на основі аналізу ймовірнісної інформації, що визначає можливість наявності релевантних документів у цих джерелах. Методика реалізації. Для пошуку релевантної інформації за пошуковими запитами використовується підхід, побудований на використанні оцінок ймовірностей наявності релевантних документів у джерелах із подальшим збільшенням кількості вибраних із цих джерел документів для аналізу їх релевантності запиту. Результати досліджень. Розроблено структуру програмованого стохастичного автомату для забезпечення вибору найбільш імовірних за параметрами релевантності джерел інформації та алгоритм пошуку інформації на основі використання стохастичного автомату. Висновки. Наведений алгоритм використання стохастичного автомату для консолідації даних дає змогу розробити комплекс програмних засобів, що забезпечує достатньо повний і цілісний розв’язок задач консолідації даних для різноманітних систем, що здійснюють пошук інформації з різноманітних за складом і видом представлення джерел інформації.uk
dc.format.pagerangePp. 29-36uk
dc.identifier.citationKoval O. V. Using Stochastic Automaton for Data Consolidation / O. V. Koval, V. A. Kuzminykh, D. V. Khaustov // Наукові вісті НТУУ «КПІ» : міжнародний науково-технічний журнал. – 2017. – № 2(112). – С. 29–36. – Бібліогр.: 19 назв.uk
dc.identifier.doihttps://doi.org/10.20535/1810-0546.2017.2.100011
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/24305
dc.language.isoenuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.sourceНаукові вісті НТУУ «КПІ» : міжнародний науково-технічний журнал, 2017, № 2(112)uk
dc.subjectopen data sourcesuk
dc.subjectdata consolidationuk
dc.subjectinformation-analytical systemsuk
dc.subjectinformation retrieval systemsuk
dc.subjectprobabilistic modelsuk
dc.subjectrelevanceuk
dc.subjectbig data tasksuk
dc.subjectвідкриті джерела данихuk
dc.subjectконсолідація данихuk
dc.subjectінформаційно-аналітичні системиuk
dc.subjectінформаційно-пошукові системиuk
dc.subjectймовірнісні моделіuk
dc.subjectрелевантні документиuk
dc.subjectзадачі обробки великих обсягів данихuk
dc.subjectоткрытые источники данныхuk
dc.subjectконсолидация данныхuk
dc.subjectинформационно-аналитические системыuk
dc.subjectинформационно-поисковые системыuk
dc.subjectвероятностные моделиuk
dc.subjectрелевантностьuk
dc.subjectзадачи обработки больших объемов данныхuk
dc.subject.udc615.47:616-085uk
dc.titleUsing Stochastic Automaton for Data Consolidationuk
dc.title.alternativeВикористання стохастичного автомату для консолідації данихuk
dc.title.alternativeИспользование стохастического автомата для консолидации данныхuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
NVKPI2017-2_04.pdf
Розмір:
242.95 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
7.74 KB
Формат:
Item-specific license agreed upon to submission
Опис: