Методи організації високоефективних спеціалізованих сховищ даних науково-освітнього призначення на основі кластерних обчислювальних технологій

dc.contributor.advisorГроль, В. В.
dc.contributor.advisorGrol, V. V.
dc.contributor.advisorГроль, В. В.
dc.contributor.degreedepartmentКафедра системного програмування і спеціалізованих комп’ютерних системuk
dc.contributor.degreefacultyФакультет прикладної математикиuk
dc.contributor.researchgrantorНаціональний технічний університет України «Київський політехнічний інститут»uk
dc.date.accessioned2017-07-27T12:34:59Z
dc.date.available2017-07-27T12:34:59Z
dc.date.issued2012
dc.description.abstractenA number of approaches and methods was developed for creating of data warehouses for scientific and educational purpose. Developed werehouses unlike most analogues are oriented on the task analysis of unstructured data sets rather than on the problem of documents flow. In particular, the method of warehouse architecture oriented on semantic and advanced analytical processing was designed. Ways to support very large repositories of text data based on the use of cluster computing technologies was developed. A method of analysis of information processing in very large repositories of text data, including automatic abstracting, classification, clustering scientific and educational information was created. Ways to identify and analyze the structure of text information objects focused primarily on unstructured and semi-structured data was created. Techniques which establish associative links between data elements of information objects was developed. A method for assessing the originality of text scientific and educational information objects and resources was proposed. A way to visualize text warehouse data based on the data presentation in the form of graph was created. The developed methods and techniques were implemented in the experimental prototype of heterogeneous data warehouse. Thus the work offers scientific basis for the realization of a new type of cluster-centric warehouses for mostly unstructured or semi-structured data that are designed for use in scientific and educational field. Also, the proposed methods allow creation of means to automate the structuring, cataloging, semantic-based search for scientific and educational data.uk
dc.description.abstractruРазработано ряд подходов и методов к созданию хранилищ данных научно-образовательного назначения, ориентированных, в отличие от большинства аналогов, на задачи анализа неструктурированных массивов данных, а не на задачи документооборота. Предложен метод архитектурной организации хранилищ, направленных на семантическую и развитую аналитическую обработку данных. Разработаны способы поддержки сверхбольших хранилищ текстовых данных, которые базируются на использовании кластерных вычислительных технологий. Созданы методы организации средств аналитической обработки информации в сверхбольших хранилищах текстосодержащих данных, в частности, для автоматического реферирования, классификации, кластеризации научно-образовательной информации. Созданы способы выявления и анализа структуры текстосодержащих информационных объектов, ориентированные в первую очередь на неструктурированные и частично структурированные данные. Разработаны способы установления ассоциативных связей между элементами данных информационных объектов. Разработан метод оценки оригинальности текстосодержащих научно-образовательных информационных объектов и ресурсов. Создан способ визуализации содержимого хранилищ данных преимущественно текстового типа на основе представления данных в виде графа. Разработанные способы и методы реализованы на практике в виде исследовательского прототипа хранилища гетерогенных данных. Таким образов в работе была предложена научная база для реализации нового типа кластерно-ориентированных хранилищ преимущественно неструктурированных или частично структурированных данных, которые предназначены для применения в научно-образовательной сфере. Также предложенные методы позволяют создавать средства, направленные на автоматизацию структурирования, каталогизации, семантически-ориентированного поиска научно-образовательных данных.uk
dc.description.abstractukРозроблено ряд підходів та методів до створення сховищ даних науково-освітнього призначення орієнтованих, на відміну від більшості аналогів, на задачі аналізу неструктурованих масивів даних, а не на задачі документообігу. Зокрема запропоновано метод архітектурної організації сховищ спрямованих на семантичну та розвинену аналітичну обробку даних. Розроблено способи підтримки надвеликих сховищ текстових даних, які базуються на використанні кластерних обчислювальних технологій. Створено методи організації засобів аналітичної обробки інформації у надвеликих сховищах текстомістких даних, зокрема для автоматичного реферування, класифікації, кластеризації науково-освітньої інформації. Створено способи виявлення та аналізу структури текстомістких інформаційних об’єктів, орієнтовані перш за все на неструктуровані та частково структуровані дані. Розроблено способи встановлення асоціативних зв’язків між елементами даних інформаційних об’єктів. Розроблено метод оцінки оригінальності текстомістких науково-освітніх інформаційних об’єктів та ресурсів. Створений спосіб візуалізації вмісту сховищ даних переважно текстового типу на основі представлення даних у вигляді графу. Розроблені способи та методи практично реалізовані у дослідному прототипі сховища гетерогенних даних. Таким чином у роботі була запропонована наукова база для реалізації нового типу кластерно-орієнтованих сховищ переважно неструктурованих або частково структурованих даних, які призначені для застосування у науково-освітній галузі. Також запропоновані методи дозволяють створювати засоби, спрямовані на автоматизацію структурування, каталогізації, семантично-орієнтованого пошуку науково-освітніх даних.uk
dc.format.page7 с.uk
dc.identifier2300-ф
dc.identifier.govdoc0110U000261
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/20140
dc.language.isoukuk
dc.publisherНТУУ «КПІ»uk
dc.publisher.placeКиївuk
dc.status.pubpublisheduk
dc.titleМетоди організації високоефективних спеціалізованих сховищ даних науково-освітнього призначення на основі кластерних обчислювальних технологійuk
dc.title.alternativeMethods of the organization of highly effective specialized repositories of scientific and educational purpose based on cluster computing technologiesuk
dc.title.alternativeМетоды организации высокоэффективных специализированных хранилищ данных научно-образовательного назначения на основе кластерных вычислительных технологийuk
dc.typeTechnical Reportuk
thesis.degree.level-uk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
2300-ф.doc
Розмір:
259.5 KB
Формат:
Microsoft Word
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
7.8 KB
Формат:
Item-specific license agreed upon to submission
Опис: