Методи організації високоефективних спеціалізованих сховищ даних науково-освітнього призначення на основі кластерних обчислювальних технологій
dc.contributor.advisor | Гроль, В. В. | |
dc.contributor.advisor | Grol, V. V. | |
dc.contributor.advisor | Гроль, В. В. | |
dc.contributor.degreedepartment | Кафедра системного програмування і спеціалізованих комп’ютерних систем | uk |
dc.contributor.degreefaculty | Факультет прикладної математики | uk |
dc.contributor.researchgrantor | Національний технічний університет України «Київський політехнічний інститут» | uk |
dc.date.accessioned | 2017-07-27T12:34:59Z | |
dc.date.available | 2017-07-27T12:34:59Z | |
dc.date.issued | 2012 | |
dc.description.abstracten | A number of approaches and methods was developed for creating of data warehouses for scientific and educational purpose. Developed werehouses unlike most analogues are oriented on the task analysis of unstructured data sets rather than on the problem of documents flow. In particular, the method of warehouse architecture oriented on semantic and advanced analytical processing was designed. Ways to support very large repositories of text data based on the use of cluster computing technologies was developed. A method of analysis of information processing in very large repositories of text data, including automatic abstracting, classification, clustering scientific and educational information was created. Ways to identify and analyze the structure of text information objects focused primarily on unstructured and semi-structured data was created. Techniques which establish associative links between data elements of information objects was developed. A method for assessing the originality of text scientific and educational information objects and resources was proposed. A way to visualize text warehouse data based on the data presentation in the form of graph was created. The developed methods and techniques were implemented in the experimental prototype of heterogeneous data warehouse. Thus the work offers scientific basis for the realization of a new type of cluster-centric warehouses for mostly unstructured or semi-structured data that are designed for use in scientific and educational field. Also, the proposed methods allow creation of means to automate the structuring, cataloging, semantic-based search for scientific and educational data. | uk |
dc.description.abstractru | Разработано ряд подходов и методов к созданию хранилищ данных научно-образовательного назначения, ориентированных, в отличие от большинства аналогов, на задачи анализа неструктурированных массивов данных, а не на задачи документооборота. Предложен метод архитектурной организации хранилищ, направленных на семантическую и развитую аналитическую обработку данных. Разработаны способы поддержки сверхбольших хранилищ текстовых данных, которые базируются на использовании кластерных вычислительных технологий. Созданы методы организации средств аналитической обработки информации в сверхбольших хранилищах текстосодержащих данных, в частности, для автоматического реферирования, классификации, кластеризации научно-образовательной информации. Созданы способы выявления и анализа структуры текстосодержащих информационных объектов, ориентированные в первую очередь на неструктурированные и частично структурированные данные. Разработаны способы установления ассоциативных связей между элементами данных информационных объектов. Разработан метод оценки оригинальности текстосодержащих научно-образовательных информационных объектов и ресурсов. Создан способ визуализации содержимого хранилищ данных преимущественно текстового типа на основе представления данных в виде графа. Разработанные способы и методы реализованы на практике в виде исследовательского прототипа хранилища гетерогенных данных. Таким образов в работе была предложена научная база для реализации нового типа кластерно-ориентированных хранилищ преимущественно неструктурированных или частично структурированных данных, которые предназначены для применения в научно-образовательной сфере. Также предложенные методы позволяют создавать средства, направленные на автоматизацию структурирования, каталогизации, семантически-ориентированного поиска научно-образовательных данных. | uk |
dc.description.abstractuk | Розроблено ряд підходів та методів до створення сховищ даних науково-освітнього призначення орієнтованих, на відміну від більшості аналогів, на задачі аналізу неструктурованих масивів даних, а не на задачі документообігу. Зокрема запропоновано метод архітектурної організації сховищ спрямованих на семантичну та розвинену аналітичну обробку даних. Розроблено способи підтримки надвеликих сховищ текстових даних, які базуються на використанні кластерних обчислювальних технологій. Створено методи організації засобів аналітичної обробки інформації у надвеликих сховищах текстомістких даних, зокрема для автоматичного реферування, класифікації, кластеризації науково-освітньої інформації. Створено способи виявлення та аналізу структури текстомістких інформаційних об’єктів, орієнтовані перш за все на неструктуровані та частково структуровані дані. Розроблено способи встановлення асоціативних зв’язків між елементами даних інформаційних об’єктів. Розроблено метод оцінки оригінальності текстомістких науково-освітніх інформаційних об’єктів та ресурсів. Створений спосіб візуалізації вмісту сховищ даних переважно текстового типу на основі представлення даних у вигляді графу. Розроблені способи та методи практично реалізовані у дослідному прототипі сховища гетерогенних даних. Таким чином у роботі була запропонована наукова база для реалізації нового типу кластерно-орієнтованих сховищ переважно неструктурованих або частково структурованих даних, які призначені для застосування у науково-освітній галузі. Також запропоновані методи дозволяють створювати засоби, спрямовані на автоматизацію структурування, каталогізації, семантично-орієнтованого пошуку науково-освітніх даних. | uk |
dc.format.page | 7 с. | uk |
dc.identifier | 2300-ф | |
dc.identifier.govdoc | 0110U000261 | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/20140 | |
dc.language.iso | uk | uk |
dc.publisher | НТУУ «КПІ» | uk |
dc.publisher.place | Київ | uk |
dc.status.pub | published | uk |
dc.title | Методи організації високоефективних спеціалізованих сховищ даних науково-освітнього призначення на основі кластерних обчислювальних технологій | uk |
dc.title.alternative | Methods of the organization of highly effective specialized repositories of scientific and educational purpose based on cluster computing technologies | uk |
dc.title.alternative | Методы организации высокоэффективных специализированных хранилищ данных научно-образовательного назначения на основе кластерных вычислительных технологий | uk |
dc.type | Technical Report | uk |
thesis.degree.level | - | uk |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 7.8 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: