Супроводження процесу передбачення з наявністю слабко структурованих даних засобами текстової аналітики
dc.contributor.author | Савастьянов, Володимир Володимирович | |
dc.date.accessioned | 2021-05-05T15:15:05Z | |
dc.date.available | 2021-05-05T15:15:05Z | |
dc.date.issued | 2021 | |
dc.description.abstracten | The paper proposes to review the process of foresight with the presence of semistructured data as a whole, gradually reducing uncertainty, moving from the start of the study to the desired future. To implement the proposed concept, a systematic approach to the support of the foresight process based on textual analytics, which is the most modern and most powerful tool for the analysis of semistructured data written in natural language. The system approach consists of four stages which are continuously repeated throughout the life cycle of foresight, and its results are reused in all other foresight sessions. In the first stage, the subject area is studied, the features to the desired future are analysed, the models, methods and their metadata are determined. The conceptual model of support of the foresight process is determined. An idea of the process of foresight and the horizon of foresight is formed. Factors of growth and reduction of uncertainty on the way to the forecast horizon are determined. An information model of the foresight process is introduced - the representation of subject areas using the set-theoretic concept of general systems theory. Restrictions on information model connections are introduced, options for presenting knowledge in the form of a hierarchical classifier or ontology are considered, and advantages and disadvantages are outlined. The concept of the existence of knowledge in time is considered. Integrated time-dependent awareness indicators have been introduced to measure changes in the knowledge base over time and / or depending on the amount of new knowledge. New knowledge is registered as classified metadata according to developed classifiers. Awareness indicators are constantly calculated and analyzed during the foresight process. At the second stage of the system approach the model and approach of extraction of knowledge from texts in natural language is introduced and applied. The work modifies the general model of extracting facts from texts in natural language to meet the requirements of extracting metadata information model of foresight, introducing universal lexical templates-restrictions to compile more powerful rules for extracting metadata. The model is used as part of the support process to build techniques, approaches and tools based on them to process new subject areas and types of knowledge. Approaches to the extraction of objects of the subject area for the construction and expansion of classifiers, as well as approaches to generate classification rules for classifier nodes. Introduced methods for processing facts that contain potentially positive and negative indicators, including taking into account the time and changes in context. Situations of knowledge conflicts due to changes in emotional and semantic orientation and approaches to their elimination are considered. At the third stage of the system approach the information model of support of the foresight process is introduced, classes of input data are defined. Metadata for the initial annotation and metadata to support the foresight process are introduced. The algorithm of transformation of input data into metadata, indicators of awareness and cases of usage of certain methods of qualitative analysis for sake of eliminating contradictions of knowledge in the knowledge base are presented. The data at the output of the foresight support process and the possibilities for their application at different stages of foresight and in the methods of qualitative analysis are considered. At the fourth stage of the system approach, the semistructured data processing modules are adapted and scaled as a part of the foresight process support system. A number of cases show the application of a systematic approach to support the foresight process with the presence of semistructured data using textual analytics. The developed system approach is applied throughout the life cycle of the foresight session. Artifacts created at the end of the support process (classifiers, lexical restrictions, rules, knowledge) can be used in subsequent and new foresight sessions. Introduced system approach reduces the resources to provide data in the internal subprocesses of the system and improves the quality of processes, including: speeds up the processing of input data about foresight process, provides analysts and experts with tools for rapid analysis of input data, information on the progress in the form of awareness indicators, provides reuse of acquired knowledge and artifacts at the output of models, algorithms and approaches in subsequent foresight sessions. Number of practical cases confirmed the effectiveness, efficiency, scale of the proposed concept, saving the integrity of the foresight process, during the involvement of the proposed system approach. | uk |
dc.description.abstractru | В работе предлагается рассматривать процесс предвидения с наличием слабо структурированных данных целостно. Разработан системный подход к сопровождению процесса предвидения на основе средств текстовой аналитики из четырех этапов, которые непрерывно повторяются на всем жизненном цикле предвидения, а его результаты используются повторно в рамках всех других сессий сопровождения процессов предвидения. На первом этапе определяются модели, методы и их метаданные, которые будут использоваться для представления предметной области. Вводится информационная модель процесса предвидения, интегрированные показатели информированности. Непрерывно рассчитываются и анализируются показатели информированности. На втором этапе вводится и применяется модель и приемы извлечения знаний из текстов на естественном языкеэтапе вводится информационная модель сопровождения процесса предвидения, входные/выходные данные, алгоритм, реализующий модель. На четвертом этапе проводится адаптация и масштабирование системного подхода. Использование указанного системного подхода обеспечивает уменьшение ресурсов, требуемое для обеспечения данными внутренних подпроцессов, и улучшает качество процессов, а именно: ускоряет обработку входных данных процесса предвидения, обеспечивает аналитиков и экспертов средствами быстрого анализа входных данных, информацией в виде показателей информированности, обеспечивает повторное использование добытых знаний и полученных артефактов на выходе моделей, алгоритмов и подходов в следующих сессиях предвидения. Рассмотрены ситуации конфликтов знаний и приемы к их устранению. На третьем | uk |
dc.description.abstractuk | У роботі пропонується розглядати процес передбачення з наявністю слабо структурованих даних цілісно. Розроблено системний підхід до супроводу процесу передбачення на основі засобів текстової аналітики з чотирьох етапів, які безперервно повторюються на всьому життєвому циклі передбачення, а його результати використовуються повторно в рамках всіх інших сесій супроводу процесів передбачення. На першому етапі визначаються моделі, методи і їх метадані, які будуть використовуватися для подання предметної області. Вводиться інформаційна модель процесу передбачення, інтегровані показники інформованості. Безперервно розраховуються і аналізуються показники інформованості. На другому етапі вводиться і застосовується модель і прийоми вилучення знань з текстів природною мовою. Розглянуто ситуації конфліктів знань і прийоми до їх усунення. На третьому етапі вводиться інформаційна модель супроводу процесу передбачення, вхідні / вихідні дані, алгоритм, який реалізує модель. На четвертому етапі проводиться адаптація і масштабування системного підходу. Використання зазначеного системного підходу забезпечує зменшення ресурсів, необхідну для забезпечення даними внутрішніх подпроцессов, і покращує якість процесів, а саме: прискорює обробку вхідних даних процесу передбачення, забезпечує аналітиків і експертів засобами швидкого аналізу вхідних даних, інформацією в вигляді показників інформованості, забезпечує повторне використання здобутих знань та отриманих артефактів на виході моделей, алгоритмів і підходів в наступних сесіях передбачення. | uk |
dc.format.page | 26 с | uk |
dc.identifier.citation | Савастьянов, В. В. Супроводження процесу передбачення з наявністю слабко структурованих даних засобами текстової аналітики : автореф. дис. … канд. техн. наук. : 01.05.04 – системний аналіз і теорія оптимальних рішень / Савастьянов Володимир Володимирович. – Київ, 2021. – 26 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/40906 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | системний аналіз | uk |
dc.subject | методологія передбачення | uk |
dc.subject | текстова аналітика | uk |
dc.subject | natural language processing | uk |
dc.subject | data mining | uk |
dc.subject | супроводження процесу передбачення | uk |
dc.subject | сентимент аналіз | uk |
dc.subject | показники інформованості передбачення | uk |
dc.subject | інформаційна модель | uk |
dc.subject | концептуальна модель | uk |
dc.subject | модель вилучення знань з текстів природною мовою | uk |
dc.subject | класифікатори | uk |
dc.subject | синтез правил класифікації | uk |
dc.subject | метадані процесу передбачення | uk |
dc.subject | systems analysis | uk |
dc.subject | foresight methodology | uk |
dc.subject | text analytics | uk |
dc.subject | natural language processing | uk |
dc.subject | data mining | uk |
dc.subject | foresight process support | uk |
dc.subject | sentiment analysis | uk |
dc.subject | foresight awareness indicators | uk |
dc.subject | information model | uk |
dc.subject | conceptual model | uk |
dc.subject | model of knowledge extraction from texts in natural language | uk |
dc.subject | classifiers | uk |
dc.subject | synthesis of classification rules | uk |
dc.subject | foresight process metadata | uk |
dc.subject | системный анализ | uk |
dc.subject | методология предвидения | uk |
dc.subject | текстовая аналитика | uk |
dc.subject | natural language processing | uk |
dc.subject | data mining | uk |
dc.subject | сопровождение процесса предвидения | uk |
dc.subject | сентимент анализ | uk |
dc.subject | показатели информированности предвидения | uk |
dc.subject | информационная модель | uk |
dc.subject | концептуальная модель | uk |
dc.subject | модель извлечения знаний из текстов на естественном языке | uk |
dc.subject | классификаторы | uk |
dc.subject | синтез правил классификации | uk |
dc.subject | метаданные процесса предвидения | uk |
dc.subject.udc | 004.82:005.52:519-7.51 | uk |
dc.title | Супроводження процесу передбачення з наявністю слабко структурованих даних засобами текстової аналітики | uk |
dc.type | Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Savastiyanov_aref.pdf
- Розмір:
- 2.32 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.01 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: