Розробка і реалізація методики інтелектуального аналізу даних із використанням теорії мереж Байєса та регресійного аналізу

dc.contributor.advisorБідюк, Петро Іванович
dc.contributor.advisorBidyuk, P. I.
dc.contributor.advisorБидюк, Петр Иванович
dc.contributor.degreefacultyНавчально-науковий комплекс «Інститут прикладного системного аналізу»uk
dc.contributor.researchgrantorНаціональний технічний університет України «Київський політехнічний інститут»uk
dc.date.accessioned2017-07-31T10:12:54Z
dc.date.available2017-07-31T10:12:54Z
dc.date.issued2012
dc.description.abstractenA new two-stage method for intellectual data analysis is proposed that combines Bayesian networks theory and regression analysis. The method is based on two sets of mathematical techniques. The first one is used for constructing topology of Bayesian network and forming probabilistic inference. The inference is used further on for decision making on the basis of forecast estimates. The second set of methods is used for development of regression model with making use of logistic link function that serves as a basis for forecast estimation. The modeling results and forecast estimates are used to construct a combined integrated forecast estimate that provides a decision maker with statistically substantiated recommendations regarding further development of the process under study. To construct the model in the form of Bayesian network a mutual information is used for selection of statistically significant process variables, and to construct the network topology the functional is hired based on the minimum description length. To select optimal threshold state values the weight of evidence method is implemented. An optimal regression model is constructed by the direct sequential inserting of independent variables using the value of χ². To calibrate the combined model constructed the technology of dividing the data sample into training, control and testing sets is hired with application to stratified analyzed variable. An original architecture of decision support system for modeling and forecasting was developed on the basis of the methods and algorithms proposed. The proposed two-stage method has been implemented in the form of program module DMTwoStage in SAS/IML programming language that can be implemented on any SAS family platform. The use of the universal SAS platform provides a possibility for a quick operative modification of the computing procedures developed thanks to the open modular architecture of the computer based decision support system for modeling and forecasting of development the processes under study. A set of practical problems has been solved using the DMTwoStage program module and practically significant results were received in the form of mathematical models and combined forecast estimates based on these models. To test correctness of the theory developed a set of analytical procedures and computing experiments has been carried out with the use of substantial volumes of statistical data and expert estimates.uk
dc.description.abstractruПредложен новый вдухшаговый метод интеллектуального анализа данных, соединяющий теорию сетей Байеса и регрессионного анализа данных. Метод основывается на двух группах методов. Первый набор методов предназначен для построения топологии сети Байеса и формирования вероятностного вывода, на основе которого строится прогноз-решение. Второй набор методов предназначен для создания регрессионной модели с использованием логистической функции связи, на основе которой вычисляется оценка прогноза. Результаты моделирования и вычисленные прогнозные значения используются для построения комбинированного интегрированного значения прогноза, который предоставляет аналитику статистически обоснованные рекомендации развития исследуемого процесса. При построении модели в форме сети Байеса, для выбора значимых показателей процесса используется значение взаимной информации, а для построения топологии – минимизация функционала на основе описания минимальной длиной. Для построения оптимальных пороговых значений состояний, реализован метод совокупности значений (weight of evidence). Построение оптимальной модели регрессии выполняется прямым последовательным включением регрессоров на основе значения критерия хи-квадрат. Для калибровки комбинированной модели используется технология последовательной разбивки выборки на обучающий, проверочный и тестовый наборы данных с привязкой к стратификационной переменной анализа. На основе использованных методов и алгоритмов разработана оригинальная архитектура системы поддержки принятия решений для математического моделирования. Предложенный двухэтапный метод реализован в виде программного модуля DMTwoStage на языке программирования SAS/IML, что может использоваться в любых программах семейства SAS. Использование универсальной платформы SAS обеспечивает возможность оперативной модификации предложенных вычислительных процедур за счет открытой модульной архитектуры компьютерной системы поддержки принятия решений при моделировании и прогнозировании развития процессов. С использованием программного модуля DMTwoStage выполнено решение серии практических задач и получены практически значимые результаты в виде математических моделей и комбинированных прогнозов на их основе. Для проверки корректности предложенного подхода использованы аналитические процедуры и вычислительные эксперименты с использованием значительного объема статистических данных и экспертных оценок.uk
dc.description.abstractukЗапропоновано новий двокроковий метод інтелектуального аналізу даних, що поєднує теорію мереж Байєса та регресійного аналізу. Метод грунтується на двох множинах математичних методів. Перша множина призначена для побудови топології мережі Байєса та формування ймовірнісного висновку, на основі якого будується прогноз-рішення. Друга множина призначена для створення регресійної моделі із використанням логістичної функції зв’язку, на основі якої обчислюється оцінка прогнозу. Результати моделювання та оцінені прогнозні значення використовуються для побудови комбінованого інтегрованого значення прогнозу, що дозволяє надавати аналітику статистично обґрунтовані рекомендації стосовно розвитку процесу. При побудові моделі у формі мережі Байєса, для вибору значущих показників процесу використовуються значення взаємної інформації, а для побудови топології – мінімізація функціонала на основі опису мінімальної довжини. Для підбору оптимальних порогових значень станів реалізовано метод сукупності свідчень (weight of evidence). Побудова оптимальної моделі регресії відбувається прямим послідовним включенням регресорів на основі значення критерію хі-квадрат. Для калібрування комбінованої моделі використовується технологія послідовного розбиття вибірки на навчальний, перевірочний та тестовий набори даних з прив’язкою до стратифікаційної змінної аналізу. На основі запропонованих методів і алгоритмів розроблена оригінальна архітектура системи підтримки прийняття рішень для математичного моделювання. Запропонований двокроковий метод реалізовано у вигляді програмного модуля DMTwoStage на мові програмування SAS/IML, що може використовуватися в будь яких програмах сімейства SAS. Використання універсальної платформи SAS забезпечує можливість оперативної модифікації створених обчислювальних процедур за рахунок відкритої модульної архітектури комп’ютерної системи підтримки прийняття рішень при моделюванні та прогнозуванні розвитку процесів. Із використанням програмного модуля DMTwoStage розв’язано низку практичних задач та отримано практично значущі результати у вигляді математичних моделей та комбінованих прогнозів на їх основі. Для перевірки коректності теорії використано аналітичні процедури та обчислювальні експерименти з використанням значних об’ємів статистичних даних і експертних оцінок.uk
dc.format.page10 с.uk
dc.identifier2419-пuk
dc.identifier.govdoc0111U001241uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/20150
dc.language.isoukuk
dc.publisherНТУУ «КПІ»uk
dc.publisher.placeКиївuk
dc.status.pubpublisheduk
dc.subjectматематичне моделюванняuk
dc.subjectсистеми підтримки прийняття рішеньuk
dc.titleРозробка і реалізація методики інтелектуального аналізу даних із використанням теорії мереж Байєса та регресійного аналізуuk
dc.title.alternativeDevelopment and implementation of methodology for intellectual data analysis using Bayesian networks theory and regression analysisuk
dc.title.alternativeРазработка и реализация методики интеллектуального анализа данных с использованием теории сетей Байеса и регрессионного анализаuk
dc.typeTechnical Reportuk
thesis.degree.level-uk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
2419-п.doc
Розмір:
484 KB
Формат:
Microsoft Word
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
7.8 KB
Формат:
Item-specific license agreed upon to submission
Опис: