Математичне та програмне забезпечення системи прогнозування вартості фінансових активів компанії
Вантажиться...
Дата
2023
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дисертацію виконано на 106 аркушах, вона містить 2 додатки та перелік посилань на використані джерела з 64 найменувань. У роботі наведено 19 рисунків та 2 таблиці.
Актуальність теми. Прогнозування вартості цінних паперів є надзвичайно важливим завданням для інвесторів і фінансових установ для прийняття обґрунтованих інвестиційних рішень, ефективного управлінні ризиками та загальної ефективності портфеля. Поєднання технічного аналізу активів ансамблювання моделей машинного та глибокого навчання, аналізу настроїв фінансових новин за допомогою мовних моделей має великий потенціал для підвищення точності та надійності прогнозів цін на акції. Технічний аналіз активів передбачає використання статистичних методів для аналізу історичних даних про ціни та обсяги для виявлення тенденцій і закономірностей на фондовому ринку. Цей метод десятиліттями використовувався трейдерами та інвесторами для прийняття інвестиційних рішень. Технічний аналіз можна автоматизувати та застосувати до великих наборів даних, дозволяючи робити більш точні та надійні прогнози. Методи глибокого навчання можуть вивчати складні взаємозв’язки між різними ринковими факторами, що дає точніші прогнози. В такі моделі можуть бути включені останні ринкові новини, економічні показники та інші відповідні фактори, щоб надати більш тонку та детальну інформацію. Ансамблювання моделей передбачає поєднання кількох моделей для підвищення точності та надійності прогнозів. Аналіз настроїв фінансових новин передбачає використання методів обробки природної мови для аналізу новинних статей і соціальних мереж, щоб визначити настрої ринку щодо певної акції чи компанії. Цей метод може
надати додаткову інформацію про ринкові тенденції та настрої інвесторів, що призводить до більш точних прогнозів.
Зв’язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконувалась згідно з планом науково-дослідних робіт кафедри прикладної математики Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського».
Мета і задачі дослідження. Метою дисертаційної роботи є розробка математичного та програмного забезпечення для покращення прогнозу вартості фінансових активів компанії (порівняно з традиційними методами прогнозування часових рядів) із застосуванням семантичного аналізу тексту, автоенкодерів, ансамблю моделей, генеративних змагальних мереж GAN з метою підвищення конкурентоспроможності компанії на ринку, покращення оптимізації та управління її ресурсами, забезпечення інвесторів та клієнтів фінансовим прогнозом.
Для досягнення вказаної мети було розв’язано такі задачі:
− Збір та аналіз необхідних для навчання моделей даних;
− Тренування різних моделей машинного навчання, їх ансамблювання;
− Розробка інтерфейсу та забезпечення роботи програми в реальному часі.
Об’єктом дослідження є система прогнозування вартості фінансових показників компанії з використанням генеративних змагальних мереж GAN та навчання з підкріпленням RL. Методи технічного аналізу для прогнозування ймовірної зміни цін. Нейронні мережі для роботи з текстом spacy, nltk, BERT та finBERT. Алгоритми пониження розмірності t-SNE, UMAP, Factor Analysis, Feature Selection methods, Autoencoders. Методи прогнозування часових рядів багатовимірна лінійна регресія, ARIMA, марківська модель, fast-forward
NN, RNN LSTM. Методи ансамблювання базових моделей bagging, stacking, boosting. Генеративні змагальні мережі GAN. Існуючі комерційні програмні рішення: StocksNeural, Stocksight, Deep Convolution Stock Technical Analysis.
Предметом дослідження є техніки ансамблювання моделей машинного навчання, вплив на вартість фінансових активів компанії таких показників, як корельовані активи – показники залежних, схожих за економічною діяльністю або конкуруючих компаній; біржеіві товари – енергетична сировина, кольорові та дорогоцінні метали, промислова сировина тощо; курси валют; фондові індекси; кількість запитів в пошуковій системі; фінансові новини. Можливості технічного аналізу для прогнозування ймовірних змін вартості фінансових показників. Створення інформативних високорівневих ознак ззастосуванням t-SNE, UMAP, Feature Selection methods, Autoencoders. Порівняльний аналіз базових моделей прогнозування, об’єднання їх в ансамбль методами bagging, stacking, boosting. Можливість застосування генеративної змагальної мережі GAN, підбор моделей для генератора та дискримінатора.
Методи дослідження. Для розв’язання поставленої задачі використовувалися такі методи: методи машинного навчання з учителем, навчання з підкріпленням, генеративні змагальні мережі, методи зменшення розмірності та вибору важливих ознак.
Наукова новизна одержаних результатів полягає в потенціалі для покращення процесу прийняття інвестиційних рішень та управління ризиками на фінансових ринках за допомогою програмного забезпечення, створення якого є метою даної магістерської дисертації, що здатне інтегрувати набір методологій та алгоритмів в єдину систему, що дозволяє надавати більш точні та надійні прогнози. Програмне забезпечення здатне поєднувати велику кількість ознак (отриманих шляхом дата майнингу, інженирінгу ознак, технічного аналізу), ансамблі моделей машинного та
глибокого навчання, мовну модель визначення емоційної забарвленості фінансових текстів для надання більш точних та надійних прогнозів порівняно з наявними існуючими рішеннями. Тому підхід до прогнозування фінансової інформації, який полягає в використанні якомога більшої кількості ознак для навчання моделі і представлений в даній дипломній роботі є найбільш вдалим та актуальним.
Практичне значення одержаних результатів. Реалізовану систему можна застосовувати для проведення аналітики та прогнозування економічного стану окремої компанії; під час торгів на ринку акцій в режимі реального часу.
Апробація результатів дисертації. Деякі положення й результати роботи дисертації доповідались та опубліковані у матеріалах XV наукової конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг - ПМК-2022» ( Київ 16-17 листопада 2022 року).
Публікації. Результати дослідження, викладені в одному з розділів дисертації, представлені в науковій праці: тези «Порівняльний аналіз підходів і методів оцінювання емоційного забарвлення фінансової інформації про поточний стан підприємства» на XV конференції ім. магістрантів та аспірантів «Прикладна математика та обчислювальна техніка – ПМК-2022».
Опис
Ключові слова
ціни акцій, корельовані активи, технічні індикатори, пониження розмірності, семантичний аналіз тексту, стаціонарний часовий ряд, рекурентні нейронні мережі, модель довгої короткострокової пам’яті
Бібліографічний опис
Агафонов, Д. С. Математичне та програмне забезпечення системи прогнозування вартості фінансових активів компанії : магістерська дис. : 113 Прикладна математика / Агафонов Дмитро Сергійович. – Київ, 2023. – 154 с.