Математичне та програмне забезпечення системи прогнозування вартості фінансових активів компанії

dc.contributor.advisorСирота, Сергій Вікторович
dc.contributor.authorАгафонов, Дмитро Сергійович
dc.date.accessioned2024-05-24T13:40:25Z
dc.date.available2024-05-24T13:40:25Z
dc.date.issued2023
dc.description.abstractДисертацію виконано на 106 аркушах, вона містить 2 додатки та перелік посилань на використані джерела з 64 найменувань. У роботі наведено 19 рисунків та 2 таблиці. Актуальність теми. Прогнозування вартості цінних паперів є надзвичайно важливим завданням для інвесторів і фінансових установ для прийняття обґрунтованих інвестиційних рішень, ефективного управлінні ризиками та загальної ефективності портфеля. Поєднання технічного аналізу активів ансамблювання моделей машинного та глибокого навчання, аналізу настроїв фінансових новин за допомогою мовних моделей має великий потенціал для підвищення точності та надійності прогнозів цін на акції. Технічний аналіз активів передбачає використання статистичних методів для аналізу історичних даних про ціни та обсяги для виявлення тенденцій і закономірностей на фондовому ринку. Цей метод десятиліттями використовувався трейдерами та інвесторами для прийняття інвестиційних рішень. Технічний аналіз можна автоматизувати та застосувати до великих наборів даних, дозволяючи робити більш точні та надійні прогнози. Методи глибокого навчання можуть вивчати складні взаємозв’язки між різними ринковими факторами, що дає точніші прогнози. В такі моделі можуть бути включені останні ринкові новини, економічні показники та інші відповідні фактори, щоб надати більш тонку та детальну інформацію. Ансамблювання моделей передбачає поєднання кількох моделей для підвищення точності та надійності прогнозів. Аналіз настроїв фінансових новин передбачає використання методів обробки природної мови для аналізу новинних статей і соціальних мереж, щоб визначити настрої ринку щодо певної акції чи компанії. Цей метод може надати додаткову інформацію про ринкові тенденції та настрої інвесторів, що призводить до більш точних прогнозів. Зв’язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконувалась згідно з планом науково-дослідних робіт кафедри прикладної математики Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського». Мета і задачі дослідження. Метою дисертаційної роботи є розробка математичного та програмного забезпечення для покращення прогнозу вартості фінансових активів компанії (порівняно з традиційними методами прогнозування часових рядів) із застосуванням семантичного аналізу тексту, автоенкодерів, ансамблю моделей, генеративних змагальних мереж GAN з метою підвищення конкурентоспроможності компанії на ринку, покращення оптимізації та управління її ресурсами, забезпечення інвесторів та клієнтів фінансовим прогнозом. Для досягнення вказаної мети було розв’язано такі задачі: − Збір та аналіз необхідних для навчання моделей даних; − Тренування різних моделей машинного навчання, їх ансамблювання; − Розробка інтерфейсу та забезпечення роботи програми в реальному часі. Об’єктом дослідження є система прогнозування вартості фінансових показників компанії з використанням генеративних змагальних мереж GAN та навчання з підкріпленням RL. Методи технічного аналізу для прогнозування ймовірної зміни цін. Нейронні мережі для роботи з текстом spacy, nltk, BERT та finBERT. Алгоритми пониження розмірності t-SNE, UMAP, Factor Analysis, Feature Selection methods, Autoencoders. Методи прогнозування часових рядів багатовимірна лінійна регресія, ARIMA, марківська модель, fast-forward NN, RNN LSTM. Методи ансамблювання базових моделей bagging, stacking, boosting. Генеративні змагальні мережі GAN. Існуючі комерційні програмні рішення: StocksNeural, Stocksight, Deep Convolution Stock Technical Analysis. Предметом дослідження є техніки ансамблювання моделей машинного навчання, вплив на вартість фінансових активів компанії таких показників, як корельовані активи – показники залежних, схожих за економічною діяльністю або конкуруючих компаній; біржеіві товари – енергетична сировина, кольорові та дорогоцінні метали, промислова сировина тощо; курси валют; фондові індекси; кількість запитів в пошуковій системі; фінансові новини. Можливості технічного аналізу для прогнозування ймовірних змін вартості фінансових показників. Створення інформативних високорівневих ознак ззастосуванням t-SNE, UMAP, Feature Selection methods, Autoencoders. Порівняльний аналіз базових моделей прогнозування, об’єднання їх в ансамбль методами bagging, stacking, boosting. Можливість застосування генеративної змагальної мережі GAN, підбор моделей для генератора та дискримінатора. Методи дослідження. Для розв’язання поставленої задачі використовувалися такі методи: методи машинного навчання з учителем, навчання з підкріпленням, генеративні змагальні мережі, методи зменшення розмірності та вибору важливих ознак. Наукова новизна одержаних результатів полягає в потенціалі для покращення процесу прийняття інвестиційних рішень та управління ризиками на фінансових ринках за допомогою програмного забезпечення, створення якого є метою даної магістерської дисертації, що здатне інтегрувати набір методологій та алгоритмів в єдину систему, що дозволяє надавати більш точні та надійні прогнози. Програмне забезпечення здатне поєднувати велику кількість ознак (отриманих шляхом дата майнингу, інженирінгу ознак, технічного аналізу), ансамблі моделей машинного та глибокого навчання, мовну модель визначення емоційної забарвленості фінансових текстів для надання більш точних та надійних прогнозів порівняно з наявними існуючими рішеннями. Тому підхід до прогнозування фінансової інформації, який полягає в використанні якомога більшої кількості ознак для навчання моделі і представлений в даній дипломній роботі є найбільш вдалим та актуальним. Практичне значення одержаних результатів. Реалізовану систему можна застосовувати для проведення аналітики та прогнозування економічного стану окремої компанії; під час торгів на ринку акцій в режимі реального часу. Апробація результатів дисертації. Деякі положення й результати роботи дисертації доповідались та опубліковані у матеріалах XV наукової конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг - ПМК-2022» ( Київ 16-17 листопада 2022 року). Публікації. Результати дослідження, викладені в одному з розділів дисертації, представлені в науковій праці: тези «Порівняльний аналіз підходів і методів оцінювання емоційного забарвлення фінансової інформації про поточний стан підприємства» на XV конференції ім. магістрантів та аспірантів «Прикладна математика та обчислювальна техніка – ПМК-2022».
dc.description.abstractotherThe thesis is presented in 106 pages. It contains 2 appendixes and bibliography of 64 references. 19 figures and 2 table are given in the thesis. Topic relevance. Forecasting the value of securities is an extremely important task for investors and financial institutions to make informed investment decisions, effective risk management and overall portfolio performance. The combination of technical asset analysis, ensemble machine and deep learning models, financial news sentiment analysis using linguistic models has great potential to improve the accuracy and reliability of stock price forecasts. Technical analysis of assets involves the use of statistical methods to analyze historical data on prices and volumes to identify trends and patterns in the stock market. This method has been used by traders and investors for decades to make investment decisions. Technical analysis can be automated and applied to large data sets, allowing for more accurate and reliable predictions. Deep learning techniques can learn complex relationships between various market factors, resulting in more accurate predictions. Such models may incorporate recent market news, economic indicators and other relevant factors to provide more nuanced and detailed information. Model ensemble involves combining several models to increase the accuracy and reliability of forecasts. Financial news sentiment analysis involves using natural language processing techniques to analyze news articles and social media to determine market sentiment about a particular stock or company. This method can provide additional information about market trends and investor sentiment, leading to more accurate forecasts. Thesis connection to scientific programs, plans, and topics. The dissertation work was carried out in accordance with the plan of research works of the Department of Applied Mathematics of the National Technical University of Ukraine "Ihor Sikorskyi Kyiv Polytechnic Institute". Research goal and objectives. The aim of the dissertation is the development of mathematical and software for improving the forecast of the value of the company's financial assets (compared to traditional time series forecasting methods) using semantic text analysis, autoencoders, model ensembles, generative competitive GAN networks with the aim of increasing the company's competitiveness on the market, improving optimization and management of its resources, providing investors and clients with a financial forecast. To achieve this goal, the following tasks were solved: - Collection and analysis of data models necessary for training; - Training of various machine learning models, their ensemble; - Development of the interface and ensuring the operation of the program in real time. The object of the study is a system for predicting the value of the company's financial indicators using generative adversarial GAN networks and RL reinforcement learning. Methods of technical analysis for forecasting likely price changes. Spacy, nltk, BERT and finBERT text neural networks. t-SNE, UMAP, Factor Analysis, Feature Selection methods, Autoencoders. Time series forecasting methods: multivariate linear regression, ARIMA, Markov model, fast-forward NN, RNN LSTM. Methods of assembling basic models of bagging, stacking, boosting. Generative adversarial GAN networks. Existing commercial software solutions: StocksNeural, Stocksight, Deep Convolution Stock Technical Analysis. The subject of the research is the techniques of assembling machine learning models, the influence on the value of the company's financial assets of such indicators as correlated assets - indicators of dependent, similar in economic activity or competing companies; exchange goods – energy raw materials, non-ferrous and precious metals, industrial raw materials, etc.; exchange rates; stock indices; the number of requests in the search engine; financial news. Possibilities of technical analysis for forecasting likely changes in the value of financial indicators. Creation of informative high-level features using t-SNE, UMAP, Feature Selection methods, Autoencoders. Comparative analysis of basic forecasting models, combining them into an ensemble using methods of bagging, stacking, boosting. The possibility of applying a generative competitive GAN network, selection of models for the generator and discriminator. Methods of research. The following methods were used to solve this problem: machine learning methods, reinforced learning, generative competition networks, methods to reduce the dimension and the choice of important features. Scientific contribution. The scientific novelty of the obtained results lies in the potential for improving the process of investment decision-making and risk management in financial markets with the help of software, the creation of which is the goal of this master's thesis, which is able to integrate a set of methodologies and algorithms into a single system that allows providing more accurate and reliable forecasts The software is able to combine a large number of features (obtained by data mining, feature engineering, technical analysis), ensembles of machine and deep learning models, a language model for determining the emotional coloring of financial texts to provide more accurate and reliable predictions compared to existing existing solutions. Therefore, the approach to forecasting financial information, which consists in using as many features as possible for training the model and presented in this thesis, is the most successful and relevant. Practical value of obtained results. The implemented system can be used to analyze and forecast the economic condition of an individual company; during trading on the stock market in real time. Approbation of the thesis results. The results of the research presented in one of the sections of the dissertation are presented in the scientific work: theses "Comparative analysis of approaches and methods for evaluating the emotional coloring of financial information about the current state of the company" at the XV conference of master's and postgraduate students "Applied mathematics and computing - PMK-2022". Publications. The results of the research presented in one of the sections of the dissertation are presented in the scientific work: theses "Comparative analysis of approaches and methods for evaluating the emotional coloring of financial information about the current state of the company" at the XV conference of master's and postgraduate students "Applied mathematics and computing - PMK-2022".
dc.format.extent154 с.
dc.identifier.citationАгафонов, Д. С. Математичне та програмне забезпечення системи прогнозування вартості фінансових активів компанії : магістерська дис. : 113 Прикладна математика / Агафонов Дмитро Сергійович. – Київ, 2023. – 154 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/66905
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectціни акцій
dc.subjectкорельовані активи
dc.subjectтехнічні індикатори
dc.subjectпониження розмірності
dc.subjectсемантичний аналіз тексту
dc.subjectстаціонарний часовий ряд
dc.subjectрекурентні нейронні мережі
dc.subjectмодель довгої короткострокової пам’яті
dc.subject.udc519.688:004.855.5
dc.titleМатематичне та програмне забезпечення системи прогнозування вартості фінансових активів компанії
dc.typeMaster Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Ahafonov_magistr.pdf
Розмір:
6.93 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: