Система прогнозування результатів спортивних подій

dc.description.abstractenMaster's Thesis: 91 pp., 13 figs., 41 tables, 1 supplement, 67 sources. Topicality. Today, the field of betting and bookmaking is popular with a wide range of sports fans. Issues of predicting the outcome of future events are and will be relevant for everyday life, sports, politics and more. With the increase in the number and quality of methods of intellectual analysis, the idea of predicting the results of sports events through mathematical algorithms, which can help us to obtain more accurate predictions of results than to listen to the subjective predictions of football experts, has come to fruition. Probably the biggest problem for people who are professionally engaged in betting is to predict the outcome of events. The sports betting market is growing more and more dynamic every year. Every day, thousands of people place their bets on an event, using different methods to estimate likelihood. With the increase in market volume and the increasing number of bookmakers, it is becoming increasingly difficult for people to analyze and find successful event and market options. The paper introduces the concept of betting and describes in general terms the task of bookmaking. It defines the purpose of the research and the tasks that must be completed in order to achieve it. Existing research results of different scientists who have researched this problem are analyzed. There are four basic principles for predicting the outcome of sports events. Different approaches to the task have been considered and our own method has been proposed. Methods such as Poisson distribution, simulation modeling of the Markov Monte Carlo chain, and many other research methods have been considered. The formulation of the problem is formulated and the properties of the problem are investigated. A backtesting algorithm was developed and described as a mechanism for presenting team statistics at any point in time for a particular season to collect sports event data. Correlation analysis for the selected parameters was shown to show a moderate correlation of data and the use of Google AutoML to identify patterns between the data was described. The importance of using machine learning in solving this problem is substantiated. A system has been developed that collects event data and calculates statistics for each team at each point of time using the backtesting algorithm. A service has been developed to create and test the quality of the strategy. The results of experimental studies of task efficiency are presented, where we conducted experimental sets of strategies with and without adding the result of the AutoML service and for each strategy the Pearson correlation coefficient was calculated based on the results of two past seasons. The results obtained are analyzed. Relationship with working with scientific programs, plans, themes. The work was performed at the Department of Automated Information Processing and Management Systems of the National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" within the topic "Effective methods of solving the theory of schedules. State Registration Number ”(No. DR 0117U000919). The purpose of the system is to simplify the process of choosing the events to bet on, to improve the balance statistics of the betting people. To achieve this goal it is necessary to perform the following tasks: – review the known results of solving the task; – develop an event data collection process; – integrate with the service to calculate predictions for events; – to develop a backtesting algorithm; – to develop software implementation of the backtesting algorithm; – to analyze the results obtained. The object of study is the process of selecting sports events. The subject of the study - methods of predicting the results of sports events. Scientific novelty of the obtained results A backtesting method was developed to collect data and formulate a strategy that allows predicting the results of sporting events and verifying the reliability of a particular strategy through the use of correlation analysis. It is shown that the use of created models in AutoML system allows to get better correlation indicators between the results of different seasons. Publications. Theses have been published in the international scientific-practical conference "Mathematical and imitation modeling of the MODS 2019 systems" and in the all-Ukrainian scientific-practical conference of young scientists and students "Information systems and control technologies" (ISTU-2019). The article is published in the scientific journal "Bulletin of modern information technologies".uk
dc.description.abstractukМагістерська дисертація: 91 с., 13 рис., 41 табл., 1 додаток, 67 джерел. Актуальність. У сьогоденні сфера беттингу та букмекерства є популярною у широкого кола прихильників спорту. Питання прогнозування результатів майбутніх подій є і будуть актуальними для повсякденного життя, спорту, політики, тощо. Ринок спортивного беттингу росте з кожним роком все динамічніше та динамічніше. Кожен день тисячі людей роблять свої ставки на ту чи іншу подію, використовуючи при цьому різні методи для оцінки імовірності. З ростом кількості та якості методів інтелектуального аналізу стала здійсненною ідея прогнозування результатів спортивних подій. Застосування різних математичних методів допомагає отримати більш точні прогнози результатів, аніж суб’єктивні прогнози експертів. Над даною проблематикою працювали ряд світових вчених таких як Р. Бабута, Х.Каур, С. Добровек, Т. Доразіо, С. Гуражнел, М. Лео, А. Дістанте, Б. Жиянлук, Д.Карліс, І. Нтзоуфрас та інші. Для створення прогнозу на певну подію потрібно враховувати вплив багатьох факторів у системі та факторів ззовні системи. Також певні параметри можуть впливати не тільки на вихідний результат, а й чинити вплив на інші параметри. Через це встановлюється внутрішній зв'язок, який важко прогнозувати використовуючи тільки експертні думки. Непередбачуваність та неочевидність зв’язків в системі та між собою є головною проблемою прогнозування. З розвитком нейромереж стало можливим враховувати всі ці параметри та їх вплив на результат, завдяки чому і збільшилась точність прогнозування результатів певних подій. Отже, дана проблематика є актуальною на сьогоднішній день і потребує її вирішення. Зв'язок роботи з науковими програмами, планами, темами. Робота виконувалась на кафедрі автоматизованих систем обробки інформації та управління Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського» в рамках теми «Ефективні методи розв'язання задач теорії розкладів. Державний реєстраційний номер» (№ ДР 0117U000919). Метою створення системи є спрощення процесу вибору подій, на які слід зробити ставки, за рахунок прогнозування результатів спортивних подій. Для реалізації поставленої мети необхідно виконати такі завдання: – виконати огляд відомих результатів розв’язання поставленої задачі; – розробити процес збору даних про події; – виконати інтеграцію із сервісом для обрахунку передбачень для подій; – розробити алгоритм бектестінгу; – розробити програмну реалізацію алгоритму бектестінгу; – проаналізувати отримані результати. Об’єкт дослідження – процес підбору спортивних подій. Предмет дослідження – прогнозування результатів спортивних подій. Наукова новизна отриманих результатів Розроблено метод «бектестінгу» для збору даних та формування стратегії, що дозволяє прогнозувати результати спортивних подій та перевіряти надійність визначеної стратегії, за рахунок застосування кореляційного аналізу. Показано, що використання створених моделей у системі AutoML дозволяє отримати кращі показники кореляції між результатам різних сезонів. Публікації. Тезисні матеріали опубліковані у міжнародній науково-практичній конференції «Математичне та імітаційне моделювання систем МОДС 2019» а також у всеукраїнській науково-практичній конференції молодих вчених та студентів «Інформаційні системи та технології управління» (ІСТУ-2019). Статтю подано до друку в науковий журнал «Вісник сучасних інформаційних технологій».uk
