Рангова система на основі навчання з підкріпленням
Вантажиться...
Дата
2020
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Магістерська дисертація: 93 с., 16 рис., 36 табл., 9 джерел, 2 додатки.
У магістерській дисертації досліджуються методи побудов рейтингових
моделей для спортивних подій, що базуються на навчанні з підкріпленням.
Було розглянуто вже існуючі підходи до розробки рейтингових моделей,
наведено математичну основу описаних моделей та викладено основні
алгоритми, що застосовуються при реалізації.
У роботі також розглянуто метод байєсівської оптимізації, як основний до
використання в роботі. Описано багато можливих варіацій реалізації цього
методу, а саме різні стратегії обрання наступної точки дослідження та
кореляційні функції гаусівських процесів.
Практичне дослідження побудовано на створені рейтингової системи для
передбачення результатів тенісних матчів ATP (Асоціація тенісистів
професіоналів) турнірів починаючи з 2008 року. Дані було взято з відкритих
джерел.
Отримані результати було проаналізовано, оцінено та порівняно.
Результати порівняння викладено в висновках.
На основі розглянутої теми розроблено елементи стартап-проекту.
Опис
Ключові слова
рейтингові моделі, рангові моделі, навчання з підкріпленням, байєсівська оптимізація, q-навчання, беттінг, rating models, ranking models, reinforcement learning, bayesian optimization, q-learning, betting
Бібліографічний опис
Сайног, О. М. Рангова система на основі навчання з підкріпленням : магістерська дис. : 124 Системний аналіз / Сайног Олексій Максимович. – Київ, 2020. – 93 с.