Система прогнозування активності користувачів на основі збору та аналізу статистичних даних
Вантажиться...
Дата
2021
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Актуальність теми. Сьогодні IT-світ швидко розвивається, і використання Інтернету стає невід’ємною частиною нашого життя. Люди щодня витрачають багато часу на роботу, навчання та розваги в Інтернеті. А кількість створених інтернет-ресурсів з кожним днем збільшується в геометричній прогресії. Це робить наше життя більш сучаснішим. Використання штучного інтелекту, хмарних обчислень і машинного навчання дає змогу власникам інтернет-ресурсів збирати та обробляти статистичні дані різних аспектів веб-сайту для подальшого аналізу. В результаті статистичних досліджень власники інтернет-ресурсів мають можливість використовувати різноманітні програмні рішення для просування та оновлення власних веб - сайтів. Всі ці інструменти використовуються для залучення цільової аудиторії. Тому розроблення системи прогнозування активності користувачів на основі статистичних даних інтернет – ресурсів є актуальною і важливою задачею, як з наукової, так і з практичної точки зору.
Об’єктом дослідження є розроблення системи прогнозування активності користувачів на основі статистичних даних інтернет - ресурсів та модифікування алгоритму лінійної регресії для покращення його функціональності та точності дослідження.
Предметом дослідження є технології розроблення веб-додатків для інтернет - ресурсів та існуючі алгоритми машинного навчання для обробки та аналізу статистичних даних.
Мета роботи: створення веб – додатку для відслідковування сесійної інформації активних користувачів інтернет – ресурсу у режимі реального часу та модифікація функцій оцінювання алгоритму лінійної регресії машинного навчання.
Наукова новизна полягає в наступному:
1. Запропоновано новий клас підрахунку значень функції вартості алгоритму лінійної регресії для покращення процесу оцінки отриманих лінійних значень.
2. На основі отриманих значень дисперсії, виведені нові умови при яких запропонований оцінювач результатів працював краще, ніж існуючий бібліотечний.
Практична цінність отриманих в роботі результатів полягає в тому, що запропонований функціонал веб - додатку надає можливість власникам інтернет – ресурсів у режимі реального часу відслідковувати сесійну інформацію кожного із активних користувачів, які перебувають на сторінках веб – сайту. Також існує можливість відслідковувати та блокувати ботів із сірими IP – адресами, що зайшли на інтернет - ресурс.
На основі отриманих статистичних даних інтернет – ресурсу настільний додаток створює модель прогнозування активності користувачів, яка будується на основі набору сесійних даних про кожного користувача. Даний набір даних може містити інформацію, про те, які сторінки веб – сайту були найбільш відвідуваними серед користувачів, у випадку використання інтернет – ресурсу у якості інтернет – магазину, які категорії продуктів були найбільш популярними та продавалися найкраще та інше.
Створення моделі прогнозування активності користувачів досягається шляхом використання алгоритму лінійної регресії, де була застосовано та впроваджене власне рішення, щодо покращення точності даного алгоритму. Розроблюване покращення можна застосовувати не тільки для прогнозування активності користувачів, а і для інших аспектів інтернет – ресурсів.
Апробація роботи. Основні положення і результати роботи були представлені та обговорювались на XІV науково-практичній конференції магістрантів та аспірантів ПМК-2021 факультету прикладної математики та на V Міжнародній науково – практичній конференції “TOPICAL ISSUES OF MODERN SCIENCE, SOCIETY AND EDUCATION”, що відбулася 28-30 листопада 2021 року у місті Харків.
Структура та обсяг роботи. Магістерська дисертація складається з вступу, чотирьох розділів та висновків.
У вступі подано загальну характеристику роботи, зроблено оцінку сучасного стану проблеми, обґрунтовано актуальність напрямку досліджень, сформульовано мету і задачі досліджень, показано наукову новизну отриманих результатів і практичну цінність роботи, наведено відомості про апробацію результатів і їхнє впровадження.
У першому розділі розглянуто існуючі програмні рішення, проведено їх аналіз та надана об’єктивна оцінка, також була наведена актуальність розробленого рішення та наданні основні вимоги до створеної системи.
У другому розділі було проведено аналіз використаних мов програмування та технологій.
У третьому розділі був проведений загальний опис програмного рішення, описані та розглянута програмно – алгоритмічна структура розробленої системи.
У четвертому розділі був проведений аналіз розробленого програмного рішення та були надані рекомендації, щодо практичного використання даних засобів.
У висновках представлені результати проведеної роботи.
Опис
Ключові слова
алгоритми машинного навчання, лінійна регресія, machine learning algorithms, linear regression
Бібліографічний опис
Шостак, М. С. Система прогнозування активності користувачів на основі статистичних даних : магістерська дис. : 123 Комп’ютерна інженерія / Шостак Михайло Сергійович. – Київ, 2021. – 89 с.