Система прогнозування активності користувачів на основі збору та аналізу статистичних даних

dc.contributor.advisorНаливайчук, Микола Васильович
dc.contributor.authorШостак, Михайло Сергійович
dc.date.accessioned2022-01-18T10:17:28Z
dc.date.available2022-01-18T10:17:28Z
dc.date.issued2021
dc.description.abstractenActuality of theme. Today, the world of IT is evolving rapidly, and the use of the Internet is becoming an integral part of our lives. Mankind spends a lot of time every day on work, study and entertainment on the Internet. And the number of created Internet resources is growing exponentially every day. It makes our lives more informative and modern. The use of artificial intelligence, cloud computing and machine learning enables Internet resource owners to collect and process statistics of various kinds of website for further analysis. As a result of statistical research, owners of Internet resources have the opportunity to use a variety of software solutions to promote and update their own Internet resource. All these tools are used to attract the target audience. Therefore, the development of a system for predicting user activity based on statistical data of Internet resources is an urgent and important task, both from a scientific and practical point of view. The object of the study is to develop a system for predicting user activity based on statistical data of Internet resources and modifying the linear regression algorithm to improve its functionality and accuracy of the study. The subject of the research is the technologies of web application development for Internet resources and the existing machine learning algorithms for processing and analysis of statistical data. Purpose: to create a web application for tracking session information of active users of the Internet resource in real time and to modify the functions of estimating the linear regression algorithm of machine learning. The scientific novelty is as follows: 1. A new class for calculating the values of the value function of the linear regression algorithm is proposed to improve the process of estimating the obtained linear values. 2. On the basis of the obtained variance values, new conditions are derived under which the proposed evaluator of results worked better than the existing library. The practical value of the results obtained in this work is that the proposed functionality of the web application allows the owners of Internet resources in real time to track session information of each of the active users who are on the pages of the website. It is also possible to monitor and block bots with gray IP addresses that have entered the Internet resource. Based on the obtained statistics of the Internet resource, the desktop application creates a model for forecasting user activity, which is based on a set of session data about each user. This data set can contain information about which pages of the website were the most visited among users, in the case of using the online resource as an online store, which product categories were the most popular and best sold, and more. Creating a model for predicting user activity is achieved by using a linear regression algorithm, where it was applied and implemented its own solution to improve the accuracy of this algorithm. The developed improvement can be used not only to predict user activity, but also for other aspects of Internet resources. Approbation of work. The main provisions and results of the work were presented and discussed at the XIV scientific-practical conference of undergraduates and graduate students PMK-2021 of the Faculty of Applied Mathematics and at the V International scientific-practical conference "TOPICAL ISSUES OF MODERN SCIENCE, SOCIETY AND EDUCATION", held November 28-30 2021 in the city of Kharkiv. Structure and scope of work. The master's dissertation consists of an introduction, four chapters and conclusions. The introduction presents a general description of the work, assesses the current state of the problem, substantiates the relevance of research, formulates the purpose and objectives of research, shows the scientific novelty of the results and practical value of the work, provides information on approbation of results and their implementation. The first section discusses the existing software solutions, analyzes them and provides an objective assessment, as well as the relevance of the developed solution and providing the basic requirements for the system. The second section analyzes the programming languages and technologies used. In the third section the general description of the software decision was carried out, the program - algorithmic structure of the developed system is described and considered. The fourth section analyzed the developed software solution and provided recommendations for the practical use of these tools. The conclusions present the results of the work.uk
dc.description.abstractukАктуальність теми. Сьогодні IT-світ швидко розвивається, і використання Інтернету стає невід’ємною частиною нашого життя. Люди щодня витрачають багато часу на роботу, навчання та розваги в Інтернеті. А кількість створених інтернет-ресурсів з кожним днем збільшується в геометричній прогресії. Це робить наше життя більш сучаснішим. Використання штучного інтелекту, хмарних обчислень і машинного навчання дає змогу власникам інтернет-ресурсів збирати та обробляти статистичні дані різних аспектів веб-сайту для подальшого аналізу. В результаті статистичних досліджень власники інтернет-ресурсів мають можливість використовувати різноманітні програмні рішення для просування та оновлення власних веб - сайтів. Всі ці інструменти використовуються для залучення цільової аудиторії. Тому розроблення системи прогнозування активності користувачів на основі статистичних даних інтернет – ресурсів є актуальною і важливою задачею, як з наукової, так і з практичної точки зору. Об’єктом дослідження є розроблення системи прогнозування активності користувачів на основі статистичних даних інтернет - ресурсів та модифікування алгоритму лінійної регресії для покращення його функціональності та точності дослідження. Предметом дослідження є технології розроблення веб-додатків для інтернет - ресурсів та існуючі алгоритми машинного навчання для обробки та аналізу статистичних даних. Мета роботи: створення веб – додатку для відслідковування сесійної інформації активних користувачів інтернет – ресурсу у режимі реального часу та модифікація функцій оцінювання алгоритму лінійної регресії машинного навчання. Наукова новизна полягає в наступному: 1. Запропоновано новий клас підрахунку значень функції вартості алгоритму лінійної регресії для покращення процесу оцінки отриманих лінійних значень. 2. На основі отриманих значень дисперсії, виведені нові умови при яких запропонований оцінювач результатів працював краще, ніж існуючий бібліотечний. Практична цінність отриманих в роботі результатів полягає в тому, що запропонований функціонал веб - додатку надає можливість власникам інтернет – ресурсів у режимі реального часу відслідковувати сесійну інформацію кожного із активних користувачів, які перебувають на сторінках веб – сайту. Також існує можливість відслідковувати та блокувати ботів із сірими IP – адресами, що зайшли на інтернет - ресурс. На основі отриманих статистичних даних інтернет – ресурсу настільний додаток створює модель прогнозування активності користувачів, яка будується на основі набору сесійних даних про кожного користувача. Даний набір даних може містити інформацію, про те, які сторінки веб – сайту були найбільш відвідуваними серед користувачів, у випадку використання інтернет – ресурсу у якості інтернет – магазину, які категорії продуктів були найбільш популярними та продавалися найкраще та інше. Створення моделі прогнозування активності користувачів досягається шляхом використання алгоритму лінійної регресії, де була застосовано та впроваджене власне рішення, щодо покращення точності даного алгоритму. Розроблюване покращення можна застосовувати не тільки для прогнозування активності користувачів, а і для інших аспектів інтернет – ресурсів. Апробація роботи. Основні положення і результати роботи були представлені та обговорювались на XІV науково-практичній конференції магістрантів та аспірантів ПМК-2021 факультету прикладної математики та на V Міжнародній науково – практичній конференції “TOPICAL ISSUES OF MODERN SCIENCE, SOCIETY AND EDUCATION”, що відбулася 28-30 листопада 2021 року у місті Харків. Структура та обсяг роботи. Магістерська дисертація складається з вступу, чотирьох розділів та висновків. У вступі подано загальну характеристику роботи, зроблено оцінку сучасного стану проблеми, обґрунтовано актуальність напрямку досліджень, сформульовано мету і задачі досліджень, показано наукову новизну отриманих результатів і практичну цінність роботи, наведено відомості про апробацію результатів і їхнє впровадження. У першому розділі розглянуто існуючі програмні рішення, проведено їх аналіз та надана об’єктивна оцінка, також була наведена актуальність розробленого рішення та наданні основні вимоги до створеної системи. У другому розділі було проведено аналіз використаних мов програмування та технологій. У третьому розділі був проведений загальний опис програмного рішення, описані та розглянута програмно – алгоритмічна структура розробленої системи. У четвертому розділі був проведений аналіз розробленого програмного рішення та були надані рекомендації, щодо практичного використання даних засобів. У висновках представлені результати проведеної роботи.uk
dc.format.page89 с.uk
dc.identifier.citationШостак, М. С. Система прогнозування активності користувачів на основі статистичних даних : магістерська дис. : 123 Комп’ютерна інженерія / Шостак Михайло Сергійович. – Київ, 2021. – 89 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/45921
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectалгоритми машинного навчанняuk
dc.subjectлінійна регресіяuk
dc.subjectmachine learning algorithmsuk
dc.subjectlinear regressionuk
dc.subject.udc004.021uk
dc.titleСистема прогнозування активності користувачів на основі збору та аналізу статистичних данихuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Shostak_magistr.pdf
Розмір:
1.8 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: