Прогнозування популярності онлайн-курсів на платформі Coursera
| dc.contributor.author | Антюк, Ю. | |
| dc.contributor.author | Ліхоузова,Т. | |
| dc.contributor.author | Олійник, Ю. | |
| dc.date.accessioned | 2026-03-03T13:30:05Z | |
| dc.date.available | 2026-03-03T13:30:05Z | |
| dc.date.issued | 2026 | |
| dc.description.abstract | Робота присвячена побудові та дослідженню моделей прогнозування кількості студентів за основі рейтингу, кількості модулів, тривалості, рівня складності та типу розкладу курсів за допомогою лінійної та поліноміальної множинної регресії, Random forest та XGBoost та задачу класифікації курсів на популярні (більше 20000 студентів) та непопулярні (до 20000 студентів) методами логістичної регресії, Decision tree, Random forest та SVM. Для моделей прогнозування найкращий баланс показників R², MAE, RMSE та MSE у нормалізованій вибірці (кількість студентів <= 40000). У цій вибірці дані мають меншу дисперсію, тому моделі можуть ефективно захопити закономірності. Поліноміальні та ансамблеві моделі показують помітно кращу якість. Цей датафрейм можна використовувати як основну підвибірку для розробки надійної моделі. В обох розглянутих випадках класифікації курсів на популярні та непопулярні, найкращі результати стабільно демонструє модель Random Forest. Вона забезпечує найвищий precision для популярних курсів — ключової метрики для даної задачі, адже помилкова класифікація непопулярного курсу як популярного може призвести до фінансових втрат. Random Forest також демонструє збалансовані значення recall, f1-міри та загальної точності accuracy як на повному датасеті, так і на датасеті із кількістю студентів до 40000. Дерево рішень також є простою й інтерпретованою моделлю з непоганою якістю, але поступається Random Forest. Моделі SVM і логістична регресія мають нижчі показники precision для класу "популярний" і менш стабільну ефективність. Результати роботи можуть бути корисними для людей, що шукають перевірені та популярні курси для навчання і для організацій, що є провайдерами курсів. | |
| dc.description.abstractother | The work is devoted to the construction and study of models for predicting the number of students based on the rating, number of modules, duration, level of complexity and type of course schedule using linear and polynomial multiple regression, Random forest and XGBoost and the problem of classifying courses into popular (more than 20,000 students) and unpopular (up to 20,000 students) using logistic regression, Decision tree, Random forest and SVM methods. For forecasting models, the best balance of R², MAE, RMSE and MSE indicators is in the normalized sample (number of students <= 40,000). In this sample, the data has less variance, so the models can effectively capture patterns. Polynomial and ensemble models show noticeably better quality. This data frame can be used as the main subsample for developing a reliable model. In both considered cases of classifying courses into popular and unpopular, the Random Forest model consistently demonstrates the best results. It provides the highest precision for popular courses — a key metric for this task, since misclassifying an unpopular course as popular can lead to financial losses. Random Forest also demonstrates balanced recall, f1-measure, and overall accuracy values both on the full dataset and on a dataset with up to 40,000 students. Decision Tree is also a simple and interpretable model with good quality, but is inferior to Random Forest. SVM and logistic regression models have lower precision for the "popular" class and less consistent performance. The results of the work can be useful for people looking for proven and popular courses for training and for organizations that are course providers. | |
| dc.format.pagerange | С. 51-57 | |
| dc.identifier.citation | Антюк, Ю. Прогнозування популярності онлайн-курсів на платформі Coursera / Ю. Антюк, Т. Ліхоузова, Ю. Олійник // Адаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник. – 2026. – № 1 (48). – С. 51-57. – Бібліогр.: 9 назв. | |
| dc.identifier.doi | https://doi.org/10.20535/1560-8956.48.2026.351882 | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/79196 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.relation.ispartof | Адаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник, № 1 (48), 2026 | |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/4.0/ | |
| dc.subject | інтелектуальний аналіз даних | |
| dc.subject | модель прогнозування | |
| dc.subject | модель класифікації | |
| dc.subject | data mining | |
| dc.subject | prediction model | |
| dc.subject | classification model | |
| dc.subject.udc | 004.94 | |
| dc.title | Прогнозування популярності онлайн-курсів на платформі Coursera | |
| dc.title.alternative | Forecasting the popularity of online courses on the Coursera platform | |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: