Середовище вибору оптимальної моделі машинного навчання для визначення стратегії бізнесу
Вантажиться...
Дата
2025
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дипломна робота виконана на 67 сторінках, містить 27 ілюстрацій, 8 таблиць, 1 додаток, 12 джерел в переліку посилань.
Мета роботи — створення середовища вибору оптимальної за точністю моделі машинного навчання.
Методи та засоби: алгоритм кластеризації K-means, ансамблеві методи (Random Forest), поліноміальна регресія, стекінг (Stacked Generalization), мова програмування Python, бібліотеки Scikit-learn, Pandas, Matplotlib/Seaborn для візуалізації.
У результаті проведеного дослідження та реалізації програмної системи були досягнуті наступні основні результати:
⎯ на основі аналізу методів розв’язання задачі регресії визначено для реалізації такі методи: лінійна регресія, дерево рішень, рандом форест;
⎯ реалізовано обрані моделі машинного навчання на основі бібліотеки Scikit-learn і ресуру Kaggle;
⎯ запропоновано вдосконалення методу рандом форест за рахунок передбачень попередньо навчених моделей регресії на прикладах окремих кластерів датасету;
⎯ експериментально доведено підвищення точності запропонованого методу Stacking Regression;
⎯ зозроблено середовище вибору моделі машинного навчання.
Рекомендації щодо застосування: модель ефективна для задач з явною кластерною структурою даних (економічне прогнозування, аналіз ринків нерухомості, медична діагностика).
Опис
Ключові слова
машинне навчання, ансамблеві методи, стекінг, кластеризація, прогнозування, регресійний аналіз, kmeans, metric learning, machine learning, ensemble methods, stacking, clustering, forecasting, regression analysis, k-means
Бібліографічний опис
Славицька, О. М. Середовище вибору оптимальної моделі машинного навчання для визначення стратегії бізнесу : дипломна робота ... бакалавра : 122 Комп’ютерні науки / Славицька Олександра Миколаївна. – Київ, 2025. – 67 с.