Середовище вибору оптимальної моделі машинного навчання для визначення стратегії бізнесу
| dc.contributor.advisor | Шаповалова, Світлана Ігорівна | |
| dc.contributor.author | Славицька, Олександра Миколаївна | |
| dc.date.accessioned | 2025-10-13T09:24:26Z | |
| dc.date.available | 2025-10-13T09:24:26Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Дипломна робота виконана на 67 сторінках, містить 27 ілюстрацій, 8 таблиць, 1 додаток, 12 джерел в переліку посилань. Мета роботи — створення середовища вибору оптимальної за точністю моделі машинного навчання. Методи та засоби: алгоритм кластеризації K-means, ансамблеві методи (Random Forest), поліноміальна регресія, стекінг (Stacked Generalization), мова програмування Python, бібліотеки Scikit-learn, Pandas, Matplotlib/Seaborn для візуалізації. У результаті проведеного дослідження та реалізації програмної системи були досягнуті наступні основні результати: ⎯ на основі аналізу методів розв’язання задачі регресії визначено для реалізації такі методи: лінійна регресія, дерево рішень, рандом форест; ⎯ реалізовано обрані моделі машинного навчання на основі бібліотеки Scikit-learn і ресуру Kaggle; ⎯ запропоновано вдосконалення методу рандом форест за рахунок передбачень попередньо навчених моделей регресії на прикладах окремих кластерів датасету; ⎯ експериментально доведено підвищення точності запропонованого методу Stacking Regression; ⎯ зозроблено середовище вибору моделі машинного навчання. Рекомендації щодо застосування: модель ефективна для задач з явною кластерною структурою даних (економічне прогнозування, аналіз ринків нерухомості, медична діагностика). | |
| dc.description.abstractother | The bachelor’s thesis consists of 67 pages, includes 27 figures, 8 tables, 1 appendix, and 12 references. Objective of the study: to develop an environment for selecting the most accurate machine learning model. Methods and tools: K-means clustering algorithm, ensemble methods (Random Forest), polynomial regression, stacking (Stacked Generalization), Python programming language, Scikit-learn library, and Pandas, Matplotlib/Seaborn for data visualization. As a result of the conducted research and the implementation of the software system, the following key outcomes were achieved: ⎯ based on the analysis of regression problem-solving methods, the following models were selected for implementation: linear regression, decision tree, and random forest; ⎯ the selected machine learning models were implemented using the Scikit-learn library and data from the Kaggle resource; ⎯ an improvement of the random forest method was proposed by incorporating predictions of pre-trained regression models for individual dataset clusters; ⎯ the improved method of Stacking Regression was experimentally proven to increase prediction accuracy; ⎯ a model selection environment for machine learning was developed. Recommendations for use: the model is effective for tasks with a clear cluster structure in the data (economic forecasting, real estate market analysis, medical diagnostics). | |
| dc.format.extent | 67 с. | |
| dc.identifier.citation | Славицька, О. М. Середовище вибору оптимальної моделі машинного навчання для визначення стратегії бізнесу : дипломна робота ... бакалавра : 122 Комп’ютерні науки / Славицька Олександра Миколаївна. – Київ, 2025. – 67 с. | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/76774 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Киев | |
| dc.subject | машинне навчання | |
| dc.subject | ансамблеві методи | |
| dc.subject | стекінг | |
| dc.subject | кластеризація | |
| dc.subject | прогнозування | |
| dc.subject | регресійний аналіз | |
| dc.subject | kmeans | |
| dc.subject | metric learning | |
| dc.subject | machine learning | |
| dc.subject | ensemble methods | |
| dc.subject | stacking | |
| dc.subject | clustering | |
| dc.subject | forecasting | |
| dc.subject | regression analysis | |
| dc.subject | k-means | |
| dc.title | Середовище вибору оптимальної моделі машинного навчання для визначення стратегії бізнесу | |
| dc.type | Bachelor Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Slavitskaya_bakalavr.pdf
- Розмір:
- 5.67 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: