Середовище вибору оптимальної моделі машинного навчання для визначення стратегії бізнесу

dc.contributor.advisorШаповалова, Світлана Ігорівна
dc.contributor.authorСлавицька, Олександра Миколаївна
dc.date.accessioned2025-10-13T09:24:26Z
dc.date.available2025-10-13T09:24:26Z
dc.date.issued2025
dc.description.abstractДипломна робота виконана на 67 сторінках, містить 27 ілюстрацій, 8 таблиць, 1 додаток, 12 джерел в переліку посилань. Мета роботи — створення середовища вибору оптимальної за точністю моделі машинного навчання. Методи та засоби: алгоритм кластеризації K-means, ансамблеві методи (Random Forest), поліноміальна регресія, стекінг (Stacked Generalization), мова програмування Python, бібліотеки Scikit-learn, Pandas, Matplotlib/Seaborn для візуалізації. У результаті проведеного дослідження та реалізації програмної системи були досягнуті наступні основні результати: ⎯ на основі аналізу методів розв’язання задачі регресії визначено для реалізації такі методи: лінійна регресія, дерево рішень, рандом форест; ⎯ реалізовано обрані моделі машинного навчання на основі бібліотеки Scikit-learn і ресуру Kaggle; ⎯ запропоновано вдосконалення методу рандом форест за рахунок передбачень попередньо навчених моделей регресії на прикладах окремих кластерів датасету; ⎯ експериментально доведено підвищення точності запропонованого методу Stacking Regression; ⎯ зозроблено середовище вибору моделі машинного навчання. Рекомендації щодо застосування: модель ефективна для задач з явною кластерною структурою даних (економічне прогнозування, аналіз ринків нерухомості, медична діагностика).
dc.description.abstractotherThe bachelor’s thesis consists of 67 pages, includes 27 figures, 8 tables, 1 appendix, and 12 references. Objective of the study: to develop an environment for selecting the most accurate machine learning model. Methods and tools: K-means clustering algorithm, ensemble methods (Random Forest), polynomial regression, stacking (Stacked Generalization), Python programming language, Scikit-learn library, and Pandas, Matplotlib/Seaborn for data visualization. As a result of the conducted research and the implementation of the software system, the following key outcomes were achieved: ⎯ based on the analysis of regression problem-solving methods, the following models were selected for implementation: linear regression, decision tree, and random forest; ⎯ the selected machine learning models were implemented using the Scikit-learn library and data from the Kaggle resource; ⎯ an improvement of the random forest method was proposed by incorporating predictions of pre-trained regression models for individual dataset clusters; ⎯ the improved method of Stacking Regression was experimentally proven to increase prediction accuracy; ⎯ a model selection environment for machine learning was developed. Recommendations for use: the model is effective for tasks with a clear cluster structure in the data (economic forecasting, real estate market analysis, medical diagnostics).
dc.format.extent67 с.
dc.identifier.citationСлавицька, О. М. Середовище вибору оптимальної моделі машинного навчання для визначення стратегії бізнесу : дипломна робота ... бакалавра : 122 Комп’ютерні науки / Славицька Олександра Миколаївна. – Київ, 2025. – 67 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/76774
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиев
dc.subjectмашинне навчання
dc.subjectансамблеві методи
dc.subjectстекінг
dc.subjectкластеризація
dc.subjectпрогнозування
dc.subjectрегресійний аналіз
dc.subjectkmeans
dc.subjectmetric learning
dc.subjectmachine learning
dc.subjectensemble methods
dc.subjectstacking
dc.subjectclustering
dc.subjectforecasting
dc.subjectregression analysis
dc.subjectk-means
dc.titleСередовище вибору оптимальної моделі машинного навчання для визначення стратегії бізнесу
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Slavitskaya_bakalavr.pdf
Розмір:
5.67 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: