Застосування інструментів інтелектуального аналізу даних для класифікації кредитних заявок

dc.contributor.advisorГуськова, Віра Геннадіївна
dc.contributor.authorЯрмолаєва, Наталія Андріївна
dc.date.accessioned2025-09-22T08:06:50Z
dc.date.available2025-09-22T08:06:50Z
dc.date.issued2025
dc.description.abstractДипломна робота: 96 с., 23 рис., 6 табл., 2 додатки, 23 посилання. Об’єкт дослідження – процес оцінювання кредитоспроможності клієнтів банку. Предмет дослідження – моделі машинного навчання, що використовуються для автоматизованої оцінки фінансових ризиків. Мета роботи – розробити програмний прототип, який дозволяє класифікувати позичальників за рівнем кредитоспроможності на основі історичних та поточних клієнтських даних. У межах дипломного дослідження здійснено комплексний огляд актуальних підходів до оцінювання кредитоспроможності, серед яких розглянуто логістичну регресію, методи на основі дерев рішень, алгоритм випадкового лісу, градієнтний бустинг (XGBoost), а також ансамблеві стратегії, зокрема Stacking і Bagging. Описано етапи збору, очищення та обробки даних, зокрема кодування змінних, нормалізацію, обробку пропущених значень та балансування класів. На основі відкритого датасету побудовано кілька моделей, проведено їх навчання, валідацію та порівняльний аналіз за основними метриками якості класифікації (Accuracy, Precision, Recall, F1-score, AUC-ROC). Реалізовано прототип системи на Python з використанням бібліотек scikit-learn, XGBoost, pandas та matplotlib. Отримані результати дослідження засвідчують ефективність використання інтелектуальних моделей для підвищення точності та оперативності процесу кредитного аналізу.
dc.description.abstractotherThesis: 96 pages, 23 figures, 6 tables, 2 appendiсes, 23 references. Object of the research – the procedure for analyzing the creditworthiness of individuals applying for bank loans. Subject of the research – machine learning techniques utilized for automating credit risk evaluation. Aim of the study – to design and implement a software prototype capable of categorizing loan applicants based on their credit reliability, using both historical records and current customer data. This thesis investigates advanced credit scoring techniques, incorporating models such as logistic regression, decision tree algorithms, random forests, gradient boosting (specifically XGBoost), and ensemble strategies like stacking. The study outlines the complete data preparation pipeline, including data acquisition, variable transformation (e.g., encoding), normalization, treatment of missing entries, and class distribution adjustment. Multiple predictive models were developed using a publicly accessible dataset, subsequently trained, validated, and benchmarked against one another using standard classification performance indicators— Accuracy, Precision, Recall, F1-score, and AUC-ROC. A fully functional prototype was developed in Python, leveraging libraries including scikit-learn, XGBoost, pandas, and matplotlib. The outcomes clearly demonstrate that intelligent machine learning solutions can significantly increase both the precision and efficiency of credit risk assessment processes.
dc.format.extent98 с.
dc.identifier.citationЯрмолаєва, Н. А. Застосування інструментів інтелектуального аналізу даних для класифікації кредитних заявок : дипломна робота … бакалавра : 124 Системний аналіз / Ярмолаєва Наталія Андріївна. – Київ, 2025. – 98 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/76198
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectкредитоспроможність
dc.subjectскоринг
dc.subjectмашинне навчання
dc.subjectлогістична регресія
dc.subjectдерева рішень
dc.subjectxgboost
dc.subjectстекінг
dc.subjectфінансові ризики
dc.subjectкласифікація
dc.titleЗастосування інструментів інтелектуального аналізу даних для класифікації кредитних заявок
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Yarmolaieva_bakalavr.pdf
Розмір:
2.71 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: