Визначення позичальників кредитних установ за допомогою засобів штучного інтелекту

dc.contributor.advisorШубенкова, Ірина Анатоліївна
dc.contributor.authorГогуля, Нікіта Дмитрович
dc.date.accessioned2024-11-06T10:28:54Z
dc.date.available2024-11-06T10:28:54Z
dc.date.issued2024
dc.description.abstractДипломна робота: 103 с., 24 рис., 11 табл., 38 посилань, 1 додаток. Мета дослідження: розробка моделі машинного навчання для оцінки кредитоспроможності заявників, здатної прогнозувати ймовірність схвалення кредитних заявок на основі аналізу історичних даних. Об’єкт дослідження: процес оцінки кредитоспроможності заявників фінансовими установами. Предмет дослідження: використання методів машинного навчання для прогнозування кредитоспроможності заявників. Методи дослідження: заміна назв стовпчиків, обробка відсутніх значень середніми значеннями для числових даних і модою для категоріальних даних, нормалізація числових даних. Кодування категоріальних змінних методом One- Hot Encoding. Аналіз даних включав побудову гістограм, кореляційний аналіз та ROC-криві. В якості потенційних найкращих моделей розглядалися: логістична регресія, випадковий ліс, градієнтний бустинг (XGBoost) та багатошаровий перцептрон (MLP). Підбір гіперпараметрів за допомогою GridSearchCV. Результати: модель градієнтного бустингу (XGBoost) показала найкращий результат з AUC-ROC 0.91. Застосування системи дозволяє автоматизувати оцінку кредитоспроможності, підвищуючи точність та швидкість прийняття рішень, знижуючи ризики та покращуючи фінансові показники банків.
dc.description.abstractotherMaster's thesis: 103 p., 24 figures, 11 tables, 38 references, 1 appendix. Research objective: Develop a machine learning model to assess applicants' creditworthiness capable of predicting the likelihood of credit application approval based on the analysis of historical data. Object of research: The process of assessing applicants' creditworthiness by financial institutions. Subject of research: The use of machine learning methods to predict applicants' creditworthiness. Research methods: Renaming column headers, handling missing values by filling in mean values for numerical data and mode for categorical data, normalizing numerical data. Encoding categorical variables using One-Hot Encoding. Data analysis included constructing histograms, correlation analysis, and ROC curves. The potential best models considered were: logistic regression, random forest, gradient boosting (XGBoost), and multilayer perceptron (MLP). Hyperparameter tuning using GridSearchCV. Results: The gradient boosting model (XGBoost) showed the best result with an AUC-ROC of 0.91. The application of the system allows for automating the creditworthiness assessment, increasing the accuracy and speed of decision-making, reducing risks, and improving the financial performance of banks.
dc.format.extent103 с.
dc.identifier.citationГогуля, Н. Д. Визначення позичальників кредитних установ за допомогою засобів штучного інтелекту : дипломна робота ... бакалавра : 122 Комп'ютерні науки / Гогуля Нікіта Дмитрович. – Київ, 2024. – 103 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/70363
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectкредитоспроможність
dc.subjectмашинне навчання
dc.subjectштучний інтелект
dc.subjectкласифікація
dc.subjectаналіз даних
dc.subjectмоделі машинного навчання
dc.subjectоцінювання ризиків
dc.subjectлогістична регресія
dc.subjectнейронні мережі
dc.subjectградієнтний бустинг
dc.subjectcreditworthiness
dc.subjectmachine learning
dc.subjectartificial intelligence
dc.subjectclassification
dc.subjectdata analysis
dc.subjectmachine learning models
dc.subjectrisk assessment
dc.subjectlogistic regression
dc.subjectneural networks
dc.subjectgradient boosting
dc.titleВизначення позичальників кредитних установ за допомогою засобів штучного інтелекту
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Hohulia_bakalavr.pdf
Розмір:
2.75 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: