Моделі і методи оцінювання кредитоспроможності фізичних осіб

dc.contributor.authorСолошенко, Олександр Миколайович
dc.contributor.degreedepartmentКафедра математичних методів системного аналізуuk
dc.contributor.degreefacultyНавчально-науковий комплекс "Інститут прикладного системного аналізу"uk
dc.contributor.degreegrantorНаціональний технічний університет України "Київський політехнічний інститут"uk
dc.date.accessioned2016-08-31T13:36:15Z
dc.date.available2016-08-31T13:36:15Z
dc.date.issued2016
dc.description.abstractenThe study is aimed at improvement of systems methodology of building scoring models for lending process and its program implementation within decision support system for building scorecards, and it is aimed at creating concrete predictive models. Scientific novelty of the research includes proposed discretization method for continuous variables, proposed estimation method for key predictive power indicators of categorical variables using aggregated input data, improvement of estimation method for statistical significance levels, improvement of k-nearest neighbor method, generalizations of logistic regression, Weight of Evidence, the Gini index and the Kolmogorov-Smirnov statistic for a probabilistic target variable and improvements of the key reject inference methods. In particular, as an example, the application credit scoring model for retail consumer lending demonstrates the advantages of the improved iterative classification method for reject inference implementation using two-level generalizations for a probabilistic target variable case. The results obtained show, in particular, faster convergence of the proposed improvement using constraint value of 10-6 and the Chebyshev distance for difference estimation of predicted probabilities for set of rejected applications and better forecast performance using validation sample (the value of the Gini index is equal to 40.11% versus 38.59%). Further complex methodological generalization, including generalization and domain extension of model fit measures which were previously applied for binary case only, allows the researchers to extend the application area of credit scoring methodology for the case of continuous probabilistic target variable that was not previously carried out. Also, the analytical formula was obtained for the first time for direct estimation of significance levels of logistic regression coefficients after evaluation of its standard deviations. The advantages of the proposed discretization method are proved in comparison with binary decision trees. The information system for building scoring models is developed.uk
dc.description.abstractruИсследование направлено на усовершенствование системной методологии построения скоринговых моделей в кредитовании, программную реализацию системы поддержки принятия решений для построения скоринговых карт и на создание конкретных прогнозных моделей. Научная новизна исследования включает предлагаемый метод дискретизации непрерывных переменных, предлагаемый метод расчета показателей предикативности категориальных переменных при агрегированных входящих данных, усовершенствование метода расчета уровней статистической значимости, усовершенствование метода k-ближайших соседей, обобщение логистической регрессии, веса категории переменной, индекса Джини и статистики Колмогорова-Смирнова для вероятностной целевой переменной и усовершенствование ключевых методов включения и анализа отклоненных заявок. В частности, на примере модели аппликационного кредитного скоринга для розничного потребительского кредитования продемонстрировано преимущества усовершенствованного метода итеративной классификации для включения и анализа отклоненных заявок, используя двухуровневые обобщения для случая вероятностной целевой переменной. Полученные результаты свидетельствуют, в частности, о более быстрой сходимости предложенного усовершенствования при использовании ограничения 10-6 и расстояния Чебишева для оценивания изменения прогнозированных вероятностей на множестве отклоненных заявок и лучшее качество прогнозов на тестовой выборке (значение индекса Джини равно 40,11% против 38,59%). Дальнейшее комплексное методологическое обобщение, включая обобщение и расширение области определения показателей качества сугубо бинарных моделей, позволяет исследователям расширить область применения методологии кредитного скоринга на случай непрерывной вероятностной целевой переменной, что ранее не выполнялось. Также впервые получено аналитическую формулу непосредственного вычисления уровней статистической значимости коэффициентов логистической регрессии после оценки среднеквадратических отклонений. Доказано преимущества предложенного метода дискретизации перед бинарными деревьями решений. Разработано информационную систему для построения скоринговых моделей.uk
dc.description.abstractukДослідження спрямоване на вдосконалення системної методології побудови скорингових моделей у кредитуванні, програмну реалізацію системи підтримки прийняття рішень для побудови скорингових карт та на створення конкретних прогнозних моделей. Наукова новизна дослідження включає пропонований метод дискретизації неперервних змінних, пропонований метод розрахунку показників предикативності категоріальних змінних при агрегованих вхідних даних, вдосконалення методу розрахунку рівнів статистичної значимості, вдосконалення методу k-найближчих сусідів, узагальнення логістичної регресії, ваги категорії змінної, індексу Джині та статистики Колмогорова-Смирнова для ймовірнісної цільової змінної та вдосконалення ключових методів включення та аналізу відхилених заявок. Зокрема, на прикладі моделі аплікаційного кредитного скорингу для роздрібного споживчого кредитування продемонстровано переваги вдосконаленого методу ітеративної класифікації для включення та аналізу відхилених заявок, використовуючи дворівневі узагальнення для випадку ймовірнісної цільової змінної. Отримані результати свідчать, зокрема, про швидшу збіжність пропонованого вдосконалення при використанні обмеження 10-6 та відстані Чебишева для оцінювання зміни прогнозованих ймовірностей на множині відхилених заявок та кращу якість прогнозів на тестовій вибірці (значення індексу Джині дорівнює 40,11% проти 38,59%). Подальше комплексне методологічне узагальнення, включаючи узагальнення та розширення області визначення показників якості суто бінарних моделей, дозволяє дослідникам розширити область застосування методології кредитного скорингу на випадок неперервної ймовірнісної цільової змінної, що не раніше виконувалося. Також вперше отримано аналітичну формулу безпосереднього обчислення рівнів статистичної значимості коефіцієнтів логістичної регресії після оцінки середньоквадратичних відхилень. Доведено переваги пропонованого методу дискретизації перед бінарними деревами рішень. Розроблено інформаційну систему для побудови скорингових моделей.відхилених заявок, використовуючи дворівневі узагальнення для випадку ймовірнісної цільової змінної. Отримані результати свідчать, зокрема, про швидшу збіжність пропонованого вдосконалення при використанні обмеження 10-6 та відстані Чебишева для оцінювання зміни прогнозованих ймовірностей на множині відхилених заявок та кращу якість прогнозів на тестовій вибірці (значення індексу Джині дорівнює 40,11% проти 38,59%). Подальше комплексне методологічне узагальнення, включаючи узагальнення та розширення області визначення показників якості суто бінарних моделей, дозволяє дослідникам розширити область застосування методології кредитного скорингу на випадок неперервної ймовірнісної цільової змінної, що не раніше виконувалося. Також вперше отримано аналітичну формулу безпосереднього обчислення рівнів статистичної значимості коефіцієнтів логістичної регресії після оцінки середньоквадратичних відхилень. Доведено переваги пропонованого методу дискретизації перед бінарними деревами рішень. Розроблено інформаційну систему для побудови скорингових моделей. відхилених заявок, використовуючи дворівневі узагальнення для випадку ймовірнісної цільової змінної. Отримані результати свідчать, зокрема, про швидшу збіжність пропонованого вдосконалення при використанні обмеження 10-6 та відстані Чебишева для оцінювання зміни прогнозованих ймовірностей на множині відхилених заявок та кращу якість прогнозів на тестовій вибірці (значення індексу Джині дорівнює 40,11% проти 38,59%). Подальше комплексне методологічне узагальнення, включаючи узагальнення та розширення області визначення показників якості суто бінарних моделей, дозволяє дослідникам розширити область застосування методології кредитного скорингу на випадок неперервної ймовірнісної цільової змінної, що не раніше виконувалося. Також вперше отримано аналітичну формулу безпосереднього обчислення рівнів статистичної значимості коефіцієнтів логістичної регресії після оцінки середньоквадратичних відхилень. Доведено переваги пропонованого методу дискретизації перед бінарними деревами рішень. Розроблено інформаційну систему для побудови скорингових моделей.відхилених заявок, використовуючи дворівневі узагальнення для випадку ймовірнісної цільової змінної. Отримані результати свідчать, зокрема, про швидшу збіжність пропонованого вдосконалення при використанні обмеження 10-6 та відстані Чебишева для оцінювання зміни прогнозованих ймовірностей на множині відхилених заявок та кращу якість прогнозів на тестовій вибірці (значення індексу Джині дорівнює 40,11% проти 38,59%). Подальше комплексне методологічне узагальнення, включаючи узагальнення та розширення області визначення показників якості суто бінарних моделей, дозволяє дослідникам розширити область застосування методології кредитного скорингу на випадок неперервної ймовірнісної цільової змінної, що не раніше виконувалося. Також вперше отримано аналітичну формулу безпосереднього обчислення рівнів статистичної значимості коефіцієнтів логістичної регресії після оцінки середньоквадратичних відхилень. Доведено переваги пропонованого методу дискретизації перед бінарними деревами рішень. Розроблено інформаційну систему для побудови скорингових моделей.uk
dc.format.page22 c.uk
dc.identifier.citationСолошенко О. М. Моделі і методи оцінювання кредитоспроможності фізичних осіб : автореф. дис. ... канд. техн. наук. : 01.05.04 – системний аналіз і теорія оптимальних рішень / Олександр Миколайович Солошенко. - Київ, 2016. - 22 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/17460
dc.language.isoukuk
dc.publisherНТУУ "КПІ"uk
dc.publisher.placeКиївuk
dc.status.pubpublisheduk
dc.subjectсистемний аналізuk
dc.subjectсистемна методологіяuk
dc.subjectкредитний скорингuk
dc.subjectлогістична регресіяuk
dc.subjectаналіз відхилених заявокuk
dc.subjectроздрібне кредитуванняuk
dc.subjectсистемный анализuk
dc.subjectсистемная методологияuk
dc.subjectкредитный скорингuk
dc.subjectлогистическая регрессияuk
dc.subjectанализ отклоненных заявокuk
dc.subjectрозничное кредитованиеuk
dc.subjectsystems analysisuk
dc.subjectsystems methodologyuk
dc.subjectcredit scoringuk
dc.subjectlogistic regressionuk
dc.subjectreject inferenceuk
dc.subjectretail lendinguk
dc.subject.udc336.774.067:519.87(043.3)uk
dc.subject.udc519.711:519.863(043.3)
dc.titleМоделі і методи оцінювання кредитоспроможності фізичних осібuk
dc.typeThesisuk
thesis.degree.levelcandidateuk
thesis.degree.nameкандидат технічних наукuk
thesis.degree.speciality01.05.04 – системний аналіз і теорія оптимальних рішеньuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Soloshenko_aref.pdf
Розмір:
1.21 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
7.71 KB
Формат:
Item-specific license agreed upon to submission
Опис: