Моделі і методи оцінювання кредитоспроможності фізичних осіб
dc.contributor.author | Солошенко, Олександр Миколайович | |
dc.contributor.degreedepartment | Кафедра математичних методів системного аналізу | uk |
dc.contributor.degreefaculty | Навчально-науковий комплекс "Інститут прикладного системного аналізу" | uk |
dc.contributor.degreegrantor | Національний технічний університет України "Київський політехнічний інститут" | uk |
dc.date.accessioned | 2016-08-31T13:36:15Z | |
dc.date.available | 2016-08-31T13:36:15Z | |
dc.date.issued | 2016 | |
dc.description.abstracten | The study is aimed at improvement of systems methodology of building scoring models for lending process and its program implementation within decision support system for building scorecards, and it is aimed at creating concrete predictive models. Scientific novelty of the research includes proposed discretization method for continuous variables, proposed estimation method for key predictive power indicators of categorical variables using aggregated input data, improvement of estimation method for statistical significance levels, improvement of k-nearest neighbor method, generalizations of logistic regression, Weight of Evidence, the Gini index and the Kolmogorov-Smirnov statistic for a probabilistic target variable and improvements of the key reject inference methods. In particular, as an example, the application credit scoring model for retail consumer lending demonstrates the advantages of the improved iterative classification method for reject inference implementation using two-level generalizations for a probabilistic target variable case. The results obtained show, in particular, faster convergence of the proposed improvement using constraint value of 10-6 and the Chebyshev distance for difference estimation of predicted probabilities for set of rejected applications and better forecast performance using validation sample (the value of the Gini index is equal to 40.11% versus 38.59%). Further complex methodological generalization, including generalization and domain extension of model fit measures which were previously applied for binary case only, allows the researchers to extend the application area of credit scoring methodology for the case of continuous probabilistic target variable that was not previously carried out. Also, the analytical formula was obtained for the first time for direct estimation of significance levels of logistic regression coefficients after evaluation of its standard deviations. The advantages of the proposed discretization method are proved in comparison with binary decision trees. The information system for building scoring models is developed. | uk |
dc.description.abstractru | Исследование направлено на усовершенствование системной методологии построения скоринговых моделей в кредитовании, программную реализацию системы поддержки принятия решений для построения скоринговых карт и на создание конкретных прогнозных моделей. Научная новизна исследования включает предлагаемый метод дискретизации непрерывных переменных, предлагаемый метод расчета показателей предикативности категориальных переменных при агрегированных входящих данных, усовершенствование метода расчета уровней статистической значимости, усовершенствование метода k-ближайших соседей, обобщение логистической регрессии, веса категории переменной, индекса Джини и статистики Колмогорова-Смирнова для вероятностной целевой переменной и усовершенствование ключевых методов включения и анализа отклоненных заявок. В частности, на примере модели аппликационного кредитного скоринга для розничного потребительского кредитования продемонстрировано преимущества усовершенствованного метода итеративной классификации для включения и анализа отклоненных заявок, используя двухуровневые обобщения для случая вероятностной целевой переменной. Полученные результаты свидетельствуют, в частности, о более быстрой сходимости предложенного усовершенствования при использовании ограничения 10-6 и расстояния Чебишева для оценивания изменения прогнозированных вероятностей на множестве отклоненных заявок и лучшее качество прогнозов на тестовой выборке (значение индекса Джини равно 40,11% против 38,59%). Дальнейшее комплексное методологическое обобщение, включая обобщение и расширение области определения показателей качества сугубо бинарных моделей, позволяет исследователям расширить область применения методологии кредитного скоринга на случай непрерывной вероятностной целевой переменной, что ранее не выполнялось. Также впервые получено аналитическую формулу непосредственного вычисления уровней статистической значимости коэффициентов логистической регрессии после оценки среднеквадратических отклонений. Доказано преимущества предложенного метода дискретизации перед бинарными деревьями решений. Разработано информационную систему для построения скоринговых моделей. | uk |
dc.description.abstractuk | Дослідження спрямоване на вдосконалення системної методології побудови скорингових моделей у кредитуванні, програмну реалізацію системи підтримки прийняття рішень для побудови скорингових карт та на створення конкретних прогнозних моделей. Наукова новизна дослідження включає пропонований метод дискретизації неперервних змінних, пропонований метод розрахунку показників предикативності категоріальних змінних при агрегованих вхідних даних, вдосконалення методу розрахунку рівнів статистичної значимості, вдосконалення методу k-найближчих сусідів, узагальнення логістичної регресії, ваги категорії змінної, індексу Джині та статистики Колмогорова-Смирнова для ймовірнісної цільової змінної та вдосконалення ключових методів включення та аналізу відхилених заявок. Зокрема, на прикладі моделі аплікаційного кредитного скорингу для роздрібного споживчого кредитування продемонстровано переваги вдосконаленого методу ітеративної класифікації для включення та аналізу відхилених заявок, використовуючи дворівневі узагальнення для випадку ймовірнісної цільової змінної. Отримані результати свідчать, зокрема, про швидшу збіжність пропонованого вдосконалення при використанні обмеження 10-6 та відстані Чебишева для оцінювання зміни прогнозованих ймовірностей на множині відхилених заявок та кращу якість прогнозів на тестовій вибірці (значення індексу Джині дорівнює 40,11% проти 38,59%). Подальше комплексне методологічне узагальнення, включаючи узагальнення та розширення області визначення показників якості суто бінарних моделей, дозволяє дослідникам розширити область застосування методології кредитного скорингу на випадок неперервної ймовірнісної цільової змінної, що не раніше виконувалося. Також вперше отримано аналітичну формулу безпосереднього обчислення рівнів статистичної значимості коефіцієнтів логістичної регресії після оцінки середньоквадратичних відхилень. Доведено переваги пропонованого методу дискретизації перед бінарними деревами рішень. Розроблено інформаційну систему для побудови скорингових моделей.відхилених заявок, використовуючи дворівневі узагальнення для випадку ймовірнісної цільової змінної. Отримані результати свідчать, зокрема, про швидшу збіжність пропонованого вдосконалення при використанні обмеження 10-6 та відстані Чебишева для оцінювання зміни прогнозованих ймовірностей на множині відхилених заявок та кращу якість прогнозів на тестовій вибірці (значення індексу Джині дорівнює 40,11% проти 38,59%). Подальше комплексне методологічне узагальнення, включаючи узагальнення та розширення області визначення показників якості суто бінарних моделей, дозволяє дослідникам розширити область застосування методології кредитного скорингу на випадок неперервної ймовірнісної цільової змінної, що не раніше виконувалося. Також вперше отримано аналітичну формулу безпосереднього обчислення рівнів статистичної значимості коефіцієнтів логістичної регресії після оцінки середньоквадратичних відхилень. Доведено переваги пропонованого методу дискретизації перед бінарними деревами рішень. Розроблено інформаційну систему для побудови скорингових моделей. відхилених заявок, використовуючи дворівневі узагальнення для випадку ймовірнісної цільової змінної. Отримані результати свідчать, зокрема, про швидшу збіжність пропонованого вдосконалення при використанні обмеження 10-6 та відстані Чебишева для оцінювання зміни прогнозованих ймовірностей на множині відхилених заявок та кращу якість прогнозів на тестовій вибірці (значення індексу Джині дорівнює 40,11% проти 38,59%). Подальше комплексне методологічне узагальнення, включаючи узагальнення та розширення області визначення показників якості суто бінарних моделей, дозволяє дослідникам розширити область застосування методології кредитного скорингу на випадок неперервної ймовірнісної цільової змінної, що не раніше виконувалося. Також вперше отримано аналітичну формулу безпосереднього обчислення рівнів статистичної значимості коефіцієнтів логістичної регресії після оцінки середньоквадратичних відхилень. Доведено переваги пропонованого методу дискретизації перед бінарними деревами рішень. Розроблено інформаційну систему для побудови скорингових моделей.відхилених заявок, використовуючи дворівневі узагальнення для випадку ймовірнісної цільової змінної. Отримані результати свідчать, зокрема, про швидшу збіжність пропонованого вдосконалення при використанні обмеження 10-6 та відстані Чебишева для оцінювання зміни прогнозованих ймовірностей на множині відхилених заявок та кращу якість прогнозів на тестовій вибірці (значення індексу Джині дорівнює 40,11% проти 38,59%). Подальше комплексне методологічне узагальнення, включаючи узагальнення та розширення області визначення показників якості суто бінарних моделей, дозволяє дослідникам розширити область застосування методології кредитного скорингу на випадок неперервної ймовірнісної цільової змінної, що не раніше виконувалося. Також вперше отримано аналітичну формулу безпосереднього обчислення рівнів статистичної значимості коефіцієнтів логістичної регресії після оцінки середньоквадратичних відхилень. Доведено переваги пропонованого методу дискретизації перед бінарними деревами рішень. Розроблено інформаційну систему для побудови скорингових моделей. | uk |
dc.format.page | 22 c. | uk |
dc.identifier.citation | Солошенко О. М. Моделі і методи оцінювання кредитоспроможності фізичних осіб : автореф. дис. ... канд. техн. наук. : 01.05.04 – системний аналіз і теорія оптимальних рішень / Олександр Миколайович Солошенко. - Київ, 2016. - 22 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/17460 | |
dc.language.iso | uk | uk |
dc.publisher | НТУУ "КПІ" | uk |
dc.publisher.place | Київ | uk |
dc.status.pub | published | uk |
dc.subject | системний аналіз | uk |
dc.subject | системна методологія | uk |
dc.subject | кредитний скоринг | uk |
dc.subject | логістична регресія | uk |
dc.subject | аналіз відхилених заявок | uk |
dc.subject | роздрібне кредитування | uk |
dc.subject | системный анализ | uk |
dc.subject | системная методология | uk |
dc.subject | кредитный скоринг | uk |
dc.subject | логистическая регрессия | uk |
dc.subject | анализ отклоненных заявок | uk |
dc.subject | розничное кредитование | uk |
dc.subject | systems analysis | uk |
dc.subject | systems methodology | uk |
dc.subject | credit scoring | uk |
dc.subject | logistic regression | uk |
dc.subject | reject inference | uk |
dc.subject | retail lending | uk |
dc.subject.udc | 336.774.067:519.87(043.3) | uk |
dc.subject.udc | 519.711:519.863(043.3) | |
dc.title | Моделі і методи оцінювання кредитоспроможності фізичних осіб | uk |
dc.type | Thesis | uk |
thesis.degree.level | candidate | uk |
thesis.degree.name | кандидат технічних наук | uk |
thesis.degree.speciality | 01.05.04 – системний аналіз і теорія оптимальних рішень | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Soloshenko_aref.pdf
- Розмір:
- 1.21 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 7.71 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: