Стратегия поиска эффективного алгоритма машинного обучения на примере кредитного скоринга
(Стр. 132-138)

Подробнее об авторах
Исаев Денис Вадимович аспирант
Финансовый университет при Правительстве Российской Федерации
Оплатить 390 руб. (Картой) Оплатить 390 руб. (Через QR-код)

Нажимая на кнопку купить вы соглашаетесь с условиями договора оферты

Аннотация:
Для многих компаний проблема поиска оптимальных стратегий прогнозирования целевых событий на сегодняшний день является актуальной. Целью данной работы является разработка метода прогнозирования на основе машинного обучения, позволяющего решить проблемы, связанные с выбором наиболее эффективного алгоритма. В рамках текущей работы поиск такого алгоритма проводится на данных клиентов коммерческого банка, которым был выдан кредит, где целевым событием является факт возникновения кредитного дефолта. Кредитный скоринг является популярным объектов исследования, поэтому для многих исследователей проблематика и особенности задачи являются знакомыми. В статье кроме базовых моделей машинного обучения, таких как наивный байесовский классификатор, логистическая регрессия, дискриминантный анализ, метод ближайших соседей, метод опорных векторов и деревья решений, также анализируются алгоритмы, занимающие на соревнованиях первые места, такие как ансамбли над решающими деревьями и нейронные сети. Для построения модели с хорошей обобщающей способностью необходимо выбирать наиболее значимые с точки зрения целевого события входные предикторы - в нашей статье это данные, описывающие потенциального заемщика. Поэтому перед обучением моделей классификации проводится сравнительный анализ следующих методов отбора объясняющих признаков: статистические, итеративные, методы отбора признаков на основе модели градиентного бустинга и набирающий в последнее время популярность генетический алгоритм. Результаты проведенных исследований показали, что для задачи кредитного скоринга на рассматриваемом наборе данных наилучшим методом отбора признаков является отбор на основе показателя ratio gain, а наиболее эффективными классификаторами оказались ансамбли решающих деревьев: случайный лес и градиентный бустинг. Практический вклад проведенного исследования заключается в предложенной стратегии поиска наиболее эффективной модели бинарной классификации. Разработанный подход последовательной оценки методов отбора предикторов и классификаторов с помощью нескольких метрик точности представляет научную новизну.
Образец цитирования:
Исаев Д.В., (2020), СТРАТЕГИЯ ПОИСКА ЭФФЕКТИВНОГО АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ НА ПРИМЕРЕ КРЕДИТНОГО СКОРИНГА. Проблемы экономики и юридической практики, 6 => 132-138.
Список литературы:
D. Guegan, B. Hassani Regulatory learning: How to supervise machine learning models? An application to credit scoring // The Journal of Finance and Data Science. 2018. №4.
Baesens B., Van Gestel T., Viaene S., Stepanova M., Suykens J., Vanthienen J. Benchmarking state-of-the-art classification algorithms for credit scoring // Journal of the Operational Research Society. 2003. №54.
S. Lessmann, B. Baesens, H-V. Seow, L. C.Thomas Benchmarking state-of-the-art classification algorithms for credit scoring: An update of research // European Journal of Operational Research. 2015. №247.
V. Moscato, A. Picariello, G. Sperlí A benchmark of machine learning approaches for credit score prediction // Expert Systems With Applications. 2020. №165.
Yuelin Wang, Yihan Zhang, Yan Lu, Xinran Yu A Comparative Assessment of Credit Risk Model Based on Machine Learning - a case study of bank loan data // Procedia Computer Science. 2020. №174.
P. Ziemba, A. Radomska-Zalas, J. Becker Client evaluation decision models in the credit scoring tasks // Procedia Computer Science. 2020. №176.
Cuicui Luo, Desheng Wu, Dexiang Wu A deep learning approach for credit scoring using credit default swaps // Engineering Applications of Artificial Intelligence. 2017. №65.
M. Herasymovych, K. Märka, O. Lukason Using reinforcement learning to optimize the acceptance threshold of a credit scoring model // Applied Soft Computing Journal. 2019. №84.
X. Dastile, T. Celik, M. Potsane Statistical and machine learning models in credit scoring: A systematic literature survey // Applied Soft Computing Journal. 2020. №91.
S. K. Trivedi A study on credit scoring modeling with different feature selection and machine learning approaches // Technology in Society. 2020. №63.
A. Gümüs¸ M. E. Tenekeci, A. V. Bilgili Estimation of wheat planting date using machine learning algorithms based on available climate data // Sustainable Computing: Informatics and Systems. 2020.
H. Chena, Y. Xiang The Study of Credit Scoring Model Based on Group Lasso // Procedia Computer Science. 2017. №122.
A. Bequé, S. Lessmann Extreme learning machines for credit scoring: An empirical evaluation // Expert Systems With Applications. 2017. №86.
D. Tripathi, D. R. Edla, V. Kuppili, A. Bablani Evolutionary Extreme Learning Machine with novel activation function for credit scoring // Engineering Applications of Artificial Intelligence. 2020. №96.
F. Shen, X. Zhao, G. Kou, F. E. Alsaadi A new deep learning ensemble credit risk evaluation model with an improved synthetic minority oversampling technique // Applied Soft Computing. 2020.
V. B. Djeundje, J. Crook, R. Calabrese, M. Hamid Enhancing credit scoring with alternative data // Expert Systems with Applications. 2020. №163.
Wang Bao, Ning Lianju, Kong Yue Integration of unsupervised and supervised machine learning algorithms for credit risk assessment // Expert Systems With Applications. 2019. №128.
Haoting Zhang, Hongliang He, Wenyu Zhang Classifier selection and clustering with fuzzy assignment in ensemble model for credit scoring // Neurocomputing. 2018. №316.
Feng Shena, Xingchao Zhao, Gang Kou Three-stage reject inference learning framework for credit scoring using unsupervised transfer learning and three-way decision theory // Decision Support Systems. 2020. №137.
J. P. Barddal, L. Loezer, F. Enembreck, R. Lanzuolo Lessons learned from data stream classification applied to credit scoring // Expert Systems With Applications. 2020. №162.
Ключевые слова:
кредитный скоринг, машинное обучение, отбор признаков, ансамбль моделей.


Статьи по теме

Многомасштабное моделирование для управления и обработки информации Страницы: 11-20 DOI: 10.33693/2313-223X-2022-9-2-11-20 Выпуск №21224
Определение оптимальной модели машинного обучения для предсказания паводков на реке Амур
управление катастрофами предсказание паводков река Амур машинное обучение disaster management
Подробнее
Искусственный интеллект и машинное обучение Страницы: 19-31 DOI: 10.33693/2313-223X-2022-9-3-19-31 Выпуск №21873
Алгоритм идентификации лиц и преступных действий
машинное обучение глубокая сверточная нейронная сеть Kaggle ориентиры machine learning
Подробнее
Математическое и программное обеспечение вычислительных систем, комплексов и компьютерных сетей (специальность 2.3.5) Страницы: 26-35 DOI: 10.33693/2313-223X-2023-10-2-26-35 Выпуск №23034
Анализ алгоритмов составляющих частей компилятора и его оптимизации
компилятор программный код оптимизация алгоритм анализ
Подробнее
Искусственный интеллект и машинное обучение Страницы: 35-44 DOI: 10.33693/2313-223X-2022-9-2-35-44 Выпуск №21224
Элементы искусственного интеллекта в решении задач анализа текстов
анализ тональности текста искусственные нейронные сети машинное обучение рекуррентные нейронные сети длинная цепь элементов краткосрочной памяти
Подробнее
05.13.11 МАТЕМАТИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ВЫЧИСЛИТЕЛЬНЫХ МАШИН, КОМПЛЕКСОВ КОМПЬЮТЕРНЫХ СЕТЕЙ Страницы: 41-47 DOI: 10.336 9 3/2313- 223X - 2019 - 6 - 2- 41- 4 Выпуск №15585
АЛГОРИТМЫ УПРАВЛЕНИЯ ЛОГИЧЕСКОЙ СТРУКТУРОЙ БАЗЫ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ ПАРАМЕТРИЧЕСКОЙ МОДЕЛИ КОНКУРЕНТНОГО ДОСТУПА ЗАПРОСОВ, ОСНОВАННОЙ НА МЕТОДЕ СЛУЧАЙНОГО ЛЕСА
администрирование систем управления базами данных конкурентные запросы параметрическая модель конкурентного доступа машинное обучение метод случайного леса
Подробнее
Математическое и программное обеспечение вычислительных систем, комплексов и компьютерных сетей Страницы: 83-91 DOI: 10.33693/2313-223X-2023-10-3-83-91 Выпуск №23683
Определение параметров скрытых угроз раннего обнаружения в информационных системах для задач машинного обучения
машинное обучение корпоративные информационные системы (КИС) имитационное моделирование анализ данных обработка данных
Подробнее
5.2.2. МАТЕМАТИЧЕСКИЕ, СТАТИСТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ В ЭКОНОМИКЕ Страницы: 75-79 Выпуск №21250
Современные направления исследований в области рекомендательных систем
рекомендательная система коллаборативная фильтрация контентная фильтрация холодный старт машинное обучение
Подробнее
4. МАТЕМАТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ ЭКОНОМИКИ 08.00.13 Страницы: 65-72 Выпуск №19146
Прогнозирование финансовых рынков с использованием сверточной нейронной сети
прогнозирование финансовых рынков машинное обучение сверточная нейронная сеть математическая модель алгоритм
Подробнее
4. МАТЕМАТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ ЭКОНОМИКИ 08.00.13 Страницы: 85-97 Выпуск №19146
Моделирование инвестиционных рисков в агропромышленном комплексе
модели рисков оценка дефолта кредитный скоринг сельское хозяйство risk models
Подробнее
МАТЕМАТИЧЕСКИЕ, СТАТИСТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ В ЭКОНОМИКЕ Страницы: 167-178 Выпуск №24067
Моделирование товарооборота кофеен на основе пространственных данных
пространственные данные экономические показатели машинное обучение Python. spatial data
Подробнее