Стратегия поиска эффективного алгоритма машинного обучения на примере кредитного скоринга
(Стр. 132-138)

Подробнее об авторах
Исаев Денис Вадимович аспирант
Финансовый университет при Правительстве Российской Федерации

Нажимая на кнопку купить вы соглашаетесь с условиями договора оферты

Аннотация:
Для многих компаний проблема поиска оптимальных стратегий прогнозирования целевых событий на сегодняшний день является актуальной. Целью данной работы является разработка метода прогнозирования на основе машинного обучения, позволяющего решить проблемы, связанные с выбором наиболее эффективного алгоритма. В рамках текущей работы поиск такого алгоритма проводится на данных клиентов коммерческого банка, которым был выдан кредит, где целевым событием является факт возникновения кредитного дефолта. Кредитный скоринг является популярным объектов исследования, поэтому для многих исследователей проблематика и особенности задачи являются знакомыми. В статье кроме базовых моделей машинного обучения, таких как наивный байесовский классификатор, логистическая регрессия, дискриминантный анализ, метод ближайших соседей, метод опорных векторов и деревья решений, также анализируются алгоритмы, занимающие на соревнованиях первые места, такие как ансамбли над решающими деревьями и нейронные сети. Для построения модели с хорошей обобщающей способностью необходимо выбирать наиболее значимые с точки зрения целевого события входные предикторы - в нашей статье это данные, описывающие потенциального заемщика. Поэтому перед обучением моделей классификации проводится сравнительный анализ следующих методов отбора объясняющих признаков: статистические, итеративные, методы отбора признаков на основе модели градиентного бустинга и набирающий в последнее время популярность генетический алгоритм. Результаты проведенных исследований показали, что для задачи кредитного скоринга на рассматриваемом наборе данных наилучшим методом отбора признаков является отбор на основе показателя ratio gain, а наиболее эффективными классификаторами оказались ансамбли решающих деревьев: случайный лес и градиентный бустинг. Практический вклад проведенного исследования заключается в предложенной стратегии поиска наиболее эффективной модели бинарной классификации. Разработанный подход последовательной оценки методов отбора предикторов и классификаторов с помощью нескольких метрик точности представляет научную новизну.
Образец цитирования:
Исаев Д.В., (2020), СТРАТЕГИЯ ПОИСКА ЭФФЕКТИВНОГО АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ НА ПРИМЕРЕ КРЕДИТНОГО СКОРИНГА. Проблемы экономики и юридической практики, 6 => 132-138.
Список литературы:
D. Guegan, B. Hassani Regulatory learning: How to supervise machine learning models? An application to credit scoring // The Journal of Finance and Data Science. 2018. №4.
Baesens B., Van Gestel T., Viaene S., Stepanova M., Suykens J., Vanthienen J. Benchmarking state-of-the-art classification algorithms for credit scoring // Journal of the Operational Research Society. 2003. №54.
S. Lessmann, B. Baesens, H-V. Seow, L. C.Thomas Benchmarking state-of-the-art classification algorithms for credit scoring: An update of research // European Journal of Operational Research. 2015. №247.
V. Moscato, A. Picariello, G. Sperlí A benchmark of machine learning approaches for credit score prediction // Expert Systems With Applications. 2020. №165.
Yuelin Wang, Yihan Zhang, Yan Lu, Xinran Yu A Comparative Assessment of Credit Risk Model Based on Machine Learning - a case study of bank loan data // Procedia Computer Science. 2020. №174.
P. Ziemba, A. Radomska-Zalas, J. Becker Client evaluation decision models in the credit scoring tasks // Procedia Computer Science. 2020. №176.
Cuicui Luo, Desheng Wu, Dexiang Wu A deep learning approach for credit scoring using credit default swaps // Engineering Applications of Artificial Intelligence. 2017. №65.
M. Herasymovych, K. Märka, O. Lukason Using reinforcement learning to optimize the acceptance threshold of a credit scoring model // Applied Soft Computing Journal. 2019. №84.
X. Dastile, T. Celik, M. Potsane Statistical and machine learning models in credit scoring: A systematic literature survey // Applied Soft Computing Journal. 2020. №91.
S. K. Trivedi A study on credit scoring modeling with different feature selection and machine learning approaches // Technology in Society. 2020. №63.
A. Gümüs¸ M. E. Tenekeci, A. V. Bilgili Estimation of wheat planting date using machine learning algorithms based on available climate data // Sustainable Computing: Informatics and Systems. 2020.
H. Chena, Y. Xiang The Study of Credit Scoring Model Based on Group Lasso // Procedia Computer Science. 2017. №122.
A. Bequé, S. Lessmann Extreme learning machines for credit scoring: An empirical evaluation // Expert Systems With Applications. 2017. №86.
D. Tripathi, D. R. Edla, V. Kuppili, A. Bablani Evolutionary Extreme Learning Machine with novel activation function for credit scoring // Engineering Applications of Artificial Intelligence. 2020. №96.
F. Shen, X. Zhao, G. Kou, F. E. Alsaadi A new deep learning ensemble credit risk evaluation model with an improved synthetic minority oversampling technique // Applied Soft Computing. 2020.
V. B. Djeundje, J. Crook, R. Calabrese, M. Hamid Enhancing credit scoring with alternative data // Expert Systems with Applications. 2020. №163.
Wang Bao, Ning Lianju, Kong Yue Integration of unsupervised and supervised machine learning algorithms for credit risk assessment // Expert Systems With Applications. 2019. №128.
Haoting Zhang, Hongliang He, Wenyu Zhang Classifier selection and clustering with fuzzy assignment in ensemble model for credit scoring // Neurocomputing. 2018. №316.
Feng Shena, Xingchao Zhao, Gang Kou Three-stage reject inference learning framework for credit scoring using unsupervised transfer learning and three-way decision theory // Decision Support Systems. 2020. №137.
J. P. Barddal, L. Loezer, F. Enembreck, R. Lanzuolo Lessons learned from data stream classification applied to credit scoring // Expert Systems With Applications. 2020. №162.
Ключевые слова:
кредитный скоринг, машинное обучение, отбор признаков, ансамбль моделей.


Статьи по теме

Искусственный интеллект и машинное обучение Страницы: 11-21 DOI: 10.33693/2313-223X-2024-11-2-11-21 Выпуск №119881
Разработка торговой стратегии криптовалюты с применением методов машинного обучения
криптовалюта биткоин торговые стратегии машинное обучение скользящие средние
Подробнее
Математическое и программное обеспечение вычислительных систем, комплексов и компьютерных сетей Страницы: 83-91 DOI: 10.33693/2313-223X-2023-10-3-83-91 Выпуск №23683
Определение параметров скрытых угроз раннего обнаружения в информационных системах для задач машинного обучения
машинное обучение корпоративные информационные системы (КИС) имитационное моделирование анализ данных обработка данных
Подробнее
МАТЕМАТИЧЕСКИЕ, СТАТИСТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ В ЭКОНОМИКЕ Страницы: 185-192 DOI: 10.33693/2541-8025-2024-20-2-185-192 Выпуск №102671
Разработка интеллектуальной системы анализа достижений обучающегося вуза
интеллектуальный анализ таксономия машинное обучение успеваемость студента цифровой университет.
Подробнее
4. МАТЕМАТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ ЭКОНОМИКИ 08.00.13 Страницы: 176-186 Выпуск №18758
Исследование динамики показателей отчетности как индикаторов ухудшения финансового состояния кредитных организаций
прогнозирование финансовое состояние машинное обучение кредитные организации банковские рейтинги
Подробнее
МАТЕМАТИЧЕСКИЕ, СТАТИСТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ В ЭКОНОМИКЕ Страницы: 167-178 Выпуск №24067
Моделирование товарооборота кофеен на основе пространственных данных
пространственные данные экономические показатели машинное обучение Python. spatial data
Подробнее
МАТЕМАТИЧЕСКИЕ, СТАТИСТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ В ЭКОНОМИКЕ Страницы: 129-140 DOI: 10.33693/2541-8025-2024-20-1-129-140 Выпуск №72283
Разработка модели бинарной классификации на малых данных с использованием методов машинного обучения
машинное обучение малые данные задачи классификации медицинские данные сэмплирование
Подробнее
4. МАТЕМАТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ ЭКОНОМИКИ 08.00.13 Страницы: 85-97 Выпуск №19146
Моделирование инвестиционных рисков в агропромышленном комплексе
модели рисков оценка дефолта кредитный скоринг сельское хозяйство risk models
Подробнее
Национальная безопасность России Страницы: 101-109 DOI: 10.33693/2223-0092-2025-15-1-101-109 Выпуск №181009
Использование баз данных, защищенных авторскими правами, для развития машинного обучения в условиях ограничительных мер в РФ
интеллектуальная собственность правообладатели база данных датасет майнинг данных
Подробнее
4. МАТЕМАТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ ЭКОНОМИКИ 08.00.13 Страницы: 65-72 Выпуск №19146
Прогнозирование финансовых рынков с использованием сверточной нейронной сети
прогнозирование финансовых рынков машинное обучение сверточная нейронная сеть математическая модель алгоритм
Подробнее
5.2.2. МАТЕМАТИЧЕСКИЕ, СТАТИСТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ В ЭКОНОМИКЕ Страницы: 75-79 Выпуск №21250
Современные направления исследований в области рекомендательных систем
рекомендательная система коллаборативная фильтрация контентная фильтрация холодный старт машинное обучение
Подробнее