Источник данных: https://www.kaggle.com/barelydedicated/bank-customer-churn-modeling
Из «Бета-Банка» стали уходить клиенты. Каждый месяц. Немного, но заметно. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых. Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Мне предоставлены исторические данные о поведении клиентов и расторжении договоров с банком.
- RowNumber — индекс строки в данных
- CustomerId — уникальный идентификатор клиента
- Surname — фамилия
- CreditScore — кредитный рейтинг
- Geography — страна проживания
- Gender — пол
- Age — возраст
- Tenure — количество недвижимости у клиента
- Balance — баланс на счёте
- NumOfProducts — количество продуктов банка, используемых клиентом
- HasCrCard — наличие кредитной карты
- IsActiveMember — активность клиента
- EstimatedSalary — предполагаемая зарплата
- Exited — Целевой признак, факт ухода клиента
- Лучшая модель основана на алгоритме RandomForest
- Лучший индекс: 7 (он означает, что лучше всего показала себя выборка, где пропуски были заполнены 0)
- Лучший показатель F1 метрики: 0.6150409530900968
- Лучший показатель ROC-AUC: 0.86
- Параметры, дающие лучший результат: {'max_depth': 10, 'n_estimators': 100}
- Лучше всего выравнивать через class_weight="balanced"