Skip to content

Commit 584a2bc

Browse files
authored
Update README.md
1 parent 2aa4ea2 commit 584a2bc

File tree

1 file changed

+9
-2
lines changed

1 file changed

+9
-2
lines changed

README.md

+9-2
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,6 @@
11
# Churn Data Analysis
22
使用比赛方提供的脱敏数据,进行客户信贷流失预测。**根据比赛方要求,无法开源数据。**
3+
二分类问题
34

45
- [x] Version 1: CMTR_CHURN_PR 传统机器学习 **XGBoost**
56
- AUC: 0.6145
@@ -27,9 +28,15 @@
2728
3. TabNet 无监督预训练, AUC: 0.7872822945848122
2829
4. AutoGluon 直接输出leaderboard,并使用TOP3的模型进行预测。
2930
------
30-
- [x] Version 5: SMTR_CHURN_PR_V5 变量组合新变量进一步降维 | 随机森林权重筛选变量
31+
- [x] Version 5: CMTR_CHURN_PR_V5 变量组合新变量进一步降维 | 随机森林权重筛选变量
3132
- 经过特征选择(TOP12),通过SMOTE方法平衡正负样本(1:1)。AUC: 0.74977
32-
33+
------
34+
- [x] Version 6: CMTR_CHURN_PR_V6 SMOTE采样 | LightGBM | GridSearchCV | K折交叉验证 | 模型融合(《机器学习》周志华)
35+
- 经过数据清洗后,使用SMOTE平衡正负样本(3:1 -> 1:1),由于剔除变量使得AUC显著下降,故根据想系数热力图,剔除多重共线性变量。
36+
- 使用K折交叉验证和GridSearchCV寻找LightGBM最优参数,训练集和验证集AUC均大于92%,但是提交的预测结果只显示0.6613,依旧存在过拟合现象。
37+
- 使用模型融合,第一层LightGBM + XGB计算加权平均值,将加权平均值输入LogisticRegression预测结果,最终提交平台的AUC:0.6889。
38+
------
39+
- 总结:虽然从数据清洗、变量筛选、调参、调整分类效果最好的模型、尝试模型融合,比赛结果依旧不理想,但是过程中学到了很多,并且了解了AutoML的包,并且学习到了模型融合的思想。还是有进步的。
3340

3441

3542

0 commit comments

Comments
 (0)