Skip to content

Yihuier专业的信用评分卡建模 Python 工具包

从数据探索到模型部署的全流程支持

快速体验

python
from yihuier import Yihuier

# 初始化
yh = Yihuier(data, target='dlq_flag')

# 数据预处理
yh.data = yh.dp_module.delete_missing_var(threshold=0.2)

# 变量分箱
bin_df, iv_value = yh.binning_module.binning_num(
    col_list=['v1', 'v2', 'v3'],
    max_bin=5,
    method='ChiMerge'
)

# WOE 转换
data_woe = yh.binning_module.woe_transform()

# 变量选择
xg_imp, _, xg_cols = yh.var_select_module.select_xgboost(
    col_list=data_woe.drop(['dlq_flag'], axis=1).columns.tolist(),
    imp_num=10
)

核心功能

数据预处理

  • 缺失值处理(数值型/类别型)
  • 常变量删除
  • 异常值处理

变量分箱

  • ChiMerge 卡方分箱
  • 等频/等距分箱
  • 单调性分箱
  • WOE 编码和 IV 计算

变量选择

  • XGBoost/随机森林特征重要性
  • 相关性分析
  • IV 筛选

模型评估

  • ROC/KS 曲线
  • 交叉验证
  • 学习曲线
  • 混淆矩阵

评分卡实现

  • 刻度参数计算
  • 分数转换
  • Cutoff 验证

模型监控

  • PSI 分析
  • 稳定性监控
  • 偏移检测

为什么选择 Yihuier?

与其他工具对比

特性YihuierScorecardpyToad
分箱方法4种2种3种
WOE 转换
变量选择3种策略1种2种
模型评估完整基础完整
评分卡实现完整部分部分
模型监控
Python 版本3.13+3.6+3.6+
类型提示完整
中文文档部分

学习路径

初学者

  1. 阅读 项目简介
  2. 跟随 快速开始
  3. 学习 核心概念
  4. 查阅 模块文档

进阶用户

  1. 深入学习 架构设计
  2. 研究 最佳实践
  3. 探索 高级示例

贡献者

  1. 阅读 贡献指南
  2. 查看 开发文档
  3. 参与 GitHub 讨论

许可证

本项目采用 MIT 许可证发布。

致谢

感谢开源社区的所有贡献者!

相关

GitHub: encyc/yihuier

PyPI: yihuier

基于 MIT 许可证发布