AI 智能建模 Skill
Yihuier 内置了专业的风控建模 Skill,让 AI 助手(如 Claude Code)自动引导你完成从数据探索到模型部署的完整建模流程。
什么是 Skill?
Skill 是为 AI 助手设计的专业技能包,包含了特定领域的最佳实践、工作流程和质量标准。当你在使用 Claude Code 等 AI 助手时,Skill 会被自动触发,为你提供智能化的建模指导。
Yihuier Skill 功能
自动触发
当你询问以下问题时,Skill 会自动激活:
- "帮我建立一个信用评分卡模型"
- "如何进行风控建模?"
- "模型 AUC 不达标怎么办?"
- "如何优化评分卡的 KS 值?"
- "什么是 WOE 和 IV?"
10 步建模流程
Skill 会引导你完成以下步骤:
质量保证
Skill 内置了质量标准,确保模型满足:
- AUC ≥ 0.65:区分能力达到基本要求
- KS ≥ 0.15:预测能力达到标准
- PSI < 0.25:模型稳定性良好
智能故障排除
当模型不达标时,Skill 会自动建议:
- 数据质量检查
- 特征工程优化
- 分箱策略调整
- 变量选择改进
- 模型参数调优
使用示例
在 Claude Code 中使用
如果你使用 Claude Code,只需自然语言描述需求:
markdown
用户:帮我建立一个信用评分卡模型,数据在 data.csv 中
AI:我来帮你建立信用评分卡模型。首先让我了解一下数据...Skill 会自动触发,AI 助手将:
- 加载数据并进行探索性分析
- 自动识别数据类型和问题
- 执行完整的建模流程
- 生成评估报告和建议
手动使用 Skill
你也可以在项目中直接使用 Skill:
bash
# 1. 确保在 yihuier 项目目录
cd yihuier
# 2. Skill 文件位于
.claude/skills/risk-modeling.skill
# 3. 启动 AI 助手时,Skill 会自动加载Skill 内容
完整工作流
- 数据探索:自动生成 EDA 报告
- 预处理策略:智能选择缺失值处理方法
- 分箱优化:ChiMerge/等频分箱自动切换
- 变量选择:XGBoost/IV 筛选自动决策
- 模型评估:完整的交叉验证和可视化
- 评分卡实现:自动计算刻度和分数转换
最佳实践
Skill 融合了以下最佳实践:
- 分层采样避免样本偏差
- 交叉验证确保模型稳定性
- PSI 监控模型性能衰减
- 业务合理性检查(通过率、坏账率)
故障排除指南
内置常见问题的解决方案:
- AUC/KS 不达标
- ChiMerge 分箱失败
- 类别不平衡处理
- PSI 过高问题
质量检查清单
Skill 会自动验证以下标准:
数据质量
- ✅ 样本量 ≥ 1000
- ✅ 正样本占比 ≥ 5%
- ✅ 缺失值已处理
变量质量
- ✅ IV 值合理(主要变量 > 0.1)
- ✅ 变量数量适中(10-15 个)
- ✅ 相关性可控(< 0.6)
模型性能
- ✅ AUC ≥ 0.65
- ✅ KS ≥ 0.15
- ✅ 交叉验证稳定
评分卡
- ✅ 分数分布合理(均值 500-650)
- ✅ 通过率合理(30-70%)
- ✅ PSI < 0.25
高级特性
自定义参数
你可以根据业务需求调整参数:
python
# 调整评分卡刻度
A, B, base_score = yh.si_module.cal_scale(
score=650, # 基础分 650 对应 odds
odds=30, # 30:1 好坏比
PDO=15, # odds 翻倍减少 15 分
model=model
)多模型对比
Skill 支持多种模型对比:
- 逻辑回归(评分卡标准)
- XGBoost(预测性能)
- 随机森林(稳定性)
自动化报告
Skill 可自动生成:
- 模型评估报告
- 评分卡明细表
- 变量重要性排序
- 模型稳定性分析
与传统方法的对比
| 特性 | 传统方法 | Yihuier Skill |
|---|---|---|
| 学习曲线 | 陡峭 | 平缓 |
| 建模时间 | 数天 | 数小时 |
| 质量保证 | 依赖经验 | 自动化检查 |
| 最佳实践 | 需要查阅 | 内置在 Skill |
| 故障排除 | 手动搜索 | 智能建议 |
| 文档参考 | 分散多处 | 统一集成 |
常见问题
Q: Skill 适用于哪些场景?
A: 适用于以下场景:
- 信用评分卡建模
- 反欺诈模型
- 风险评级模型
- 任何需要 WOE/IV 评分卡的场景
Q: Skill 能替代人工判断吗?
A: Skill 是辅助工具,不能完全替代人工判断。建议:
- 使用 Skill 快速建立基准模型
- 根据业务知识调整参数
- 验证模型结果的业务合理性
Q: 如何更新 Skill?
A: Skill 随 yihuier 项目更新:
bash
cd yihuier
git pull origin mainQ: Skill 支持自定义吗?
A: 支持。你可以:
- 修改 Skill.md 文件
- 添加自定义检查项
- 扩展最佳实践
技术实现
Skill 基于 Claude Code 的技能系统实现:
yaml
# Skill 元数据
name: risk-modeling
description: |
信用评分卡建模全流程指导,使用 yihuier 工具包完成从数据探索到模型部署的完整建模流程。
适用于需要构建信用评分卡、反欺诈模型、风险评级模型等场景。
确保模型质量(AUC 大于 0.65、KS 大于 0.15、PSI 小于 0.25)和业务可解释性。Skill 包含:
- 工作流程:10 步建模流程
- 质量标准:AUC/KS/PSI 阈值
- 故障排除:常见问题解决方案
- 代码示例:完整的可运行代码