信用卡高速发展的背后是坏账风险的不断增大。据统计,2006年,台湾地区有900多万人拥有信用卡,现金卡,交不起卡债的人已达70多万,造成银行呆账超过1500亿新台币。100名有收入的人之中就有6人是卡奴,人均欠债100多万新台币。给整个台湾地区的银行信用卡业务蒙上了一层阴影。
为了推进信用卡业务良性发展,减少坏账风险,台湾各大银行都进行了信用卡客户风险识别相关工作,建立了相应的客户风险识别模型。
信用卡高风险客户识别数据挖掘主要包括以下步骤:
从银行获取信用卡相关信息;
数据探索:探索整体数据分布和探索不同变量之间的关系;
数据预处理工作:包括数据清洗,属性规约、数据变换;
构建信用卡高风险客户识别模型,将禁入类客户,高风险客户,一般客户分开,并对每种客户的特征进行分析。
根据得出的结果,查看该银行目前信用卡业务整体风险状况。
K-Means聚类
教与学:可落地操作、学生参与度高、交互性强;
科研:将K-Means聚类算法与具体行业应用结合,为科学研究提供素材。
生产:将模型改进后直接用于实际生产环境:信用卡高风险客户识别。
windows/linux/mac OS,64位操作系统,内存:4GB,R3.4.4
评论已有 0 条