数据挖掘在电信行业客户价值提升中的应用

【摘要】本文在研究数据挖掘目前在电信业已有应用的基础上,结合客户价值理论,提出对中高端客户实施价值提升的研究方案,利用CRISP-DM标准方法和C5.O算法建立了价值提升客户模型,并将模型应用于移动某分公司的客户关系管理系统,取得了良好的实际应用效果。

【关键词】电信行业;数据挖掘;客户价值;C5.0算法

【中图分类号】F62 【文献标识码】A 【文章编号】1672-5158(2012)09-0061-02

一、引言

近年来,随着电信市场的不断开放,电信行业的竞争也日趋激烈。各大运营商都在竭力寻求在提升服务质量、下调资费的同时,又保持收入平稳、提高的方法。数据挖掘无疑是帮助企业有效分析客户数据,提升企业竞争力的有力工具。数据挖掘能够于从海量数据中挖掘出隐含在其中的矿藏——知识。它以现实数据为依据,以信息技术为手段,通过对大量数据进行统计、分析、综合和推理,来指导对实际问题的求解,并能对未来的发展趋势做出预测。

目前,数据挖掘在电信业中的应用主要有:分析市场状况,制定营销策略,进行客户细分和针对性营销,开展客户流失预警和客户保持。本文在借鉴以上这些做法的基础上,基于帕累托所谓“关键的少数与次要的多数”的关于市场分布的一般规律,提出对中高端客户进行价值提升的方法与应用。为移动通信类企业在解决竞争加剧、资费下调与保持收入持续增长的矛盾中,提供了一条新的解决思路。

二、客户价值提升方案

本次挖掘简言之就是发现有价值提升潜力的中高端客户进而实施客户价值提升。具体做法为,利用移动某分公司现有的的数据仓库,运用数据挖掘工具SPSSClementine找出有价值提升潜力的中高端客户,再借助企业营销管理平台对其开展针对性营销,以帮助企业充分发掘中高端客户存量市场的潜力。

三、基于clementine的价值客户挖掘

1.业务理解

本文的中高端客户指高ARPu值(ARPU-Average Revenue PerUser,用户平均收入)和高MOU值(MOU—minutes ofusage,用户通话时长)的客户。ARPU值和MOU值分别指客户的月消费金额和月通话时长,它们是反映客户消费行为的两个重要指标。因此,本次挖掘将中高端客户定义为:月ARPU值不低于120元,且当月主叫MOU值不低于100分钟的月末在网客户。

2.建立模型

本次建模选择决策树中的C5.0算法。C5.0算法是C4.5算法的商业化版本,它采用信息增益比例选择分割属性,是C4.5应用于大数据集上的分类算法,主要在执行效率和内存使用方面做了改进,同时提高了分类精度。使用C5.0算法主要考虑了以下几点:

1)本次建模的预测目标变量Flag Tag,它只有两种结果,是典型的离散型变量,适合于决策树分类;

2)参与建模的变量很多是连续型字段,如本月消费值、本地通话时长、本地通话费等,要考虑能处理连续属性的算法;

3)从模型的建模速度和准确率角度看,C5.0算法的分类速度较快且准确率较高;

4)从模型的可解释性和实用性角度考虑,C5.0算法也是很容易理解、解释和指导实践的算法。

采用C5.0算法建立价值提升客户分类模型,其目标字段为Flag Tag,输入字段为前面经过变量选择筛选出的字段。建模流程图如图2:

经过反复训练,比较模型评价结果,最终模型参数设置如图3:参数设置说明:

1)设置输出类型为“决策树”,便于了解模型预测过程,发现对预测起关键作用的变量和分割点;

2)选择“使用推进”,将实验次数设为3,推进是C5,0算法特有的技术,通过他能显著提高模型精确度,但也会增加模型训练的时间。

3)将参数设置模式选择为“专家”,并设置“每个子分支的最小记录数”为200,这样在兼顾模型准确率的同时能避免过度拟合和决策树深度过深。

此外,在判断一个用户是否为价值提升客户时,将没有价值提升潜力的客户误打为T和将有价值提升潜力的客户误打为F,两者给电信带来的损失是不同的,为增强对价值提升客户的覆盖率,加入误分类损失,将T打为F的误分类成本由1提高到2。执行生成C5.0模型。

4、模型结果及评价

经过模型数据的多次筛选及调整,最终模型整体准确率达93.21%。将模型应用于测试样本,通过建模找到的前18%的客户就占到总体价值提升客户数的98.5%(如图4),可见建模收益还是很好的。

5、模型实施

将模型应用于企业营销管理平台,由营销模型库对模型产生的目标客户进行营销套餐匹配,进而指导外呼人员开展针对性营销。从表1客户营销执行结果中可以看到,在外呼接通客户数上,通过模型挖掘找到的客户其外呼接通率略大于随机抽取的客户,在营销成功比例上,模型挖掘客户的营销成功率远远高于随机抽取的客户,甚至能达到6倍,可见,本次数据挖掘的结果对营销执行是很有意义的。

四、结束语

本文将数据挖掘技术应用于电信业的客户价值提升中。基于客户价值分布理论,提出对中高端客户实施价值提升的方案,采用C5.0算法实现了价值客户挖掘,并通过营销执行,有效实现了中高端客户的价值提升,进一步验证了对中高端客户实施价值挖掘的可行性和有效性。为移动通信类企业在解决竞争加剧、资费下调与保持收入持续增长的矛盾中,提供了一条新的解决思路。