电信客户分群的KXEN分析

摘要:电信业是典型的数据密集行业,客户分群对电信企业发现更多的商机有重要作用。该文利用商业数据挖掘自动化软件KXEN并依据其方法给出了电信客户分群的解决方案。

关键词:客户分群;KXEN

中图分类号:TP311文献标识码:A 文章编号:1009-3044(2009)14-3815-02

Telecom Customer Segmentation Analysis with KXEN

LUO Ye, CAI Qiu-ru, LIU Yi-jun, LI Bin-zhang

(School of Computer Science and Engineering, Jiangsu Teachers University of Technology, Changzhou 213001,China)

Abstract: Customer segmentation is very important for Telecom to discover more commercial chances. The paper proposes a resolution of customer segmentation for Changzhou telecom based on the commercial automatic data mining tool KXEN and its method.

Key words: Customer segmentation; KXEN

1 引言

电信业是典型的数据密集行业, 随着电信体制改革的深化, 电信业的竞争也日趋激烈。与其他行业相比,电信行业拥有更多的有关用户的数据。谁能正确地分析这些数据所得到有用的知识, 谁就能更好地向用户提供服务, 能够发现更多的商机, 从而在竞争中获胜。而数据挖掘可以从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识,因此数据挖掘应用开发对电信企业的发展有重要意义[1]。

KXEN是商业数据挖掘自动化软件,其特点在于专注数据挖掘的高端技术,面向结果而不是面向方法。用户不需要专业的统计学背景和机器学习的理论,而只需要知道数据和想分析的问题,对于每种问题,KXEN都提供一种简单的解决方案。本文以江苏省常州电信为例,利用KXEN并依据其方法给出了电信客户分群的解决方案。

2 客户分群原理

电信的数据挖掘应用开发,主要进行客户分群、客户流失分析、客户发展分析、客户行为分析等数据挖掘专题分析,逐步实现业务预测和信息挖掘等功能。客户分群是根据一个或多个客户属性组合把所有客户划分成不同的类,同类内的客户具有最大的相似性,异类间的客户具有最大的差异性。通过对客户合理的类别划分,并对当前客户以及预期的客户群作区段分析,判断不同区段的突出特点,对客户总体构成有准确的认识,对客户的服务和营销更具针对性。对客户分群可以达到如下目标[2]:

1)了解客户的总体构成;

2)了解各种客户价值的客户群体特征;

3)了解流失客户的客户群体特征;

4)了解客户群体的消费特征;

5)了解各信用等级的客户群体特征。

客户分群后的结果可应用于:对不同价值分段的客户进一步分析以了解各个分段的客户组成;对流失倾向高的客户进一步细分以采取不同的挽留策略;对交叉销售的目标客户进一步细分以采取不同的行销策略。

常用的数据挖掘技术包括关联分析、异类分析、分类与预测、聚类分析以及演化分析等。客户分群采用聚类分析技术解决。

3 KXEN软件特点分析

数据挖掘自动化软件KXEN特点如下[3-4]:

1) 在数据准备阶段,KXEN可以自动化处理缺失值、奇异值、进行自动化编码。KXEN独特的预处理编码技术和特征选择方式,大量减少了建模时间。

2) KXEN在建模的时候不用额外的磁盘空间来存储数据,数据直接在数据仓库内部处理,很好的利用数据仓库的性能,节省硬件成本,符合现在的Knowledge Discovery in Database的理念。

3) KXEN共有四个模块(稳健回归、聪明分群、关联规则和时间序列)来解决所有的商业数据挖掘问题。一个商业问题只有一种算法,因此不需要用户选择算法。所有算法都基于Vapnik的结构风险最小化理论。

4) KXEN进行自动建模,不需要进行模型的参数设置,KXEN引擎采用结构风险最小化理论,找到最佳模型。

5) 结果的可解释性。KXEN所有组件的设计都使之对最终用户呈现有意义的结果。

由于上述特点,KXEN改变了传统的数据挖掘方法,数据准备时间从以前的占整个建模周期的70%到现在的几乎不用花时间,如图1和图2所示。而KXEN的模型与传统工具创建的模型一样精确健壮。

4 应用实例

4.1 业务问题

电信运营商定义的客户分群的商业目标是“对市数十万公众客户,从价值和行为的分析维度进行客户分群,以了解不同客户群的消费行为特征,为发展新业务、流失客户保有、他网用户争夺的针对性营销策略的制订提供分析依据,并实现企业保存量、激增量的战略目标”。将此商业目标转化为数据挖掘的可行性方案:从价值和行为维度,考察客户业务拥有与使用、消费行为变化、他网业务渗透等方面属性,采用聚类分析的数据挖掘技术对研究的目标客户进行客户分群,对各客户群进行特征刻画和属性分析,为针对性营销确定目标客户群,并根据客户群属性和营销目标量体裁衣制订恰当的营销方案。

4.2结果分析

本文在常州选择了营销服务相对薄弱的小型商客作为目标客户群,取得目标客户群的近一年的相关数据。其中小型商客是指客户有1-2门电话、小灵通的客户,不包含已经安装宽带的客户,有效小型商客为23074户。基础表涵盖了以下数据:1) 用户及客户的基本信息:包括客户身份信息、联系方式、产品拥有情况、入网时长、服务开通情况、优惠套餐信息、客户服务信息(投诉、咨询、催缴情况)等;2) 价值信息:包括业务月租费、使用费、优惠费用及增值业务、新业务、信息费和卡类、结算费用、缴欠费信息等;3) 行为信息:包括时长、次数、跳次、发话不同号码数、时长集中度、次数集中度等。

KXEN软件分群采用结构风险最小化的K-Means算法实现。本文使用KXEN软件从价值纬度(V)将客户分为6个价值分群,从行为纬度(B)将客户分为5个行为分群。其中参加分群的V变量有21个,B变量有15个。然后对V变量按总费用进行群排序,形成VB矩阵交叉图,如图3和图4所示。在组成的交叉矩阵中选出1000人以上的8个战略客户群SS1-SS8,共有客户17128户,占总客户的比例为74.23%。

根据分群结果,计算出每个群的平均收入进行客户价值分析:

ARPU=客户群总收入/m

式中m为该群客户人数,ARPU(Average Revenue Per User)为每用户平均收入。图5是各群分布气泡图。图中气泡的大小代表客户数的多少。SS7、SS8客户群最大。横轴方向越靠右,表明客户价值越高。SS1、SS2、SS3群为高值的小商客,SS7、SS8为低值小商客。纵轴表明客户的消费趋势值情况,横轴以下为下降趋势,偏离越多,下降值越大。SS2群下降最多,SS1上升最为明显。

以中值下降的SS6战略客户群为例进行特征分析,可得到该群特征如下:

1)该群为中值下降群,ARPU值为93.35元。总费用趋势下降较明显,月均下降5.28元,各项费用均呈下降趋势。

2)该群客户为长话低值客户,长话主要使用传统长途。

3)使用他网卡较多,但他网IP卡下降趋势明显。SS6群使用非电信卡消费均值最高,长话流失严重。

针对上述情况,采用的营销策略是用超级IP、商务行、17908卡等有针对性地开展策反工作。

5 结束语

数据挖掘可以对大量数据进行自动分析,发现有价值的模式或规律。聚类分析能帮助企业进行客户分群,从而应用于目标市场营销。本文利用数据挖掘工具KXEN出了一个电信企业客户分群的解决方案。实践证明本文提供的电信目标市场营销客户分群的解决方案是成功有效的。

参考文献

[1] 张建萍,刘希玉.基于聚类分析的K-means算法研究及应用[J].计算机应用研究, 2007(5):166-168.

[2] 陶露菁.基于数据挖掘的电信客户分群设计和实现[D].南京大学硕士学位论文,2005.06.

[3] 刘文.凯森(KXEN)商业数据挖掘[EB/OL].,2008

[4] 刘文.KXEN市场细分教程[EB/OL]./html/2006-07-03/1726.html,2006.7