导航菜单

基于RFM模型的烟草客户聚类分析研究

邓基刚 DENG Ji-gang;郑成德 ZHENG Cheng-de;刘景燕 LIU Jing-yan;黄胜茂 HUANG Sheng-mao;王无瑕 WANG Wu-xia

(威海市烟草专卖局(公司),威海 264200)

(Weihai Tobacco Monopoly Bureau (Company),Weihai 264200,China)

摘要: 随着客户细分理论的不断丰富和完善,构建合理的客户细分指标体系,借助聚类分析的方法,来实现对企业客户的细分。本文针对当前烟草公司在客户细分方面工作的不足,结合烟草行业及零售户的特征通过聚类分析实现烟草行业零售户的细分,帮助烟草公司实现零售户的合理分类,优化客户资源与卷烟货源的配置。

Abstract: With the customer segmentation theory being enriched and perfected, by cluster analysis method, this paper constructs reasonable index system of customer segmentation and realizes the customer segmentation. Aiming at the disadvantage of current tobacco company in customer segmentation, the research through cluster analysis realizes the retailers of the tobacco industry subdivision and helps tobacco company achieve reasonable classification of retailers according to the characteristics of the tobacco industry and retailers, customer resources and configuration of the cigarette supply is also optimized.

教育期刊网 http://www.jyqkw.com
关键词 : RFM;客户细分;聚类分析

Key words: RFM;customer classification;cluster analysis

中图分类号:F274 文献标识码:A

文章编号:1006-4311(2015)06-0020-03

0 引言

在卷烟供应链中,地市烟草公司处在卷烟工业企业和卷烟零售客户之间,真正直接面向消费者、面向市场的是卷烟零售客户。因此,各地级市烟草公司要想提高对区域市场的市场需求情况的把握,就必须先充分了解和研究零售户的需求,改善卷烟零售客户的客户关系,制定精准营销策略,提高营业收入,实现“卷烟上水平”有重要的作用。过去十年,信息技术的发展对烟草行业也产生了巨大的推动作用,烟草企业CRM系统中不仅收集了大量的业务数据,还收集了大量的客户数据,使得烟草公司多年积累的业务数据开始发挥价值。数据挖掘是一门涉及人工智能、机器学习、统计学等技术的交叉学科,它的主要作用就是实现从海量数据中提取出对应用者潜在的有价值的信息。通过对大量数据的分析处理,结合具体的业务模型,经过数据挖掘算法的分析,可以发现数据之间潜在关系所隐含的机会,挖掘潜在客户价值。

1 理论基础

1.1 RFM模型

RFM模型是由美国著名的数据库营销研究所Arthur Hughes提出的,已经被实践所检验的,对企业客户价值衡量有较好效果的客户数据三要素。RFM是指在客户的一个考察周期内,从最近一次消费至现在的时间间隔(Recency)、购买次数(Frequency)、消费总金额(Monetary)三项指标来描述该客户的价值状况。

①最近一次消费时间至现在的时间间隔(Recency)。该时间间隔越短,则R值越大。根据相关研究者的研发现,R越大的客户越有可能在最近的一段时间内产生新的消费行为。R越大,企业对该客户的记录的信息资料就越全,反之,随着R的减小,该客户的数据资料会越来越少。研究发现,如果时间间隔超过一年,则该企业50%的客户信息将无效。

②购买次数(Frequency)。客户在该考察周期内,购买该企业产品或服务的次数。购买的次数越多,说明该客户的忠诚度越高,该客户对企业依赖性越大。

③消费总金额(Monetary)。客户在该考察周期内,购买的所有产品或服务的总金额。客户购买的总金额越大,对企业的利润的贡献也就越大。

RFM从三个关键维度描述客户的购买行为,且可以较好地表示客户当前为企业带来的现实价值。根据国内外的研究与实践,RFM是表示客户当前价值的充分变量。

1.2 K-Means聚类算法

聚类,是指按照对象的某些属性,以某种相似度的测量方法,把相似的事物聚集成为一类,其结果是获得的类群中,不同类的对象之间相似性小,同一类对象的相似性大。K-MEANS算法是聚类分析中最常用,也是最主要的算法之一。K-MEANS算法也被称为K-均值,是当前最广泛应用的基于划分的聚类算法。K-MEANS算法以输入的分类个数k为参数,把n个目标对象划分为k个簇,簇内具有较高的相似度。K-MEANS算法的基本思想为:算法首先随机的选取k个对象,并把这k个对象初始化为K个簇的平均值或中心,算法计算并根据其他每个对象到这K个簇中心的距离,将它付给最近的簇,重新计算每个簇的平均值,重复进行,直到准则函数收敛。

2 基于聚类挖掘技术的客户细分实现过程

2.1 客户细分聚类模型指标体系的构建

烟草公司目前对公司的客户分类主要从业态、经营规模、市场类型进行考察,并结合零售户的上述情况,及所处的地理位置对其商铺类型进行了划定。但上述分类标准存在着一定的模糊性,导致了对零售户的划分产生了多种问题,如划分概念存在一定的重复性、公司对零售的细分标准不明确等。因此,如何采用适当的科学的客户细分方法,对客户实现精确的细分,对客户所在的市场容量进行精确分析、精准营销,对于烟草公司提高对市场的控制能力,增加营业收入,具有重要的意义。

本文所研究的客户分类模型,是指客户价值和客户行为。客户价值,包括客户当前价值和客户的潜在价值,客户价值默认指客户的当前价值。目前对客户价值研究和应用比较成熟的为从客户行为角度构建的RFM模型。客户的行为研究,可以借助烟草公司业务数据库中的数据交易行为来分析。

RFM模型是被广泛使用和认可,用来衡量客户价值的重要工具。本文研究的是某烟草公司2013年的全年销售数据,假定研究时点为2013年1月1日至2013年12月31日,对应客户价值的衡量的三个指标参数分别为客户12个月内的总订烟金额(Monetary)、客户最近一次定烟时间到现在间隔的天数(Recency)、客户最近12个月内订烟的总次数(Frequency),RFM模型字段如表1。

2.2 数据预处理

根据烟草公司客户信息表,首先,根据目标工作需要,单独选取出2013年中参与有营销服务的客户数据,入库到新的数据表中。其次,根据客户细分模型的需要,对客户信息表的数据进行补全处理。对订单信息表和客户信息表中的是否存在空值、NULL、异常值,进行检测。发现订单信息表中,没有空值、NULL值,但是在客户购货数量(Quantity)存在负值,经过与业务人员沟通了解到,存在退货的情况。因此,在计算客户购货数量,购货金额时,要考虑到其正负值的实际意义。

在公司业务人员交流时,了解到数据库中存在着一部分小客户,订单量非常少,而且订过一次后,可能就没有再继续零售,即该零售网点已停止服务,利用spss中的直方图工具分析客户的订烟次数、最近一次订烟时间,现收集到的数据中,存在较多已经6个月未进行订货的零售户。根据地市烟草专卖局规定客户每周必须订一次烟。对这些已经有超过6个月及以上时间为从事零售活动的零售户,下一年会被注销零售资格,在对客户进行聚类分析时,可以不予考虑。

2.3 基于K-MEANS算法的客户细分模型应用

K-MEANS算法的缺点有:需要用户事先给出簇的个数,而这个信息通常是聚类之后才知道的;无法处理有分类属性(caetgorical atttribute)的数据;对孤立点敏感。从本文研究的内容来讲,对于客户的划分事先己经有了大概的目标,那就是将客户群细分为:VIP客户,重要客户,普通客户,小客户四个群。所以对于K-MEANS算法的需要事先给出簇的个数的缺点,在本文研究的问题中并不突出。在进行数据挖掘前,己经对原始数据做了较为充分的清理和转化,数据中存在的噪声已经很少,孤立点的影响己经不大。所以,在本文研究的内容中,使用K-MEANS算法是可行的。

全部的12357个客户中,聚类后最终分为4个簇。聚类结果如表4。

根据上述统计信息,可以对零售户的聚类结果进行归纳概括,总结出4个类簇的结果集特征。

RFM-1类:这部分客户的数量非常少,只有6个客户,仅占客户总量的0.048%,但平均订烟金额和平均订烟数量非常大。他们可以说是客户中的“巨无霸”。这类客户需要的烟的品牌档次比较高,价格亦较高。烟草企业可以将这6个客户中的每一个客户作为战略伙伴,一定要与他们维持良好的伙伴关系。在客户细分后,他们作为最顶级的客户,应该被看作是最重要的客户,将这一类客户称为VIP客户。

RFM-2类:订烟次数与订烟时间距今天数与前两个类别的客户没有明显差别,区别在于平均订烟数量与平均订烟金额。虽然这一类的客户不是数量最多的,但是他们的总订烟量和总订烟金额却是在四个类别客户中占比重最大的。将这一类别的客户称为普通客户。

RFM-3类:这部分客户的数量也很少,只有191个,这191个客户与前面6个客户情况类似,只是平均订烟数量和平均订烟金额要比RFM-1类少。他们同样属于重要客户。

RFM-4类:这类客户的数量在所有类别中占的比重最大,但是这类客户的订烟数量和订烟金额最小,平均订烟次数也是最少,订烟时间距今时间也是最长。这个类别客户包括了众多小客户,将这一类别的客户定位于小客户。

上述分类情况,与烟草零售户的实际情况相吻合,即零售户中绝大部分是小门户性质的网点,这些网点占总网点数量的89%,销量占总销量的50%。

3 总结

本文通过系统的分析国内外对客户细分、客户价值、聚类分析的理论研究和实践应用,并研究了这些理论与技术在烟草以及其他行业中的应用情况及效果。通过对比分析,吸收和借鉴现有的研究成果,本文在此基础上,针对烟草公司提供的相关业务数据,根据客户价值、客户行为等理论模型,借助K-MEANS聚类分析技术,构建了烟草客户细分模型,为烟草企业实现“精准营销”、“精确运营”,提高对市场的调控能力提供了支持。

教育期刊网 http://www.jyqkw.com
参考文献:

[1]周劲峰,廖振鹏.对“卷烟上水平”战略的认识[J].中国烟草学报,2010(B12):5-7.

[2]刘英姿,何伟.基于不同视角的客户细分方法研究综述[J].商场现代化,2009(1):271.

[3]王辛萌.数据挖掘订单分析系统在烟草行业CRM中的研究与应用[D].济南:山东大学,2006.

[4]王小标,黄治移,杨昆,张雪松.聚类综述[J].数字技术与应用,2012(05):204-206.

[5]Arthur M.Hughes著.数据库营销[M].劳帼龄,等译.机械工业出版社,2004.

[6]Jiawei Han,Micheline Kamber著.数据挖掘-概念与技术[M].范明,孟小峰,等译.机械工业出版社,2001.DataMining:Concepts and Techniques. San Mateo, CA:Morgan Kaufmann,2001.

[7]潘少东.数据挖掘在烟草商业企业CRM中的应用研究[D].合肥:合肥工业大学,2007.

[8]胡少东.客户细分方法探析[J].工业技术经济,2005,24(7):66-69.

[9]Haley, Russell. I. , Benefit segmentation: a decision-oriented research tool[J]. Journal of Marketing, 1968,32(7):30-31.

[10]袁芳.基于客户价值的我国高速铁路客户分类问题研究[D].北京:北京交通大学,2012.

下载文本