关联规则在大型百货商场会员画像描绘[1]中的应用

(整期优先)网络出版时间:2023-02-14
/ 1

关联规则在大型百货商场会员画像描绘[1]中的应用

解术霞

淄博职业学院  山东淄博  255314

摘要:本文用关联规则分析了大型百货商场会员交易流水数据[1],得到各种商品销售的连带性,据此可进行商品的货篮分析和组合管理,以更加有利于商品销售。

关键词:数据;促销;关联规则

一、数据处理

首先利用EXCEl的数据透视功能将商品类别编码进行统计(总计130种),然后利用Vlooup函数将商品类别编码对应到附件三会员消费明细表中,再对商品编码的频数进行统计,筛选出会员购买频次中排名靠前的10类商品进行研究。

再针对这10类商品分别对会员的消费信息进行统计,若会员购买有购买信息则用T表示,若无购买信息则用F表示。

二、模型的建立[2]

同数据项目在同关联规则表示不一事件中出现的相关性,就是从大量数据中挖掘出关联规则。关联规则模型的分析离不开对支持度、置信度与提升的分析,下面是对支持度、置信度与提升的定义:

1.支持度(Support)

支持度用来表示项目集在数据库中的出现频率。对于数据库D中的项目集X,其支持度定义为:数据库中包含项目集X的事务数t与所有事务数T之比:

2.置信度(confidence)

置信度用来衡量规则的可信程度。 对于规则,其置信度定义为:数据库中同时包含的事务数与包含的事务数之比

3.提升(lift)

一个规则的lift定义为:

如果一个规则的值等于1,这暗示前提和结论对应的事件相互独立;如果值大于1,指示了两个事件之间的相互依赖程度,值越大,关联越强;如果值小于1,表明一个item的出现对其他item的出现存在消极影响(相斥),反之亦然(其中一个出现另一个一般不会出现)。的意义在于其即考虑了置信度也考虑了整个数据集中结论的支持度。

关联规则挖掘过程主要包含两个阶段:第一阶段必须先从会员的消费记录中找出所有的高频商品类别,高频的意思是指某一项商品类别出现的频率相对于所有记录而言,必须达到某一水平。在这里我们只对会员购买频次中排名靠前的十类商品进行研究。第二阶段再由这些高频商品类别产生关联规则。使用关联规则挖掘技术,对会员的消费记录进行信息挖掘,首先必须要设定最小支持度与最小置信度两个门槛值,在此我们根据领域专家设定最小支持度 且最小置信度因此符合此大型商场需求的关联规则将必须同时满足以上两个条件。此外还要满足一定的提升值,提升大于 1 的规则才是有意义的。

利用SPSS软件画出会员购买频次中排名靠前的十类商品关联网络节点图:

D:\Program Files\QQ\2120015863\Image\Group\4[H[Z)(AIP3%%]XSL([X04Q.png

通过该网络图我们可以看到这10类商品的关联性是不同的,两类商品间的连接线越粗说明这两类商品的关联性越强,在商场促销活动中越有可能出现连带销售的现象。

三、模型的验证

Apriori算法继续对这10类商品进行关联规则挖掘,得到6条关联规则,结果如下:

商品类别编码

关联商品类别编码

支持度

置信度

提升

40101

60101

40501

70302

1.99%

87.01%

1.499

40501

50101

70302

1.35%

73.84%

3.92

70101

40101

2.8%

71.41%

3.406

60101

60701

40501

70302

1.59%

66.8%

5.607

70302

60701

40501

70403

1.08%

60.98%

8.433

60701

60101

40501

70302

1.99%

53.21%

4.241

由于设定的最小支持度 最小置信度符合此需求的关联规则只有以上6类,因其余四类不满足要求在此不做分析。

从结果可以看出,通过关联规则模型挖掘可以得其到三个属性值,分别是置信度、支持度和提升,通过对规则信息的分析和了解,我们将置信度和提升作为选择规则的标准,因为置信度能反映出规则预测的准确程度,提升值越大,规则的相关性越强。据此我们可以看出会员在购买编码为40101类的商品时会同时购买编码为60101、40501、70302的商品;且占购买40101商品所有记录的87.01%;并且提升为1.499,表明此规则的相关性很强,部署能力和置信度类似,即编码为40101与60101、40501、70302的商品存在很强的连带性,因此可以将编码为40101与60101、40501、70302的商品摆放在一起销售,这也正好和前面的网络节点图的显示相一致。以此类推,可以分析出每一类商品的连带性,商店可以根据上表对商品陈列组合、连带销售技巧进行改进,以更加有利于商品销售。

参考文献

[1]2018年全国大学生数学建模大赛C题

[2]司守奎、刘玺菁,《数学建模算法与应用》,北京市:国防工业出版社,2011.8.

作者简介:解术霞(1965-),女,淄博职业学院 教授,主要从事数学建模、高等数学教学研究。