智能采集组合文章(本文将PDCA戴明循环与关联规则数据挖掘方法(图))
优采云 发布时间: 2021-12-27 09:11智能采集组合文章(本文将PDCA戴明循环与关联规则数据挖掘方法(图))
周丽丽王宝军梁文敏袁秋平梁玉娟
摘要:本文对电子商务产品销售组合的智能构建进行研究,将关联规则融入到PDCA循环中,并利用其螺旋式和持续优化机制不断改进和完善关联规则的生成,即将结束。将不断变化的消费者需求因素引入到产品组合的构建中,从而帮助电子商务企业智能、动态地构建和优化产品组合。
关键词:关联规则;PDCA; 产品简介; 电子商务
一、简介
随着电子商务的快速发展,企业之间的竞争不断加剧。如何有效地为消费者推送产品组合,已成为电商企业提高客单价和盈利能力的重要手段。传统的产品销售组合往往依赖于经营者的个人经验和静态统计分析,时效性滞后,准确性不足。本文将PDCA戴明环与关联规则数据挖掘方法相结合,帮助企业开展产品组合智能构建的研究,利用企业的历史交易数据,动态准确地智能构建产品组合。
二、研究背景及相关理论
1.研究背景
*敏*感*词*学者对大数据、数据挖掘技术与电子商务的结合进行了大量研究,但对数据挖掘与电子商务产品组合的研究较少,与管理方法相结合的研究较少。更缺乏。本文综合应用了PDCA循环管理思想和关联规则。通过计划、执行、检查、处理的迭代思维,利用持续的周期调整和优化,实时、动态、准确地生成产品组合。
2.相关理论
(1) 关联规则
关联规则是数据挖掘的一项重要技术,它反映了一件事与另一件事之间的相互依赖和关联。关联规则挖掘的目的是发现强关联规则,即从数据中挖掘出满足用户设置的最小支持度和最小置信度规则的数据。
关联规则的一般表示为:X->Y (S=s%, C=c%)
其中:X表示前一个项目可以是一个项目或项目集,Y表示后一个项目一般是一个项目。
Support (X->Y)=P(X∪Y) 是消费者同时购买X和Y的概率。
Confidence (X->Y)=P(Y|X) 是消费者在购买 X 后购买 Y 的条件概率。
Lift(X->Y)=P(Y|X)/P(X)P(Y)是判断关联规则实用性的指标。当lift大于1时,表示X对Y有正提升,如果小于1,则X和Y为负,如果等于1,则表示没有相关性。
本文将选择Apriori作为挖掘关联规则的算法。该算法具有单维、单层、布尔的特点,是一种经典的关联规则算法。
(2)PDCA 循环
PDCA循环将管理分为四个阶段,是一个连续的工作循环。每次经过PDCA循环,都要进行检查总结,分析遗留问题,提出新目标,再优化循环。
(3)产品组合
产品组合是指销售者可以向消费者提供的产品或物品的完整集合或组合。产品往往是相关的,可以同时引导消费者购买。产品组合的设计可以帮助企业优化客户。体验,提高客户转化率和客户单价。
三、模型设计
企业在经营过程中,会积累客户消费的历史记录。这些历史记录收录
不同消费者的购物清单。关联规则通过分析这些历史购物清单来发现产品之间的联系,进而挖掘出一系列的产品组合。. 该模型可以按照固定时间段或固定销售量对样本数据进行分组,并基于PDCA循环实现多重数据分析和挖掘。本文中的两轮PDCA分组如下:
2020年11月1日至2020年12月13日,A组样本1641个,A组验证组数据652个。
2020年12月14日至2021年1月28日,B组样本数据为1975个,B组验证组数据为1248个。
并按照以下流程进行两轮PDCA循环数据挖掘,分析模型如下图所示:
(1)Plan:实现目标和计划制定;(2)Do:关联规则模型设置和运行;
(3)Check:计算验证组的概率值并进行结果检查;(4)Act:效果评估和优化参数。
四、数据准备与实验分析
1.数据准备
(1)数据源
本文选取销量较高的化妆品天猫旗舰店为研究对象,利用优采云
数据采集软件抓取上述时间段内店内所有商品的评论内容,结合购买用户信息、购买时间和产品SKU模拟 恢复交易订单。本文采集
全店约5万条评论数据,模拟5516笔交易订单。
(2)数据预处理
本文选取用户标识和产品标识信息两个数据项,然后对数据进行转换、清洗等预处理操作,得到如表1所示的购物篮数据,并基于精确数据进行数据挖掘类型通过关联规则挖掘算法,对挖掘结果进行分析和评价。
①计划:制定实施目标和计划
第一轮,企业可以通过智能产品组合的构建,提升产品推送的精准度,促进消费者相关购买,提升消费者体验,提高企业客户单价,利用历史交易数据的关联规则挖掘,帮助企业推送产品组合自动。
②Do:关联规则模型设置和操作
使用R语言对采集到的数据进行处理。综合分析,本轮参数设置为:最小支持度1.1%,最小置信度50%,通过R语言导入1641条A组交易样本数据, 运行 Apriori 算法如下:
一共生成了24条关联规则。将关联规则的提升排序后,前8条关联规则如表2所示。
产生的24条规则置信度超过50%,提升幅度远大于1,说明规则有效且具有实用价值,即购买左边物品的买家很有可能购买同时右侧的项目。比如“气垫BB霜&冰冻水润唇釉->丝绒哑光唇膏”的支持度和置信度都很高,提升度达到了72。这三款产品同时非常适合作为相关产品它也适用于捆绑销售作为一个包。
根据生成的关联规则,企业可以以此为基础生成产品组合,并在关联营销中推送产品组合,让客户更方便的浏览到需要的产品,获取需要的组合包,促进客户的捆绑销售, 增加销量,提升购物体验。
③Check:计算验证组的概率值并进行结果检查
接下来,将A组样本数据生成的关联规则在A组验证组的数据中进行校验,计算出现在验证数据中的关联规则的置信度,找到生成的关联规则在验证集中更高。规则的置信度表明规则是高度可靠的。表 3 显示了验证组中前 8 条关联规则的置信度。
④Act:效果评价及优化参数
本轮执行产生了具有较好评价指标的关联规则,验证了这些规则的有效性和实用性。公司可以将这些规则应用于产品组合关联营销、产品包装设计和客户接触点优化。但是,也缺乏关联规则和可以覆盖的产品类型。
(2)第二轮PDCA
①计划:制定实施目标和计划
经过上一轮PDCA运算,企业能够挖掘出一系列高质量的关联规则,但数量少,覆盖的产品也少。因此,本轮需要调整支持度和置信度参数,在结果分析过程中需要考虑消费者需求变化。
②Do:关联规则模型设置和操作
本轮最低支持度0.7%,最低置信度35%。1975条B组交易样本数据通过R语言导入,Apriori算法运行如下:
一共生成了36条关联规则。将关联规则的提升程度排序后,前8条关联规则如表4所示。本轮关联规则数量有所提升。规则的支持度虽然有所降低,但还是出现了较高的频率,置信度处于较高水平。规则的增加远大于1,规则的有效性很高。和实用性。
③Check:计算验证组的概率值并进行结果检查
通过计算B组验证数据中规则的置信度,获得更高的置信度。因此,验证了生成的关联规则的结果具有较高的可信度。表 5 显示前 8 条关联规则在学校。测试组的信心。
④Act:效果评价及优化参数
根据本轮的执行,产生了更多的关联规则,而且都是高效实用的,可以覆盖更多的产品。企业可以使用这种方法来构建智能产品组合。此外,企业需要根据第一轮和第二轮产品关联规则的差异,了解季节性、活动性和流行趋势对产品组合的影响,与时俱进,不断优化和更新产品。文件夹。
3.实验结果分析
(1)本文的两轮PDCA过程虽然得到了高质量的关联规则,但是支持度和置信度的设置会极大地影响关联规则的生成。关联规则的支持度和置信度的调整整合在PDCA循环中,将实现参数的细化和动态调整。
(2)根据时间维度或销售维度对数据源进行合理划分,可以有效帮助企业挖掘贴近市场需求变化的关联规则。
(3)企业可以根据支持、信心、推广的变化趋势跟踪生成的关联规则的发展趋势,帮助企业更早地捕捉到产品和产品组合的需求和生命周期变化。
(4)企业可以对多轮PDCA循环产生的规则进行统计分析,根据关联规则随时间变化的程度,实施不同的营销策略。
五、总结
本文结合PDCA管理方法和关联规则数据挖掘算法,实现了数据挖掘算法在企业业务应用中的标准设计。通过PDCA循环迭代和螺旋机制,动态调整关联规则算法的应用,保证数据挖掘。效果的可靠性和实用性。通过多轮PDCA循环迭代,企业可以有效积累时间维度关联规则,帮助企业识别产品和产品组合的变化趋势和生命周期,帮助企业更全面、更系统地实现产品。组合的智能化建设。
参考:
[1] 李东云. 利用关联规则挖掘技术实现数字图书馆个性化推荐服务[J]. 2020年兰台内外(34):40-42.
[2] 郝海涛,马媛媛.基于加权关联规则挖掘算法的电子商务产品推荐系统研究[J]. 现代电子技术, 2016, 39 (15): 133-136.
[3]菲利普·科特勒,加里·阿姆斯特朗。市场营销概论[M].中国出版社,1998.
[4]朱庆.结合关联规则挖掘算法的信息化教学管理系统设计[J]. 现代电子技术, 2020, 43 (23): 159-163.
作者简介:周丽丽(1999.07-),女,汉族,籍贯:广东省揭阳市,本科,研究方向:电子商务;通讯作者:王宝军(1985.08-),男,汉族,籍贯:江西省景德镇市,*敏*感*词*,工程师,研究方向:电子商务、数据挖掘