基于优化蔬菜类商品的自动定价与补货决策模型

(整期优先)网络出版时间:2023-11-08
/ 2

基于优化蔬菜类商品的自动定价与补货决策模型

赵家龙1 ,刘慧敏2 ,于文帅3,指导老师:朱得康4

1.山东协和学院 商学院,山东 济南 250109

2.山东协和学院 商学院,山东 济南 250109

3.山东协和学院 商学院,山东 济南 250109

4.山东协和学院 基础部,山东 济南 250109

摘要:由于蔬菜本身特殊的生理特性,在一般的生鲜商超中保鲜期都比较短,为了提升商超经营的利润率,必须对蔬菜类商品的自动定价和补货决策进行规划。本文基于大量的数据进行分析,从而对销售参数进行一定的拟合,并作出预测,帮助建立优化蔬菜品类结构的模型,提高商超经营的利润率,减少损耗率,实现效益最大化。

关键词:数据预处理;相关关系;优化模型;成本加成定价;补货政策

一、问题背景分析

为了帮助商超做出合理的蔬菜类商品的自动定价及补货决策,问题一需要对于附件中的数据进行整理分析,首先需要对数据进行清洗,筛除异常值、重复值,利用SPSSPRO对不同品类及单品的分布特征进行相关性分析,最后将数据进行降维分析,可以利用聚类分析的方法,进而总结出数据的相关关系。

考虑到数据库的庞大性,首先必须对数据进行数据预处理,在数据进行观察后,对数据的异常值、缺失值等进行筛选,利用SPSSPRO对其进行处理。

研究分布规律及相互关系,首先对数据进行描述性分析,绘制出了不同单品及品类分布规律的直方图并且对PersonSpearman相关系数得出的热力图 进行了相关性的分析,接着使用Kendall一致性检验来验证他们的相互关系;其次用时间序列分析来对各大类一个周期(4-10月)的数据研究分析,得出了一定周期、月份销售量的分布情况,最后进行聚类分析,完善了不同商品和不同品类的相关关系分析及分布规律。

二、模型的建立与求解

2.1模型假设

(1)假设在周期内的销量数据是稳定且符合实际的,没有突发情况的影响。

(2)假设已给的条件、参数的保真性较高,能够反映实际情况。

(3)假设外在因素相对稳定,比如竞争对手、市场趋势等,定价标准等不会有剧烈波动,基本可以忽略。

2.2模型的建立

2.2.1 问题分析

问题中通过蔬菜不同品类和单品间存在的关联,要求对各品类销售量以及单品销售量进行相关性分析及可视化处理,从而分别研究出品类及单品的分布规律及相关和关系。附件中已经给出了详细的数据,我们首先对数据进行预处理,包括异常值、缺失值以及重复值的数据清洗,利用SPSSPRO对处理完成的数据做描述性分析,得出平均值、中位数、最大值、标准差、卡方值等能够反映分布特征的数值统计量。其次通过Kendall以及斯皮尔曼相关系数进行相关性分析,并利用直方图、箱型图对数据进行一个综合性的处理分析。

考虑到一定季节、一定周期的销售额可以反映商品的销量关系。随后我们要对时间进行序列分析,来对各大类一个周期(4-10月)的数据研究析。最后可以使用层次聚类及 KMS 进行聚类分析,聚类分析可以将复杂的数据进行 可视化分析,总结出相关数据未来发展的去升级,从而更有针对性地制定营销计划,对决策模型进行优化。

2.2.2 模型的构建

首先对附件一的数据进行预处理,附件一中共有原始数据 87504 个,经过重复性 筛查等一系列预处理后,剩余 878500 个,考虑到与原数据差距不大,可以几乎 忽略,因此使用原数据作为我们数据处理的对象。

利用 SPSSPRO 对附件一、二中的数据进行处理后,得出了各蔬菜品类的分类汇总图,经过分别对图表中数据均值、中位数、标准差及最值的分析,发现水生根茎类、花叶类、茄类的均值、中位数较大,水生根茎类的均值为0.692,中位数为0.556,花 叶类的均值及中位数分别为0.598 、0.489 ,并且二者差值较小,说明其数据集整体较 大,离散程度较低。

为了更清晰地对蔬菜品类分类汇总情况进行分析,我们列出了图表即蔬菜品类 分类汇总均值图表作为示例,对于中位数、标准差、最大值的相关分析数据进行补充说明。

经过数据预处理,将蔬菜品类分成六大类,并对数据进行描述性分析,分析出各 品类蔬菜销售总量的占比情况,其中花叶类销售总量占比最大,为 42. 15%,其次为辣 椒类占比 19.45% ,茄类占比最少,只有 4.76%。

在进行相关性检验时,我们根据往年每一个月品类销量进行了相关的数据处理,处理完成后进行使用了SPSSPRO进行数据的处理分析,并引入了person相关性系数。

1各品类蔬菜销售总量占比图2各品类矩阵热力图(person)

经过对矩阵热力图的分析发现,花叶类与花菜类、辣椒类与花叶类、花叶类与食用菌类相关系数分别为 0.747、0.634、0.546 呈正相关且存在强烈的相关性;花菜类与茄类的相关系数为 0.058 ,正相关性较弱;花叶类与茄类、茄类与辣椒类相关系数为 -0.035 、-0.191,呈负相关且相关性较弱。

三、模型的评价

将数据进行优化分析并进行模型的建立,帮助商超制定了蔬菜类商品定价补货的决策,该模型首先对大量的数据进行了处理,将重复值、异常值进行了筛选,其次利用各种模型分析对数据进行了多种模型的多元分析,在结合商品的价规则,以及定价决策的各种约束条件建立起了优化模型;面对庞大的数据量,选择对数据利用 0- 1 规划的方式进行处理,进而找出了收益最大化的模型。

繁杂的数据量使数据处理过程相对比较地复杂,但是由于考虑地影响因素多样,数据也有较大的可参考性、借鉴意义。该模型也可以运用到其他的数据处理中去,帮助更好的制定决策,同时也可以扩大样本容量,加强对结论的分析与检验,使模型更 具有普适性,加强推广使用。

参考文献

[1]Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version1.0.11)[Online Application Software].

[2] 黄贺.基于深度学习的商品自动定价模型研究[J].现代商贸工业,2019,40(09):188-190.DOI:10.19311/j.cnki.1672-3198.2019.09.095.


[*]论文来源:2023年“高教社杯”全国大学生数学建模竞赛