基于知识图谱在电商平台商品个性化选购探索

(整期优先)网络出版时间:2024-07-03
/ 2

基于知识图谱在电商平台商品个性化选购探索

李金清 徐若然  刘玉石

国网电商科技有限公司 天津市 300300

摘要:本文为更好地提升商品、用户及选购下单场景之间的匹配效率,挖掘用户的潜在需求,利用电商平台的商品数据及供应商商品数据,基于专家知识辅助,构建了以<商品-产品标准库-特征项>为主的商品产品标准库知识图谱,并提出了构建电商常识属性知识三元组<头实体-产品标准库-尾实体>的新思路,开发了图谱评估系统。将商品知识图谱创新性地应用于个性化新品推荐改善及同款比价等场景中,表明电商知识图谱可以有效应用于电商平台个性化及智能化的场景中。

关键词:电商平台;知识图谱;产品标准库;特征项,商品选购

1概述

在互联网时代,人们的购物习惯逐渐从传统的搜索式购物向个性化推荐式购物方式转变,这也是互联网电商平台争相发力的突破口。通常的个性化推荐系统是采用机器学习的方式,利用用户的正负行为样本(如浏览或购买行为)来训练推荐算法模型,最终得到某一用户推荐商品的序列。这种方式对用户潜在喜好或隐性需求的挖掘效果不佳。而知识图谱中蕴含商品特征项之间,实体与实体之间丰富的关系,因而可以更好地挖掘用户的潜在偏好,并且具有更好的可解释性。目前,市面上只有通用的公共百科类图谱,没有公开的电商领域的商品知识图谱,所以电商平台需要立足于自身能力和知识数据沉淀,构建属于自己的电商知识图谱。

本文阐述了项目是如何利用系统平台商品底层数据及供应商数据在构建常规商品图谱的基础上,提出并构建常识属性知识三元组<头实体-产品标准库-尾实体>将其创新性地应用于商品个性化新品推荐改善及同款比价等场景中并为后期其他的智能应用提供经验和基础。

2 构建和完善商品知识图谱

互联网电商平台的核心要素是商品,通过顶层定义和底层抽取的综合方式,采用自顶而下和自底而上的混合模式来构建商品图谱[1]

2.1知识构建

该模块核心任务是在多源数据中构建商品领域知识体系。商品领域知识体系构建是对领域分类(如品类分类)、产品标准库及分类之间关系的定义,具有较强的抽象性和概括性[2]。在公司商品类目属性体系的基础上,邀请了商品及运营专家共同参与构建产品标准库。

同时,项目又通过供应商等第三方推送的方式补充了大量外网数据,以丰富领域知识信息。

2.2图谱构建

图谱构建的流程是:获取→抽取→融合→评估[4],项目应用多项技术栈,包括命名实体识别、关系抽取、槽填充、事件抽取等,以获取知识和抽取关系[3],构建图谱。

2.2.1获取

图谱知识由2部分组成,一部分是平台沉淀的商品数据,另一部分由供应商等第三方推送的方式,初始阶段数据需要对产品标准库编码进行去重。

2.2.2抽取

在2.2.1基础上,针对商品标题等非结构性文本数据(惠普(HP) Color Laser 150nw A4幅面彩色激光打印机)等,需要通过命名实体识别(如“bert+CRF算法”[5])等技术手段,识别出命名实体,并将其归类为商品名称、场景名称、人物姓名等事先定义好的类别。

NER过程后,再通过关系抽取、槽填充等方式进行关系抽取,利用TextRunner等算法,获得实体与实体间的语义关系并填充明确定义的特征项。形成<打印机,产品标准库,特征项)为主的图谱结构。

2.2.3融合

知识融合的方法主要有实体对齐、实体解析、实体消歧、实体链接等[7],其主要目的是获得更完整的知识描述和知识之间的关联关系,实现知识的互联、互补和融合,以解决异构问题。以打印机为例,激光、喷墨等都属于“打印机”,A3、A4等都属于打印机的一个“打印尺寸”。因此,需要将进行融合成不同的标准库,如惠普(HP) M856dn A3彩色激光企业级打印机 ,惠普(HP) M507N A4黑白激光企业级打印机等。

此类融合方式在个性化推荐过程中还可以提升图谱召回的丰富性和合理性。比如,当用户要购买A4的打印机时,其他打印相关也可以被推荐给用户,以提升推荐结果的命中率。

2.2.4评估

在实际使用过程中发现,产品标准库在电商业态下的各个场景都有着广泛的需求,如“办公室需要企业级的A3打印机”。它反映了购物行为的内在原因,对用户体验和购物效率有着重要的意义。而现有的知识图谱对合理性及显著性的表示有所欠缺。

为解决此类问题,项目组决定提出沉淀电商常识属性知识三元组的创新性思路,建立电商常识知识三元组(即头实体、产品标准库、尾实体)。

2.3质量评估

商品图谱建立好后,为维持和提升图谱质量,项目组依托公司的大数据平台,开发了供公司内部使用的图谱质量评估审核流程。

项目组对办公类用品、工器具、物资配件等图谱进行了多次质量评估,有效提升了整体图谱数据质量水平,使得图谱挂载准确率从85%左右提升到了95%以上,而召回率也有了18%左右的提升。

3 知识图谱在商品个性化推荐的应用

3.1 个性化新品推荐改善

在电商平台中,新品上架数量多、频次高。平台希望能够提升新上架商品/新品流量分发效率,以促进平台整体收人的提升。

因此,项目基于商品知识图谱尝试提升item/用户表征能力,以更好地解决新品冷启动的问题。主要方法是通过graph建模的方式扩充用户商品行为序列间商品的关联,并通过图谱来增进热门商品和冷门/新上架商品的表征相似度。

在用户侧:基于用户点击、购物等行为历史构建user->item-entity图。

在商品侧:基于item-entity->item-entity构建 I-I图,从而通过在item的子图中引入与其相关的其他item/entity的方式增强item的图表征。

最后,通过GNN网络学习用户和新品/冷门之间的潜在关系,更有效率地推荐给用户,以解决新品的推荐问题。

3.2同款比价

项目基于构建好的电商知识图谱,尤其是依托产品标准库,通过产品标准库聚合同款商品,给用户在商品详情页推荐不同供应商同款商品和销量。

同款比价的位置穿插于电商平台和APP中商品详情页、购物车推荐、种草好货推荐等多个平台推荐流场景中。

4 结束语

项目组利用公司数据及外网数据,构建了以产品标准库为基础的知识图谱,并创新性地提出了以产品标准库为基础的知识三元组图谱构建,将其应用于2个创新场景—个性化新品推荐改善及同款比价,均取得了较好的数据提升效果。事实证明,电商知识图谱构建可以有效应用于电商平台的个性化及智能化场景中。项目组希望后续可以沉淀更多准确的知识性三元组,并希望通过提升模型的准确度及增加显著性校验等流程,以减少知识性三元组的审核人力成本。同时,项目组也会进一步研究其他智能化应用场景,如搜索、智能导购问答等。

参考文献

[1]李鑫柏,吴鑫然,岳昆.基于贝叶斯网的开放世界知识图谱补全[J].计算机工程,2021,47(6):104-114.

[2]郭剑毅,李真,余正涛,等.领域本体概念实例、属性和属性值的抽取及关系预测[J].南京大学学报(自然科学版),2012,48(4) :383-389.

[3]俞伟,徐德华.推荐算法概述与展望[J].科技与创新,2019 (4) : 50-52.

[4]常亮,张伟涛,古天龙,等.知识图谱的推荐系统综述 [J].智能系统学报,2019,14(2):207-216.

[5]王义,马尚才.基于用户行为的个性化推荐系统的设计与应用[J].计算机系统应用,2010,19(8):29-33.