汽车在线点评数据分析——以奥迪A3L为例

(整期优先)网络出版时间:2022-11-17
/ 2

汽车在线点评数据分析——以奥迪A3L为例

陆子岳

南京市金陵中学

摘 要: 家用轿车已成为家庭必备商品多年后,经济改善型家用车成为了市场的又一个爆点。 但用户在汽车选购时却很难判断。本研究以奥迪A3L为例,采集了太平洋汽车用户对奥迪A3L的点评数据,并利用大数据分析方法和工具,对用户点评数据进行了分析,为用户购车提供了分析方法,同时,也为汽车企业提供了获取和分析自身及竞争对手的方法。

关键词:汽车点评 数据分析 奥迪A3L

1.引言

中国的汽车工业主要起源于苏联。自1990年代初以来,中国汽车产业发展迅速,目前已成为全球最大的汽车生产国。汽车产业链长、涉及面广、带动性强。汽车消费成为了国民经济重要的支柱性产业。汽车产业的快速发展也带动了汽车电子商务的发展,其中,大量的汽车用户对汽车进行了点评,这些点评数据,不仅为其它用户购车提供了极大的便利,也为车企了解自身和竞争对手有帮助,过去,由于汽车产业链非常长,用户的意见最多反馈到销售员那里,销售员再反馈给4S店,4S店再反馈给整车厂,整车厂再反馈给零部件商,零部件商甚至还要反馈给自己下一级供应商,最后一级供应商了解到用户意见再改进、生产,可能时间已过去2年甚至更长。因此,用户的在线点评功能大大促进了汽车行业的技术进步。本研究以奥迪A3L为例,说明如何从用户点评数据分析汽车的优点和缺点。以期为用户和汽车相关企业快速了解用户需求及产品情况提供分析方法。

2. 用户在线点评数据收集

互联网上有多家汽车资讯平台提供用户在线点评信息,本研究选取太平洋汽车网车主点评数据为数据源。主要理由是,太平洋汽车网(PCauto)成立于2002年7月,平台定位是为全国汽车爱好者与汽车用户提供新车资讯、新车评测、新车导购、经销商报价、专业视频、图片参配、用车知识等内容,成为中国汽车行业的重要的门户网站之一。 特别是其中的车主点评,数据来源于购车车主,数据字段丰富,数据结构清晰,为数据分析提供良好的基础。

在百度搜索引擎中,搜索“太平洋汽车网 车主点评”,并在搜索框中搜索A3L,得到大量车主点评数据。 利用数据采集工具—八爪鱼,爬取1000条点评数据。 每个字段的信息都可以分别分析,但本文仅对缺点字段的内容进行分析,以此发现车主有哪些不满意。 优点、外观等其它字段的内容完全可以采取一样的方法进行分析。这里不再赘述。

3. 数据分析

3.1 文本分析方法

文本分析是指对文本的表示及其特征项的选取;文本分析是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出的特征词进行量化来表示文本信息。文本是由特定的人制作的,文本的语义不可避免地会反映人的特定立场、观点、价值和利益。因此,由文本内容分析,可以推断文本提供者的意图和目的。本研究利用集搜客进行文本数据分析。集搜客是网页数据的结构化转化工具:利用其提供的文本分词情感分析工具可以对点评数据分析。

首先。将A3L中的缺点字段复制到记事本中,作为文本分析的数据源。然后,将数据导入集搜客中(如图1所示)。然后进行共词匹配,得到共词矩阵。共词矩阵是同时出现在一句话中的词,如“没有”和“定速巡航”出现一个句子中,即是共词之意,说明点评中提到多少次没有定速巡航这个问题。虽然该软件也提供共词分析,但可视化效果差,为此,保留该矩阵,随后利用另一个软件社会网络分析Ucinet进行可视化分析。


图1.集搜客文本分析

3.2 社会网络分析方法

数据分析采用了社会网络分析方法。社会网络分析(Social Network Analysis, SNA)方法,也称为结构分析法(Structural Analysis),主要用于分析社会网络的关系及其关系网络结构。社会网络分析的意义在于,它可以对各种关系进行量化分析。包括社会关系网络的可视化及网络分析。可视化是通过内嵌的绘图软件将关系网络绘成图形,便于直观地观察网络特征;网络分析包括对社会关系网络密度、直径、节点距离、节点可达性等基本测量,还包括中心化分析、小团体分析和角色分析等一系列分析模型。 本研究主要应用了共词可视化分析。

3.2 A3L缺点数据分析

将集搜客中的共词矩阵导入UCINET6.0中。该矩阵是1000*1000的共词矩阵,数据量大,为此,只保留共词次数不小于8的共词数据。并在软件中将按词频的大小显示节点,即某个词在点评中出现次数多,图中的节点就相应地大。如图2. 图2中可以非常明显地看到“没有”、“空间”和“满意”等词最大。而从共词中可以看到,没有指的是用户抱怨没有定速巡航和天窗等。


图2缺点点评高频词共线网络

最后,将高频词带入原始数据中,利用查找法,在初始点评文本缺点数据中,查找没有“没有”、“空间”和“满意”等词,获到用户主要在以下方面不满意,并对同义词或近义词进行了合并。最后,得到不满意的内容及次数(如图3所示)。


图3车主点评中显示的主要缺点

可以清楚地发现,奥迪A

3的空间和声音是最大的两个问题,其次,定速巡航、天窗、内饰、味道也是用户不满意的地方。 由此可见,奥迪A3需要在这几个方面有所改进。

4. 结语

用户在线点评信息分析中,使用了三种软件:八爪鱼、集搜客和社会网络分析UCINET, 清楚地看到车主的态度。同样的方法还可以分析该车的优点等。在优点中发现,奥迪A3的外观是用户评价最高的指标。奥迪A3是近年销量较好的车型,外观是很多用户选择的理由。对于汽车来说,有时优点和缺点可能不得不同时存在,如空间增大,可能外观就没有那么漂亮,对于这样鱼和熊掌不可兼得的问题,车企可以忽略。而对于国内的味道等问题,车企完全可以通过提升内饰质量进行改变。车企对车主点评数据保持跟踪分析,对于车企保持竞争力具有重要意义。

参考文献

1. 罗家德.社会网络分析讲义(第3版).社会科学文献出版社,2020.5。

2. 刘军,整体网分析(第三版)——UCINET软件使用指南,格致出版社. 2019.10