网络舆情的情感分析和情感挖掘

(整期优先)网络出版时间:2023-12-28
/ 2

网络舆情的情感分析和情感挖掘

张立颖

四川省交通运输厅信息中心 610041

[摘要}网络舆情的形成、传播和演化过程中,蕴含着丰富的情感信息,对这些情感信息的分析和挖掘对于理解网络舆情具有重要的意义。本文将对网络舆情的概念与特点、情感分析技术发展历程进行概述,并对文本情感挖掘方法的分类进行具体分析。此外,本文将结合实际案例,深入剖析情感分析在网络舆情应用中的作用,以期为我国网络舆情研究提供理论参考和实践指导。

关键词:网络舆情,情绪,情感分析,情感挖掘方法,数据收集与预处理

1.网络舆情与情感分析概述

1.1网络舆情的概念与特点

网络舆情是指在网络空间中,公众对特定事件、话题或现象所产生的观点、态度和情感的总体表现[1]。它具有以下几个显著特点:首先,网络舆情的传播速度快、范围广,可以在短时间内影响大量网民[2];其次,网络舆情具有强烈的互动性,网民可以通过评论、转发等方式,参与到舆情事件的讨论中;再次,网络舆情呈现出明显的多元化趋势,涵盖了政治、经济、文化、社会等多个领域;最后,网络舆情具有一定的情绪倾向,正面情绪和负面情绪相互交织,影响着公众的心态和行为。

1.2情感分析技术发展历程

情感分析技术发展历程可追溯到20世纪90年代,早期的情感分析技术主要集中在基于词典和规则的方法,这些方法主要依赖人工构建的情感词典和规则对文本进行情感分类[3]。进入21世纪,机器学习和深度学习技术的快速发展为情感分析技术带来了新的机遇和挑战。

2.文本情感挖掘方法

2.1传统情感分析方法

2.1.1基于情感词典的方法

基于情感词典的方法主要通过构建情感词典,对文本中的词语进行情感打分,然后根据情感得分计算整个文本的情感倾向。情感词典的构建可以是人工编写,也可以是通过自动抽取的方式获取。尽管这种方法在一定程度上能捕捉到文本的情感信息,但其准确性受限于词典的质量,且处理速度较慢,不适用于大规模文本数据的情感分析。

2.1.2基于机器学习的方法

基于机器学习的方法主要通过训练分类器对文本进行分类,从而判断其情感倾向。常用的分类算法包括朴素贝叶斯、支持向量机、决策树等[4]。为了提高分类准确性,研究者们通常需要对文本进行特征提取,如词频、词向量等。此外,基于机器学习的方法还可以通过集成学习、迁移学习等策略进一步提升性能。但这类方法的性能仍然受到特征工程和分类器选择的影响,且需要大量的标注数据进行训练。

2.2.深度学习在情感分析中的应用

2.2.1卷积神经网络(CNN

卷积神经网络(CNN)通过卷积层、池化层和全连接层对文本进行特征提取和降维,最终实现情感分类。由于CNN具有良好的局部特征表达能力,因此能有效捕捉文本中的情感信息。然而,CNN在一定程度上仍然受限于训练数据的大小和质量。

2.2.2循环神经网络(RNN

循环神经网络(RNN)是一种具有短期记忆能力的神经网络,适用于处理序列数据[5],可以通过前一个时刻的隐藏状态来影响当前时刻的输出,从而捕捉文本中的长距离依赖关系。常用的RNN变体包括LSTM、GRU等,但其性能仍然受到模型参数调整和训练数据的影响。

2.2.3基于注意力机制的深度学习模型

注意力机制是一种能够自适应地调整输入信息重要性的技术,其在深度学习模型中的应用逐渐受到关注。基于注意力机制的深度学习模型能够在情感分析过程中自动聚焦于文本的关键部分,从而提高分类性能[6]。如BERT、GPT等模型,通过引入注意力机制,有效地提升了情感分析任务的准确性。然而,这类方法仍然面临着训练数据不足、计算资源需求较高等问题。

3.网络舆情情感分析案例研究

3.1新冠疫情网络舆情情感分析

以新冠疫情为例,对网络舆情情感进行分析,具体如下:

首先,从情感极性角度分析,新冠疫情相关的网络舆情中,正面情感占比逐渐上升,负面情感占比逐渐下降。这说明随着疫情防控措施的不断完善,网民对疫情的担忧情绪逐渐缓解,信心不断增强。此外,中性情感占比在整个过程中保持相对稳定,表明网民对疫情关注的持续性。

其次,从情感强度角度分析,新冠疫情网络舆情情感强度整体呈上升趋势。这表明随着疫情的发展,网民对疫情的关注程度逐渐加深,情感表达愈发强烈。在此基础上,通过聚类分析,可以将网民情感划分为以下几类:恐慌、担忧、愤怒、感动、支持等。这些情感在一定程度上反映了网民对疫情防控措施、医疗救治、抗疫英雄等各方面的态度[7]

3.2网民情绪分析与舆情预警

在新冠疫情网络舆情情感分析的基础上,进一步深入研究,从以下几个方面进行网民情绪分析:

1)情绪波动:通过计算情感极性转移矩阵,发现网民情绪在疫情期间存在一定程度的波动。特别是在疫情爆发初期,正面情感与负面情感转换频繁,可能引发恐慌、担忧等负面情绪。

2)情绪传播:分析新冠疫情相关舆情中的情绪传播路径,发现情绪在网络中的传播具有快速、广泛的特点。负面情绪的传播往往会导致恶劣的社会影响,甚至引发群体性事件。

3)情绪与舆情事件关联分析:通过构建情感-舆情事件关联矩阵,发现情感与舆情事件之间存在密切关联。

4.情感分析在网络舆情应用中的挑战

4.1数据收集与预处理

4.1.1跨平台数据收集

为了全面把握舆情动态,研究者需进行跨平台的数据收集,以便更准确地反映网民的情感态度。数据收集过程中,应注重数据的实时性、有效性和可靠性,确保所收集的数据具有较高的分析价值。

4.1.2中文分词与词性标注

在进行情感分析之前,需要对中文文本进行分词和词性标注。分词是将连续的汉字切分成有意义的词汇,而词性标注则是为每个词汇分配一个词性标签,如名词、动词、形容词等。这一步骤对于后续的情感分析具有重要意义,有助于提高分析结果的准确性。

4.2情感分析模型优化

4.2.1模型融合与集成

为了提高情感分析的准确性和稳定性,研究者可以尝试将多种情感分析模型进行融合与集成。例如,可以将基于情感词典的方法、基于机器学习的方法和基于深度学习的方法进行结合,从而充分发挥各模型的优势。还可以通过模型融合技术,如投票、BaggingStacking等,实现对各模型预测结果的集成,进一步提高情感分析的性能。

4.2.2跨领域情感分析

网络舆情涉及多个领域,如政治、经济、社会等,分析时需要考虑到不同领域间的差异跨领域情感分析方法可以有效地解决这一问题,如使用领域自适应的词嵌入技术、领域自适应的模型训练策略等。这将有助于提高情感分析在网络舆情分析中的应用效果[8]

5.结论与展望

本研究首先分析了情感分析技术的发展现状,对情感分析方法进行了分类,介绍了深度学习技术及其在情感分析中的优势,此外,还构建了网络舆情情感分析模型,并通过实验验证了模型的有效性和可行性。

未来研究方向:首先,进一步优化数据预处理方法,提高数据质量,以提升模型性能[9]。其次,探索更先进的深度学习模型,如Transformer等,以提高情感分析的准确性和效率。此外,可以将网络舆情情感分析与其他技术(如自然语言处理、知识图谱等)相结合,构建更加智能化的情感分析系统[10]。最后,扩大实验规模,进行多领域、多任务的网络舆情情感分析研究,为我国网络舆情监测和管理提供更加全面、准确的支持。

参考文献

[1]马海龙.构建完善的网络舆情引导机制[J].新长征:党建版, 2013(3):2.DOI:CNKI:SUN:XCZD.0.2013-03-025.

[2]吴欢.群体性突发事件互联网舆情传播干预机制的研究[D].东北林业大学[2023-12-06].

[3]刘砚博.基于深度学习的情感分析研究与应用[D].电子科技大学,2019.

[4]张杰.基于态势感知模型的文本情感分析研究[D].北京邮电大学,2016.DOI:CNKI:CDMD:2.1017.291445.

[5]杨丽,吴雨茜,王俊丽,等.循环神经网络研究综述[J].计算机应用, 2018, 38(A02):7.DOI:CNKI:SUN:JSJY.0.2018-S2-001.

[6]杨凡.基于深度学习的微博情感分析[J].[2023-12-06].

[7]方园园.基于文本挖掘与情感分析的网络舆情分析——以"新冠肺炎疫情"为例[D].安徽财经大学[2023-12-06].

[8]张昊天.基于领域适应的跨领域情感分析的应用研究[D].中国矿业大学,2019.

[9]储浩,吴志周,同济大学智能交通系统研究中心,上海.动态交通数据的预处理方法及应用[C]//科技部.科技部, 2008.DOI:ConferenceArticle/5aa359a6c095d72220b3be4d.

[10]张诗莹,李阳.融合事理知识图谱与网络舆情分析的突发事件情报支持路径及实证研究——以危化品事故为例[J].信息资源管理学报, 2023, 13(4):60-71.