基于情感词典和堆叠残差的双向长短期记忆网络的情感分析
罗浩然,杨 青
(1.华中师范大学伍伦贡联合研究院,武汉 430079;
2.华中师范大学计算机学院,武汉 430079;
3.国家语言资源监测与研究网络媒体中心,武汉 430077)
教育类机器人是教育行业和工业界的一次基于发展的人工智能技术的尝试,然而对这一部分用户反馈的研究大部分仍停留在人工分析使用自然语言的购物评论的阶段。对于此类新兴技术的文本分析,仅使用标准的情感词典或某类神经网络是不够的,因为针对该领域的情感词汇极少,也没有有效、科学的分类模型或情感得分量化的算法。基于此,本文的工作主要在于:1)通过无监督学习、聚类算法的结合,合理设置情感分类的一、二级影响因素;
2)通过构造情感词典和深度学习模型并将两者结合,提高特定领域的情感分类的精准度。
f
值可达82.62%。然而,传统的情感分类方法往往需要高质量的特征构造,如N
元模型(N
-Gram)。基于深度学习的抽象特征可以避免人工特征提取,通过词的嵌入模拟词与词之间的关系,具有局部特征提取和记忆存储的功能。Johnson 等在深层金字塔卷积神经网络(Deep Pyramid Convolutional Neural Network for text categorization,DPCNN)中引入了残差结构,增加了多尺度信息,并且增加了用于文本分类卷积神经网络(Convolutional Neural Network,CNN)的网络深度,以提取文本中远程关系特征,并且并没有带来较高的复杂度。Rajasegaran 等通过借助CNN 的成功经验引入“DeepCaps”这一种深囊网络结构,并在其中使用基于3D 卷积的动态路由算法。借助DeepCaps,该方法在CIFAR10、Street View House Number(SVHN)和Fashion Mixed National Institute of Standards and Technology(FashionMNIST)性能上超越了最新的胶囊域网络算法,同时减少了68%的参数量。Zhang 等针对特定任务,对于每个方面层级设计了基于注意力机制的注意力向量,该机制涉及两个子向量,即维度注意力向量和情感注意力向量,从语义空间的角度解决了神经网络设计过于复杂的问题。但是,这类具有特定领域属性、短文本、复合情感的评论的情感分析模型存在着诸多局限性:单一使用情感词典存在情感词汇覆盖率低,编纂、维护词典工作量大,无法洞察语句中上下单词的联系的问题;
而单独使用深度学习方法,在处理一些特定领域的文本时容易出现过度过滤和错误处理语气助词、修饰词的情况。因此,本文以科大讯飞、小度、狄刺史、天猫精灵四个智能教育机器人品牌为例,通过爬取在线评论数据、数据清洗并构建一种基于堆叠残差的双向长短期记忆(Bidirectional Long Short-Term Memory,Bi-LSTM)网络和人工构建的情感词典结合的情感分析算法来判断评论的情感取向,量化产品质量、性价比和外观的情感指数,然后将情感指数标准化为某个情感极性的概率,以完成分类任务。研究路径如图1 所示。
图1 研究路径图Fig.1 Research roadmap
1.1 数据预处理
本文选取中国四大知名教育机器人品牌旗下的最新型号机器人作为研究对象,包括天猫精灵CC10、小度智能机器人旗舰版、科大讯飞阿尔法大蛋2.0、狄刺史H2,同时选取的四款产品也属于不同价位,以便于纵向对比。通过基于Python 的爬虫软件“后羿采集器”,在淘宝、京东、苏宁易购等电商平台上收集了2019 年至2021 年每个品牌的15 000 条在线评论,最终获得60 000 条评论。
由于自然语言的随机性和非标准化,原始数据中存在很多噪声,如语法结构混乱、错别字模糊、传统字符和重复注释,无效的评论、广告和其他问题。如果这些数据被直接输入到情感分析模型中,深度学习模型将会学习到大量无意义的数据,模型的分类精准率将严重降低。为了过滤冗余数据,本文采取了两个步骤进行数据清理:首先,使用正则表达式来清理字符串。然而正则化虽然可以初步过滤数据,但仍达不到使用标准,这是因为在评论中仍有许多经常被广泛使用但没有实际意义的汉字或英文字母。因此本文以中国科学院开发方汉语词法分析系统的停用词表作为基础停用词表,结合购物评论的特殊性,添加了部分特定领域内的停用词,如机器人品牌、颜色、型号、html 标签名称等。最终,本文使用的停用词列表的条目总数为2 072。最后,使用“庖丁分词”对经过正则表达式和停用词表处理过后的文本数据进行分词。
1.2 数据分析
1.2.1 词频统计
为了初步了解关键词的分布情况可以计算数据的词频。NLTK(Natural Language Toolkit)工具包可以用来计算单词特征,并建立频率分布表,导入matplotlib 用来可视化单词频率。四个品牌的词频可视化结果如图2 所示。
图2 词频统计Fig.2 Word frequency statistics
1.2.2 关键词提取
本文需要对产品的衡量维度进行划分,主要采取“两级”划分法则。主要思路是:首先,通过数据处理和关键词提取技术得到一定数量的关键词作为一级分类,使用聚类算法衡量语句相似度划分一级目录下的二级目录;
然后,通过人工情感标注处理后的文本放置在各个分类目录下,经过词向量转化过程进入情感分析的步骤。这样划分后的文本评论会根据所属的不同维度被初步分类,方便观察分类算法对于不同维度分类下的文本的分类效果,以上过程如图3 所示。
图3 两级划分规则Fig.3 Two-level division rules
1)一级关键词提取。在进行关键词提取时,主要有三类方法:基于统计的词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)方法、基于词共现图的TextRank 方法和基于词语网络的方法。其中:单独使用TFIDF 无法同时精准地反映单词在一篇文本中的重要程度和特征词的分布情况;
而词语网络的构造相对复杂,各类参数设置复杂。因此本文采用基于词共现图的方法进行关键词提取。
TextRank 算法是一种基于图的排序算法,通过移动共现窗口表示词语之间的联系程度,对后续关键词排序的同时从文本中提取出关键词。TextRank 是对PageRank 的改进算法,该算法着力构造词汇网络图模型,词语间的相似关系被看成是一种投票关系,计算每一个词语的重要程度,具体计算如式(1)所示:
其中:WS
(V
)体现词语的重要程度,d
为阻尼系数,w
表示两个节点之间的边连接具有不同的重要程度,In
(V
)是节点V
的入度点的集合,Out
(V
)是节点V
的出度点集合。下面结合本文的中文文本评论数据集对上述公式做具体分析:首先将每个品牌的评论的评论集T
按照句子进行分割,即T=
[S
,S
,…,S
],对于每个分割结果S∈T
进行分词和词性标注,在过滤停用词后只保留指定词性为名词的词语,即S=
[d
,d
,…,d
],其中d
代表候选关键词,并由此构建关键词图G=
(V,E
),其中V
是上一步得到的候选关键词的集合;然后根据共现关系(若两个关键词在长度为
k
的窗口中同时存在则认为存在共现关系)构造两点之间的边集E
。此外,本文中设置d
为经验值0.85。根据式(1),递归传播各关键词的权重,直至收敛。将关键词的权重进行倒序排序,取权重值最大的t
个单词作为关键词。虽然TextRank 可以用来计算词语的重要性,但是算法不能解决词语的重要性的差异对相邻的节点权值转移的影响问题,基于此本文最终使用了一种TextRank 的改进算法,即使用TF-IDF 和平均信息熵两个特征来计算词语的权重,用计算得到的综合特征信息来改进TextRank 词汇节点的初始权重大小以及概率转移矩阵从而共同决定关键词的选取。经计算分析,得到一级关键词如下:学习、影视、交互、用户体验、价格。2)二级关键词提取。经过独热编码转化后的数组作为数据输入,使用Word2Vec 的CBOW(Continuous Bag-Of-Word)模式下的神经网络层对二级影响因素的单词进行向量化处理。因此,为了得到某一领域中某个词的向量,首先要对该领域的评论集进行预处理,然后利用Gensim 模块的API 接口添加Word2Vec 训练词向量模型。本文使用文本聚类方法K
均值(K
-Means)聚类算法获得词向量的聚类结果,使用轮廓系数评价聚类质量。在获得每个单词的词向量后,绘制上一步收集到的特征词的向量表示。在使用K
-Means进行聚类分析时,首先初始化K
个质心,计算属于数据集的每个待算数据与K
个质心之间的欧氏距离,找出最小值,将数据添加到相应的簇类中。然后,计算聚类集之间的均方误差,并对聚类类中每个向量与质心之间的距离进行累加。通过不断调整K
值和迭代次数,最终发现当K
=5 时,均方误差达到最小值 0.334 7,轮廓系数达到最大值0.796 8(图4)。图4 K-Means聚类结果Fig.4 K-Means clustering result
综上所述,结合文本聚类技术和电子商务点评系统的相关研究和一级分类因素得到二级分类因素,其中:学习分类下包括教学、做题、问题、搜题;
影视分类下包括视频、音质、娱乐;
交互分类下包括语音、对话、聊天、回答、陪伴;
用户体验分类下包括颜色、手感、尺寸、外形;
价格分类下包括便宜、性价比。共计一类分类因素5 个,二类分级因素18 个。
构建情感分析模型是情感分析里的核心任务。本文基于传统方法和深度学习模型相结合的思想提出了如下方法进行情感分类:将Python 的文本数据库SnowNLP、传统情感词典和Bi-LSTM 共同作为情感评分模型的参考维度,通过合理设置各部分参数比重最终得到用户的整体情感得分和各种影响因素的个人得分,并标准化为概率值作为预测结果。通过预测结果和真实值的比较,可以反映模型预测的精准度。
2.1 情感分类模型设计
在计算每个评论的情感评分时,首先要完成文本分类。目前常用的情感分类方法有机器学习中的分类算法(如支持向量机和朴素贝叶斯)和深度学习中的分类算法。
机器学习的方法主要用有监督的(需要人工标注类别)机器学习方法来对文本进行分类。循环神经网络(Recurrent Neural Network,RNN)是一种基于时序逻辑的神经网络结构,因此适合处理诸如天气预测、人类自然语言语义预测等关注前后事件发生的顺序及其联系的任务。RNN 的基本结构如图5 所示。
图5 RNN结构Fig.5 Structure of RNN
如图5 所示,拆分的RNN 结构由初始状态h
、输入时间序列x
和输出时间序列h
组成,对于每一个RNN 的单元细胞都具有相同的隐层结构,根据任务需求可以增减每个细胞内隐层的层数。每一轮生成的更新状态h
在输出的同时还参与到下一组的运算当中,和输入序列x
共同作为输入参数进入细胞内的隐层迭代运算。RNN 虽然可以一定程度上处理句内前后文之间的联系,但是在反向传播训练时,如果维度过大、参数过度会出现梯度弥散的问题。LSTM 是RNN 的一种改进版本,主要用来解决RNN 梯度消失和梯度爆炸的问题。Bi-LSTM 是前向LSTM 和反向LSTM 的组合。
如图6 所示,LSTM 的一个环节中包括t
时刻的输入数据x
、细胞状态C
、隐层状态h
、遗忘门f
、记忆门i
、输出门o
。图6 LSTM结构Fig.6 Structure of LSTM
LSTM 的具体计算流程如下:传递遗忘细胞状态下的部分信息,并记住新的信息,在随后的时刻计算有用数据时使用这些信息。无效信息被丢弃的同时,输出每个时间步的隐藏层状态h
,其中忘记步骤、记忆步骤和输出步骤被遗忘门f
、记忆门i
和输出门o
以及前一时刻的隐层状态h
和当前输入间的x
共同控制计算。在一些分析情况下,预测可能需要由前一个输入和后一个输入来确定,后者将更准确;因此,双向RNN 被提出,其网络结构主要包括四个层次:词向量层、前向传播层、反向传播层和连接层。在分析时,首先将句子分词,然后经过词映射层将单词转化为词向量并传入前向LSTM 层,而前向层和反向层与输出层相连。前向层从时间1 到时间
t
进行正向计算,每次得到并保存隐含层的输出。反向层沿时间t
到时间1 进行反向计算,获取并保存反向隐含层每时每刻的输出。最后,将每一时刻前向层和后向层对应时刻的输出结果相结合,得到每一时刻的最终输出。就文本分类任务来说,学术界普遍认为改进的LSTM 或Bi-LSTM 相较于早期版本的RNN 有着更好的分类效果;
然而,即便使用标准的Bi-LSTM,因为模型深度有限,所以在处理一下语义关系比较复杂、前后文关系比较强的文本时分类的精准度仍然有待提高。
近年来,随着诸如VGG(Visual Geometry Group)、InceptionNet和ResNet等层数很多的神经网络架构被提出,增加神经网络的深度来提高学习模型的性能的猜想得以证实。由于能够学习到更好的特征表示,对于语言建模任务,应用深层架构从理论上来说具有可行性。其中,一种较为流行的做法是使用堆叠的LSTM 模型,但是相较于DAN(Deep Averaging Network)这一类层数较浅的模型,堆叠模型很容易遇到“退化”问题。
此时,无论是增加隐层层数还是叠加LSTM 数量都无法有效地提高预测的精确度,模型也趋于饱和。由此可见,模型的优化难度和堆叠的层数是正相关的。基于此,本文将构造一种基于残差网络和堆叠的LSTM 结合的神经网络预测给定文本的情感类别,将每个LSTM 层中引入残差连接块解决退化问题。
如图7 所示,n
个模型层的隐层状态h
和每一轮的输入向量x
相加,通过残差连接进行学习,隐层状态h
的更新公式如式(2)所示:图7 残差连接的Bi-LSTM单元Fig.7 Bi-LSTM units with residual connection
图8 堆叠残差的Bi-LSTMFig.8 Stacked residual Bi-LSTM
如图8 所示,该模型为一个8 层的堆叠残差Bi-LSTM 结构,每两个堆叠层后连接一个残差层。对于每个残差连接的矩阵加法无需学习参数,从而避免模型复杂度的增加。同时由于LSTM 是以结果偏置的模型,因此句尾单词相较于句首有更高的影响程度,然而这一点对于文本预测而言是不利因素,因为自然语言中,关键词的出现位置不具有固定规律。基于此,该模型使用平均池化层学习文本向量,从而使得每个单词对于预测结果具有同等程度的贡献。最后,使用Sigmoid 激活函数输出二分类的预测结果。
2.2 情感分类
市场上一些收费的自然语言处理(Natural Language Processing,NLP)功能集成平台虽然具备一定的泛化能力,也能处理多个互联网领域(餐饮、汽车)的情感极性分析工作,但是对于短文本的教育类产品评价的分类效果较差,本文将结合深度学习和机器学习类库、情感词典的方法构建基于情感词典和堆叠残差的Bi-LSTM 的情感分析模型。具体的构造思想是:根据预处理后的数据建设程度副词词典、否定词词典、机器人产品用户评论词典,SnowNLP 情感词典计算基本情绪分值,结合Bi-LSTM 模型,将Softmax 激活函数输出极性是0(消极)或1(积极)的概率,将概率转化为极性对应的得分,与基本得分共同计算得到最终的情感得分;
然后再通过标准化算法,输出为0~1 的数值,当数值大于0.5 时认为是积极情感,当数值小于0.5 时认为是消极情感,从而完成情感分类工作。
2.2.1 词典结构
1)程度副词词典。本文根据知网程度水平词构建程度副词词汇库,并根据极值(权重2)、高值(权重1.75)、中值(权重1.5)和低值(权重1.25)分别赋予权重,计算情感得分,以上权重皆基于程度副词词典构造一般经验赋值。
2)否定词词典。本文收集了80 个负面词汇作为负词词典的组成部分,权重设为-1。当否定词在句子中出现的次数为奇数时,表示否定意义;
当一个否定词在句子中出现的次数是偶数时,表示肯定意义。
3)教育机器人情感词典。本文构造的评论情感词典充分考虑了当代电商平台用户在各种电子商务平台和论坛上的公众言论和用户习惯,并结合了互联网上的各种流行词汇,这使得情感词典具有及时性和全面性。本文在台湾大学NTUSD 简体中文情感词典的基础上根据5 个分类标准和332个对应于学习、影视、交互、用户体验和价格方面的常见情感词,通过删除多余情感词、增加适用情感词构造了教育机器人评论情感词典(见表1)。
表1 教育机器人补充情感词典Tab 1 Educational robot supplementary sentiment lexicon
2.2.2 情感得分计算
基于情感辞典的情感得分计算:当每次要分析的单词与机器人评论词典中的积极情感单词匹配时得分+1 分;
当与机器人评论情感词典中的负面情感词汇匹配时-1 分。从语句的第一个单词开始遍历,如果单词前面存在一个程度副词,则用程度副词权重乘以单词分数。如果在程度副词之前仍然有否定词,则将否定词的权重、程度副词的权重和词的分数相乘。遍历整个评论直到没有情感词出现,累加每个部分的分数得到机器人评论情感词典计算的总分。基于深度学习的情感得分计算:Bi-LSTM 是一种深度学习模型,用于预测文本极性值的概率。
p
,1-p
得到相反结果的概率值。Bi-LSTM 可以通过学习大量的文本特征来反映句子中单词和单词之间的关系,因此,通过判断一个句子是积极的还是消极的概率,可以从侧面反映出句意是积极(消极)的程度,这种抽象意义上的度量可以量化为情感得分。在本文中,从激活函数输出的概率值被转换为情感得分:以判断一处句意为积极的语意为例,当输出概率在[0.8,1]时,情感得分+2 分;当输出概率在[0.5,0.8)时,情感得分+1 分;
当输出概率在[0.2,0.5)时,情感得分-1分;
当输出概率在[0,0.2)时,情感得分-2 分。
在计算出情感辞典和Bi-LSTM 对文本的得分计算之后,再使用SnowNLP 进行得分计算。SnowNLP 情感得分的计算方法是将句子的情感程度转化为[0,1]的情感得分。在得到基于教育机器人评论情感词典、SnowNLP 和Bi-LSTM 的情感得分后,可以计算总分并将其标准化到[0,1]。以评论“东西然贵,但非常智能,物流神速,视频无比清晰”为例,从机器人评论情感词汇中可以看出,“贵”是负面情感词,“智能”“神速”“清晰”是正面情感词,“非常”“无比”是极端程度副词,基于机器人评论情感词汇的得到分数S1(+4);
分析Bi-LSTM输出的结果为0.73,属于范围(0.5,0.8],因此得分S2(+1);
基于SnowNLP 计算的整句情感得分为S3(+0.89)。最后,将总分标准化为[0,1]上的概率值,完成一次情感评分,并根据评分判定评论的情感极性(得分大于或等于0.5 判定为积极,得分小于0.5 判定为消极)。
根据图9 示例语句,经过本文构造的补充机器人情感词典后根据分值权重计算出了初步得分4 分,经过堆叠残差的Bi-LSTM 模型后获得情感得分1 分,经过SnowNLP 后获得0.89 分的情感加分,最终得分5.89 分,经过标准化后得到0.83 分,根据判断规则该语句情感倾向为积极。
图9 情感得分计算Fig.9 Sentiment score calculation
在这个过程中,三个部分的情感得分计算是可以同步进行的,因为它们彼此并不需要其他部分的得分或者结算数据作为自身计算时的参数,所以并不强调先后顺序上的差别。
在本文实验环境下,对于该情感得分计算模型而言,在情感倾向极为强烈时情感词典的得分占比较大,而在情感倾向不太强烈时深度学习模型的得分占比较大。而总分计算和标准化的过程必须置于情感得分计算模型中的三个计算步骤之后。
3.1 实验数据集
在实验阶段,本文使用经过清洗的数据集中48 000 条评论作为训练集在数据预处理后进行模型训练,训练的模型包括两种分类模式(机器学习和深度学习),其中机器学习分类模式分为两种特征提取方法(基于单词的特征提取方法和基于双词的特征提取方法),共7 种分类算法;
深度学习包括6种既有分类算法以及本文构建的基于堆叠残差的Bi-LSTM和情感词典的分类模型。在训练集结束训练后,对于训练好的分类模型再使用带有积极的标签和消极的标签的12 000 条评论作为测试集,用以测试不同的分类算法在各个二级分类下的准确率,最后,将各个二级分类目录下的分类准确率累加求均值,得到一类分类目录下的分类准确率,选择分类准确率最高的方案。
在将该套方案存为备选之后,后续过程中如果更新、拓展数据集(该模型分类的准确率依赖于数据集的状态,过时的数据集学习出的分类模型将损失很多准确率),会产生新的分类模型,分类准确率可能也会因此而改变,因此需要适时更新分类方案。
其中,在与其他机器学习和深度学习模型进行分类性能对比时,本文选取了机器学机器学习模型算法包括伯努利朴素贝叶斯(BernouliNB)分类器、多项式朴素贝叶斯(MultinomialNB)分类器、线性回归(Linear Regression,LR)、支持向量机(Support Vector Machine,SVM)、线性支持向量机(Linear SVM,LinearSVM)、核支持向量机(Nuclear SVM,NuSVM)。测试的分类维度分为500、1 000、1 500、2 000、2 500 和3 000;
深度学习模型包括LSTM、深层循环神经网络(Deep Recurrent Neural Network,DRNN),双向循环神经网络(Bi-directional Recurrent Neural Network,BiRNN),RNN,BERT(Bidirectional Encoder Representation from Transformers),Elmo(Embeddings from Language models)。以上模型均为机器学习、深度学习领域进行NLP 尤其文本分类任务较为常用的模型。除此以上模型外,也可以使用其他的分类模型进行对比。
3.2 实验准备
根据上述构建的影响因素规则和情绪评分系统,得到教育机器人每条评论的情感得分,再结合各影响因素的整体情感评分和情感极性,计算各二级、一级分类下评论的情感得分均值,判定不同二级、一级分类整体的情感极性。如表2所示,在一级因素中,“交互”的情感极性最倾向于负面,而对应的二级因素中大部分的品牌在“语音”“对话”“聊天”中得到的分数较低,低于0.5 的得分也对应了判定为“消极”的预测结果,而“影视”对应的评论中积极情感占据主导。从表2中可以得到以下推论:智能教育机器人在当前阶段更多地承担起一个影音、娱乐、学习、陪伴性质的工具,而在交互方面很难达到较高层次的“智能”。因此,一些AI 机器人和传统的MP4 等影音播放器的边界较为模糊,这一方面受限于现有人工智能技术的应用能力,一方面也和产品的价位有关。然而,虽然多数产品在“交互”分类下的“语音”“对话”“聊天”等二级分类的表现不佳,但是普遍在“陪伴”分类中获得了较高的分数,这表明对于幼儿、儿童来说,即便是提供了传统的影音娱乐功能的机器仍然能一定程度上满足用户的心理需求。
表2 各个维度情感得分及极性判别Tab 2 Sentiment score of each dimension and polarity discrimination
在搭配了一些网络教育资源和较为成熟的教育系统后,很多AI 机器人也能满足低年级学生的学习需求。对于一些价格较高、搭配了较强的人工智能技术的早教机器人,在“性价比”一项上得分较低,这从侧面反映了许多用户在对于该类高端产品时仍然保持观望态度。在获得了构建的模型的分类情况后,可以将预测结果与人工标注的真实值从不同维度做误差分析,本文用精确率、召回率、准确率和F1 值来综合衡量不同算法的性能表现。
3.3 结果与分析
对比分析环节将详细对比本文模型和其他模型在训练集上的准确表现。为对应1.2.2 节中的二级目录,分为一级因素和二级因素分别测试每个目录下的分类准确率情况。训练集情况和训练后基于本文构建的复合文本分析模型在验证集上的准确率结果以及所属关键词的评论数目情况如表3 所示。
表3 基于情感词典和堆叠残差的Bi-LSTM的模型准确率Tab 3 Accuracy of sentiment lexicon and stack residual Bi-LSTM based model
从表3 中简单计算可知:该模型对于积极感情的整体预测准确率约为0.883,对消极情感的整体预测准确率约为0.874,整体准确率约为0.879。对于积极情感的预测准确率高于消极情感,其中:在“价格”方面预测的整体准确率最高,约0.910;
在“交互”方面预测的整体准确率最低,约0.858。回顾数据集,这和用户在交互领域评论更趋向于使用反语、讽刺语、俗语、比喻等较难为机器理解的修辞手法和文法、语法有关,而在价格领域的评论较为直白,基本情感词典都能做到覆盖。
接下来使用机器学习的7 种分类算法分两种特征提取方法计算多个维度下的准确率,结果如图10 所示。对比以所有词为特征提取方法的机器学习领域的分类算法和以所有双词搭配为特征选取方法结果的机器学习领域的分类算法可以发现,虽然准确率随着分类维度的上升有所提高,但是普遍处于0.8 的分类准确率之下,其中:BernoulliNB 算法在所有维度始终低于0.8;
NuSVM 算法的表现最好,整体的情感分类准确率维持在0.836 和0.840。
图10 2种特征方法下提取的分类精度Fig.10 Classification accuracy extracted by two feature methods
接下来,使用几类深度学习模型在训练集上进行训练,并通过验证集计算分类算法的精确率、召回率、准确率和F1分数。为方便对比,将本文模型和其他深度学习模型并列。
观察图11,本文模型在四项标准上均获得最高值,其次BERT 在各项分类指标上的数据表现最好,准确率达到0.859,LSTM 的整体准确率约为0.834。说明基于情感词典和堆叠残差的Bi-LSTM 模型在预测结果为积极情感的样本空间中的成功率较高;
而RNN 的整体表现较差,这可能是因为RNN 存在梯度消失和梯度爆炸问题。虽然基于本文模型取得最高的准确率,但是在“交互”领域的分析效果仍不够理想。经分析推测原因如下:1)在该领域下存在较多的学术专业词汇,它们应该比普通词汇享有更高的情感权重;
2)一些专业术语词汇由较长的英文单词或者英文和中文单词的组合构成,这些词组可能被正则表达式和停词表过滤掉了词组中的一部分,导致分词不完整、语义破碎的情况,从而影响了最终的准确率。纵观所有分类算法,对于正标签的分类效果普遍稍高于负标签、精确率普遍稍高于召回率,这说明负面情感的评论对情感词典的覆盖率以及模型的分析能力有着更高的要求,这可能是因为负面评论中有着更多的讽刺语、反语和借助特殊形式的表达。
图11 深度学习模型分类结果Fig.11 Classification results of deep learning models
本文模型相较于其他机器学习、深度学习模型分类性能评估更好的原因主要在于克服了分类问题在两方面的不足:1)对特定领域的专业词汇的解读能力的不足。通过定性分析,结合二级分类目录的设置,补充了AI 教育机器人领域情感词汇,从而提高了对于特定词汇的分类准确率。2)堆叠LSTM 时模型精度上限的不足。通过在堆叠的LSTM 中加入残差连接,有效避免了高层数模型存在的网络“退化”问题,从而提高了通过增加模型深度从而实现性能提升的上限。
本文虽然是针对于“AI 教育机器人”的评论建立的分析模型,但整套分析逻辑对于其他各类型评论类型的短文本情感分类工作都具有一定的重构意义,通过上文分析可以论证:将针对某个领域而编纂的情感词典和深度学习模型相结合,可以提高分析模型的准确率;
而针对某个领域的情感词典可以在一套标准化的情感词典上根据该领域的特定情况而调整词典的范围,添加对于分析工作有价值的词汇,减少对分析工作有误导的词汇。本文实验的限制主要在于:1)数据集仅限于国内电子商务平台,对海外用户的分析仍然稀缺;
2)Bi-LSTM 模型在处理带有多个负面单词的句子时表现不佳。增加注意机制将使模型的拟合度更高。此外,随着时代的发展,情感词典需要不断更新和修改,特别是对于像中文这类结构较为复杂的语言,建立词典的工作量相对庞大。
- 范文大全
- 说说大全
- 学习资料
- 语录
- 生肖
- 解梦
- 十二星座
-
主题党日活动交流发言8篇
主题党日活动交流发言8篇主题党日活动交流发言篇13月13日,东城区党史学习教育动员大会召开。市委
【活动总结】 日期:2022-12-23
-
2022年4月主题党日活动记录范文15篇
2022年4月主题党日活动记录范文15篇2022年4月主题党日活动记录范文篇1一个崇尚阅读的民族,必然精神饱满、意气风发、活力四射。习近平总书记强调:“学习
【活动总结】 日期:2022-08-01
-
家乡赋|最美的家乡赋
家乡赋 孙传志 今安康市,白河双丰镇,吾之家乡也。三环沃土,山水环抱。其北依山,山系五岭,山
【调研报告】 日期:2020-04-01
-
少先队的光荣历史故事 队前教育-光辉历程
2017-2018学年队前教育1光辉历程一、劳动童子团1924——1927二、三十年代年的中国是一个
【法律文书】 日期:2020-06-23
-
【人教版1-6年级数学上册知识点精编】1-6年级数学人教版教材
人教版二年级数学上册知识点汇总第一单元长度单位一、米和厘米1、测量物体的长度时,要用统一的标准去测量
【调研报告】 日期:2020-11-08
-
党支部1-12月全年主题党日活动计划表
2022年党支部主题党日活动计划表序号活动时间活动方式活动内容12022年1月专题学习研讨集中观看2022年新年贺词,积极开展学习研讨交流。组织生活会组织党员认真对照党章...
【活动总结】 日期:2022-10-14
-
2022年2月份主题党日活动记录5篇
2022年2月份主题党日活动记录5篇2022年2月份主题党日活动记录篇1尊敬的党组织:在今年的开学初,本人积极参加教研室组织的教研活动,在学校教研员的指
【活动总结】 日期:2022-08-12
-
2023年平安校园建设方案13篇
平安校园建设方案“平安校园”创建工作,我们幼儿园全体教职员工一直把它当作头等大事来抓。领导高度重视,以“平安校园”创建活动为抓手,建立和规范校园安全工作机制
【规章制度】 日期:2023-11-02
-
医院最佳主题党日活动11篇
医院最佳主题党日活动11篇医院最佳主题党日活动篇1 医院最佳主题党日活动篇2为隆重纪念中国共产党成立100周年,进一步巩固党的群众路线教育实践活动成果,切实
【活动总结】 日期:2022-10-29
-
主题党日活动记录202210篇
主题党日活动记录202210篇主题党日活动记录2022篇12021年是中国共产党成立100周年,为广泛开展爱国主义宣传教育,铭记党的历史,讴歌党的光辉历程,
【活动总结】 日期:2022-08-02
-
正式的晚宴邀请函 公司晚宴邀请函
尊敬的先生 女士: 我公司谨定于xxxx年xx月xx日xx:xx在xxxx店隆重举行xx市xx届xxxx晚宴(宴会地址:xx区xx路xxxx) 敬请届时光临!xxxxxx集团股份有限公司xxxx有限公司敬邀xxxx年xx月xx日
【简历资料】 日期:2019-08-03
-
一年级新学期目标简短_一年级学生新学期打算
新学期到了,我是一年级下册的小学生了。 上课的时候,我要认真学习,不做小动作,认真听讲。我要认真学习,天天向上,努力学习,耳朵要听老师讲课,眼睛要瞪得大大的看老...
【简历资料】 日期:2019-10-26
-
[信访复查复核制度作用探讨]信访复查复核有用吗
作为我国特有的一项制度,信访制度的出现并长期存在不是偶然的,虽然一些法学专家认为信访制度具有“人治”
【职场指南】 日期:2020-02-16
-
[党员干部2019年主题教育个人问题检视清单及整改措施2篇] 党员干部
2019年主题教育问题检视清单及整改措施根据主题教育领导小组办公室《关于认真做好主题教育检视问题整改
【求职简历】 日期:2019-11-08
-
网络维护工作内容_(精华)国家开放大学电大专科《网络系统管理与维护》形考任务1答案
国家开放大学电大专科《网络系统管理与维护》形考任务1答案形考任务1理解上网行为管理软件的功能【实训目
【职场指南】 日期:2020-07-17
-
党委会与局长办公会的区别_局长办公会制度
为进一步加强xxx局工作的规范化、制度化建设,提高行政效能,规范议事程序,特制定本制度。一、会议形式1、局长办公会议由局长、副局长参加。由局长召集和主持。根据工作需要...
【求职简历】 日期:2019-07-30
-
学生会组织部部长竞选稿5篇
学生会组织部部长竞选稿以“三制”为统领推进农村党的建设中共**市委组织部近年来,**市认真落实中央、省和徐州市委的部署,积极适应发展要求,从加强领导体制、运
【求职简历】 日期:2023-11-06
-
如何凝心聚力谋发展【坚定信心谋发展凝心聚力促跨越】
当前,清河正处于在苏北实现赶超跨越基础上全面腾飞的战略机遇期,处于在全市率先实现全面小康基础上率先实
【简历资料】 日期:2020-03-17
-
《铁拳砸碎“黑警伞”》警示教育片观后感
影片深刻剖析了广西北海市公安局海西派出所原所长张枭杰蜕变堕落的轨迹。观看警示教育片后,做为一名党员教
【简历资料】 日期:2020-08-17
-
系领导班子行为准则_必须以什么为行为准则
为了更好地完成本系的各项工作,充分发挥系领导班子的模范带头作用,特制定本行为准则如下:一、要勤政为民,真抓实干,坚持科学态度和求实的精神,兢兢业业地作好本职工作。...
【求职简历】 日期:2019-08-30
-
紫外光固化桐油基水性聚氨酯木器涂料的制备
刘莉,单浩然,贾晓珂,段世杰,高宇杰,徐晨宇,韦双颖(东北林业大学材料科学与工程学院,哈尔滨1500
【其他范文】 日期:2023-01-14
-
党史学习教育会后研讨发言9篇
党史学习教育会后研讨发言9篇党史学习教育会后研讨发言篇1若是一个人对于某一种技艺没有知识,他对于
【其他范文】 日期:2022-12-10
-
2022年公司贯彻落实党员教育培训工作规划情况的报告范文
公司2021贯彻落实党员教育培训工作规划情况的报告范文根据开展评估工作的通知要求,现将自查评估情况报告如下:一、基本情况近年来,我们按照《2019-2023年全国党员教育培训工...
【其他范文】 日期:2022-07-29
-
2022年学校领导在新春团拜会上致辞讲话
金猪辞岁,祥鼠报福。瑞雪兆丰年,红梅迎新春。在2020年新春佳节来临之际,我谨代表学校,向辛勤工作在学校各个岗位上的全体教职员工、向离退休老同志、向全体同学致以节日的...
【其他范文】 日期:2022-10-08
-
混菌矿化增强再生粗骨料的物理力学性能
张家广,陈景琦,孟庆玲,许顺顺,刘元珍(太原理工大学土木工程学院,山西太原030024)再生混凝土粗
【其他范文】 日期:2023-01-22
-
[2020金融专业毕业实习报告5篇]
2020金融专业毕业实习报告5篇导语实习能拓展大学生的综合素质,培养适应型人才。实习是大学生拓展自身
【礼仪】 日期:2020-10-13
-
2023年县政协主席在派驻民主监督小组工作会议上讲话
同志们:近年来,中央就加强和改进人民政协民主监督工作作出了系列部署,省市县委为确保中央部署落地落实,相应出台了一系列行之有效的举措。今天,我们在此召开县政协换届后...
【其他范文】 日期:2023-09-12
-
2022年县委领导年度党史学习教育专题民主生活会个人检视剖析材料(6008字)(全文完整)
县委领导2021年度党史学习教育专题民主生活会个人检视剖析材料(6008字)按照关于开好党史学习教育专题民主生活会的有关部署要求,围绕民主生活会主题,本人深入学习了***新时代...
【其他范文】 日期:2022-10-08
-
社区五年发展规划
为全面推进xx社区建设,充分发挥社区在发展经济、社区治理、稳定社会、服务群众中的重要作用,促进社区经济与社会的协调发展,结合我社区实际,经“四议两公开”程序,特制订2...
【其他范文】 日期:2022-08-25
-
幼儿园中秋节活动方案设计【完整版】
欧文于1816年创办了第一所幼儿学校。最初出现的幼儿教育机构多由一些慈善家、工业家举办,实质上不过是慈善性质的社会福利机构而已,那时的幼儿园叫“性格形成新学园”。下面...
【其他范文】 日期:2023-09-25
-
军转座谈会交流发言4篇
军转座谈会交流发言4篇军转座谈会交流发言篇1大家好,我叫贺丽,2015届选调生,来自康定市委组织部,现在省委编办跟班学习。今天,非常荣幸向大家汇报我的学习收
【发言稿】 日期:2022-10-27
-
12岁生日小寿星发言4篇
12岁生日小寿星发言4篇12岁生日小寿星发言篇1各位来宾、各位朋友:大家好!今天,我们欢聚在这里,共同庆祝**十二周岁生日。首先,我代表**的父母以
【发言稿】 日期:2022-07-31
-
廉政大会总结发言稿7篇
廉政大会总结发言稿7篇廉政大会总结发言稿篇1各位领导,同志们:根据会议安排,我就党风廉政建设工作做表态发言,不妥之处,请批评指正。一、提高认识,切实
【发言稿】 日期:2022-10-30
-
破冰提能大讨论个人发言4篇
破冰提能大讨论个人发言4篇破冰提能大讨论个人发言篇1党史学习教育开展以来,我坚持读原著、学原文、悟原理。今天,根据会议安排,现在我就“学史明理”主题谈几点个
【发言稿】 日期:2022-10-09
-
纪委书记工作表态发言4篇
纪委书记工作表态发言4篇纪委书记工作表态发言篇1在镇党委政府正确领导下,在全村干部和群众的共同努力下,紧紧围绕建设社会主义新农村工作为重点,尽职尽责,与时俱
【发言稿】 日期:2022-09-30
-
我最敬佩的人开头_我敬佩的一个人作文20篇2020年
我敬佩的一个人作文20篇 我敬佩的一个人作文一): 我身边有很多值得我们敬佩的人,但我最敬佩的一
【发言稿】 日期:2020-11-10
-
党员教育培训总结交流发言12篇
党员教育培训总结交流发言12篇党员教育培训总结交流发言篇1根据市委组织部《关于开展我市〈20XX
【发言稿】 日期:2022-12-19
-
[钻井队队长(副队长、指导员)岗位HSE应知应会试题(1863)]
钻井队队长(副队长、指导员)岗位HSE应知应会试题(判断题:771;单选题:626;多选题:466)
【贺词】 日期:2020-09-23
-
话剧《家》剧本 话剧剧本:爱的空间
找文章到更多原创-(http: www damishu cn)人物介绍:刘伟,男,32岁,某购物广
【演讲稿】 日期:2020-01-21
-
五言绝句大全500首古诗_五言绝句144首
五言绝句144首 五言绝句(一): 1《春夜喜雨》唐朝·杜甫 好雨知时节,当春乃发生。随风潜入
【祝福语】 日期:2021-03-13
-
学习周永开先进事迹心得体会3篇
学习周永开先进事迹心得体会【一】通过学习周永开老先生先进事迹后,结合自己工作思考,感慨万千。同样作为
【格言】 日期:2021-04-10
-
2023年中国行政区划调整方案(设想优秀3篇
中国行政区划调整方案(设想优秀民政部第二次行政区划研讨会会议内容一、缩省的意义与原则1.意义1)利于减少中间层次中国行政区划层级之多为世界之最,既使管理成本
【周公解梦】 日期:2024-02-20
-
XX老干局推进党建与业务深度融合发展工作情况调研报告:党建调研报告
XX老干局推进党建与业务深度融合 发展工作情况的调研报告 党建工作与业务工作融合发展始终是一个充满生
【成语大全】 日期:2020-08-28
-
中国共产党第三代中央领导集体的卓越贡献
中国共产党第三代中央领导集体的卓越贡献 --------------继往开来铸就辉煌 【摘要】改
【成语大全】 日期:2020-03-20
-
信息技术2.0能力点 [全国中小学教师信息技术应用能力提升工程试题题库及参考答案「精编」]
全国中小学教师信息技术应用能力提升工程试题题库及答案(复习资料)一、判断题题库(A为正确,B为错误)
【格言】 日期:2020-11-17
-
党建工作运行机制内容有哪些_构建基层党建工作运行机制探讨
党的基层组织是党在社会基层组织中的战斗堡垒,是党的全部工作和战斗力的基础。加强和改进县级以下各类党的
【经典阅读】 日期:2020-01-22
-
2023年和儿媳妇在一起幸福的句子3篇
和儿媳妇在一起幸福的句子1、假如人生不曾相遇,我还是那个我,偶尔做做梦,然后,开始日复一日的奔波,淹没在这喧嚣的城市里。我不会了解,这个世界还有这样的一个你
【格言】 日期:2023-11-10
-
集合推理_七,推理与集合
七推理与集合1 期中考试数学成绩出来了,三个好朋友分别考了88分,92分,95分。他们分别考了多少分
【名人名言】 日期:2020-12-18
-
电大现代教育原理_最新国家开放大学电大《现代教育原理》形考任务2试题及答案
最新国家开放大学电大《现代教育原理》形考任务2试题及答案形考任务二一、多项选择题(共17道试题,共3
【成语大全】 日期:2020-07-20
-
基层党务工作基本内容_党建基本工作有哪些
党建基本工作有哪些(一) 基层党建工作包括哪些内容 选择了大学生村官这条路,你就与农村基层党
【名人名言】 日期:2020-08-06
-
关于三农工作重要论述心得体会3篇
关于三农工作重要论述心得体会3篇关于三农工作重要论述心得体会篇1习近平总书记指出:“建设现代化国家离不开农业农村现代化,要继续巩固脱贫攻坚成果,扎实推进乡村
【学习心得体会】 日期:2022-10-29
-
【福生庄隧道坍塌处理方案】 福生庄隧道在哪里
(呼和浩特铁路局大包电气化改造工程指挥部,内蒙古呼和浩特010050)摘要:文章介绍了福生庄隧道
【学习心得体会】 日期:2020-03-05
-
五个一百工程阅读心得体会13篇
五个一百工程阅读心得体会13篇五个一百工程阅读心得体会篇1凡益之道,与时偕行。在全国网络安全和信
【学习心得体会】 日期:2022-12-07
-
城管系统警示教育心得体会9篇
城管系统警示教育心得体会9篇城管系统警示教育心得体会篇1各党支部要召开多种形式的庆七一座谈会,组织广大党员进行座谈,回顾党的光辉历程,畅谈党的丰功伟绩,
【学习心得体会】 日期:2022-10-09
-
发展对象培训主要内容10篇
发展对象培训主要内容10篇发展对象培训主要内容篇1怀着无比激动的心情,我有幸参加了__新区区委党校20__年第四期(区级机关)党员发展对象培训班。这次的学习
【培训心得体会】 日期:2022-09-24
-
凝聚三种力量发展全过程人民民主心得体会12篇
凝聚三种力量发展全过程人民民主心得体会12篇凝聚三种力量发展全过程人民民主心得体会篇1新民主主义革命是指在帝国主义和无产阶级革命时代,殖民地半殖民地国家中的
【学习心得体会】 日期:2022-08-31
-
2022年全国检察长会议心得7篇
2022年全国检察长会议心得7篇2022年全国检察长会议心得篇1眼睛是心灵上的窗户,我们通过眼睛才能看到世间万物,才能看到眼前这美好的一切。拥有一双明亮的眼
【学习心得体会】 日期:2022-10-31
-
在街道深化作风建设推动高质量发展走在前列动员会上讲话
在2023年街道深化作风建设推动高质量发展走在前列动员会上的讲话同志们:今天我们召开“街道深化作风建设推动高质量发展走在前列动员会”,这次会议是街道三季度召开的第一场...
【军训心得体会】 日期:2024-03-17
-
全面从严治党的心得体会800字7篇
全面从严治党的心得体会800字7篇全面从严治党的心得体会800字篇1中国特色社会主义是我们党领导
【学习心得体会】 日期:2022-12-14
-
矫正心得体会6篇
矫正心得体会6篇矫正心得体会篇1今天,是自己出监后第一次参加阳光中途之家组织的社区矫正方面的教育
【学习心得体会】 日期:2022-12-24
-
2024年主题教育民主生活会批评与自我批评意见(38条)(范文推荐)
2023年主题教育民主生活会六个方面个人检视、相互批评意见:1 理论学习系统性不强。学习习近平新时代中国特色社会主义思想不深不透,泛泛而学的时候多,深学细照的时候少,特...
【邓小平理论】 日期:2024-03-19
-
2024年交流发言:强化思想理论武装,增强奋进力量(完整)
习近平总书记指出:“一个民族要走在时代前列,就一刻不能没有理论思维,一刻不能没有思想指引。”党的十八大以来,伴随着新时代中国特色社会主义思想在实践中形成发展的历程...
【三个代表】 日期:2024-03-19
-
2024年度镇年度县乡人大代表述职评议活动总结
xx镇20xx年县乡人大代表述职评议活动总结为响应县级人大常委会关于开展县乡两级人大代表述职评议活动,进一步激发代表履职活力,加强代表与人民群众的联系,提高依法履职水平...
【马克思主义】 日期:2024-03-19
-
“千万工程”经验学习体会(研讨材料)
“千万工程”是总书记在浙江工作时亲自谋划、亲自部署、亲自推动的一项重大决策,也是习近平新时代中国特色社会主义思想在之江大地的生动实践。20年来,“千万工程”先后经历...
【三个代表】 日期:2024-03-19
-
2024年在市政协机关工作总结会议上讲话
同志们:刚才,XX同志对市政协机关20XX年工作进行了很好的总结,很精炼,很到位,可以感受到去年机关工作确实可圈可点。XX同志宣读了表彰决定,机关优秀人员代表、先进集体代...
【邓小平理论】 日期:2024-03-18
-
在全区防汛防涝动员暨河长制工作推进会上讲话提纲【完整版】
区长,各位领导,同志们:汛期已经来临,我区城区防涝工作面临强大考验,形势不容乐观。年初,区城区防涝排渍指挥部已经召开专题调度会,修订完善应急预案,建立网格化管理机...
【马克思主义】 日期:2024-03-18
-
2024年镇作风整治工作实施方案(完整文档)
XX镇作风整治工作实施方案为深入贯彻落实党的二十大精神及省市区委深化作风建设的最新要求,突出重点推进干部效能提升,坚持不懈推动作风整治工作纵深发展,根据《关于印发《2...
【毛泽东思想】 日期:2024-03-18
-
2024市优化法治化营商环境规范涉企行政执法实施方案【优秀范文】
xx市优化法治化营商环境规范涉企行政执法实施方案为持续优化法治化营商环境,激发市场主体活力和社会创造力,规范行政执法行为,创新行政执法方式,提升行政执法质效,着力解...
【毛泽东思想】 日期:2024-03-18
-
2024年度关于开展新一轮思想状况摸底排查工作通知(完整)
关于开展新一轮思想状况摸底排查工作的通知为深入贯彻落实关于各地开展干部职工思想状况大摸底大排查情况上的批示要求和改革教育第二次调度会议精神,有针对性做好队伍教育管...
【三个代表】 日期:2024-03-18
-
2024年公路养护中心主任典型事迹材料(完整文档)
“中心的工作就是心中的事业”——公路养护中心主任典型事迹材料**,男,1976年6月出生,1993年参加工作,2000年4月调入**区交通运输局工作,大学本科学历,中共党员,现任**...
【马克思主义】 日期:2024-03-17