182-1095-8705
最新公告:NOTICE
8月1日起,国家知识产权局停征和调整部分专利收费,详情参阅资讯中心公告

资讯中心

当前位置:专利申请 > 资讯中心 >

情感分析模型申请专利,情感分析的3种常用方法:朴素贝叶斯、LSTM和VADER

专利代理 发布时间:2023-04-01 22:45:53 浏览:


今天,乐知网小编 给大家分享 情感分析模型申请专利,情感分析的3种常用方法:

朴素贝叶斯、LSTM和VADER

情感分析模型申请专利,一种文本情感分析方法


[0001]本发明涉及文本分析的技术领域,具体涉及一种文本情感分析方法。

[0002]细粒度情感分析(ABSA)是自然语言处理中的一项重要的任务,对于给定的(句子,属性词)对,旨在根据句子中和特定的属性词有关的上下文信息来判断对属性词的情感极性(如积极、中立、消极)。

随着互联网的和大数据的不断发展,可以从大量文本中自动提取有用信息的情感分析技术受到了不仅受到了众多学术界关注,也被广泛应用于日常的商业活动中,特别是在社交媒体,电子商务和社会舆情分析等领域。

[0003]在现有的细粒度情感分析过程中,最主要的目标是于从句子的上下文中准确找到能够表示用户对特定目标的情感信息的情感词。

但是,我们日常生活中使用的句子并不都是含有充分的情感信息,又或是情感词与目标词的位置相隔较远使得难以被捕捉,有些句子中甚至没有表达出明确的情感倾向,因此难以准确高效地表达句子的含义。

[0004]本发明的目的在于克服现有技术中的缺点与不足,提供一种文本情感分析方法,可以高效准确地分析出文本中句子的情感极性。

[0005]本发明的一个实施例提供一种文本情感分析方法,其特征在于,包括以下步骤:

获取待分析文本;所述待分析文本包括若干个句子;每个所述句子包括若干个单词;获取所述句子的句子初始化表示、所述句子中单词之间的余弦相似度、以及所述句子中单词之间的局部关联值;根据所述句子中单词之间的余弦相似度,得到句子的通用语义矩阵;根据所述句子中单词之间的局部关联值,得到句子的结构语义矩阵;将所述通用语义矩阵、结构语义矩阵、句子初始化表示输入至图卷积神经网络、交叉网络和激活函数,得到所述句子的通用语义句法表示和结构语义句法表示;对所述句子的结构语义隐藏表示和所述结构语义句法表示按照预设的第一权重占比进行计算,得到目标结构语义句法表示;对所述句子的通用语义隐藏表示和所述通用语义句法表示按照预设的第二权重占比进行计算,得到目标通用语义句法表示;对所述目标通用语义句法表示和所述目标结构语义句法表示进行拼接以及非属性词屏蔽处理,得到句子的属性词特征表示;获取所述句子的属性词特征表示中的各个单词的属性词特征表示,根据词嵌入表示和所述各属性词特征表示,计算句子中各个单词的注意力权重;根据所述词嵌入表示和各个所述单词的注意力权重得到句子的目标表示,将所述句子的目标表示输入到softmax逻辑回归模型,得到句子情感极性。

[0006]相对于现有技术,本发明的文本情感分析方法,将所述通用语义矩阵、结构语义矩阵、句子初始化表示输入至图卷积神经网络、交叉网络和激活函数,得到所述句子的通用语义句法表示和结构语义句法表示,再分别结合句子的通用语义隐藏表示和结构语义隐藏表示计算出目标结构语义句法表示和目标通用语义句法表示,对所述目标通用语义句法表示和所述目标结构语义句法表示进行拼接以及非属性词屏蔽处理,得到句子中的各个单词的属性词特征表示,然后根据所述词嵌入表示和所述各属性词特征表示,计算句子中各个单词的注意力权重,并基于所述词嵌入表示和各个所述单词的注意力权重输出句子情感极性。

将通用语义和结构语义整合到句法中,丰富了所述句子的信息,从而实现高效且准确地分析出文本中句子的情感极性的效果。

[0007]进一步,所述将所述通用语义矩阵、结构语义矩阵、句子初始化表示输入至图卷积神经网络、交叉网络和激活函数,得到所述句子的通用语义句法表示和结构语义句法表示,包括:

将所述通用语义矩阵和所述句子初始化表示输入到双通道图卷积神经网络,得到句子的通用语义隐藏表示,将所述结构语义矩阵和所述句子初始化表示输入到双通道图卷积神经网络,得到句子的结构语义隐藏表示;将所述句子初始化表示、所述句子的通用语义隐藏表示和所述句子的结构语义隐藏表示拼接并输入到预设的交叉网络计算公式,得到通用语义句子表示和结构语义句子表示;获取所述句子的句法依存矩阵;将所述通用语义句子表示、所述结构语义句子表示,分别与所述句法依存矩阵输入到激活函数,得到所述通用语义句法表示和所述结构语义句法表示。

[0008]将所述通用语义矩阵、结构语义矩阵、句子初始化表示通过图卷积神经网络、交叉网络,使句子的通用语义和结构语义实现信息交互,并通过激活函数的处理获得信息交互后的通用语义和结构语义的隐藏表示,从而丰富句子在通用语义和结构语义上的信息。

[0009]为了能更清晰的理解本发明,以下将结合附图说明阐述本发明的具体实施方式。

[0010]图1为本发明一个实施例的文本情感分析方法的流程图。

[0011]图2为本发明一个实施例的文本情感分析方法的步骤S2的流程图。

[0012]图3为本发明一个实施例的文本情感分析方法的步骤S4的流程图。

[0013]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。

[0014]应当明确,所描述的实施例仅仅是本申请实施例一部分实施例,而不是全部的实施例。

基于本申请实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请实施例保护的范围。

[0015]下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。

在本申请的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。

对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。

在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。

在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。

[0016]此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。

“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A?和/或?B,可以表示:

单独存在?A,同时存在A和B,单独存在B这三种情况。

字符“/”一般表示前后关联对象是一种“或”的关系。

[0017]请参阅图1,其是本发明一个实施例的文本情感分析方法的流程图,所述文本情感分析方法包括以下步骤:

S1:

获取待分析文本;所述待分析文本包括若干个句子;每个所述句子包括若干个单词。

[0018]其中,所述待分析文本的文字类型不限,优选地,所述待分析文本的文字类型为英文。



情感分析模型申请专利,情感分析的3种常用方法:

朴素贝叶斯、LSTM和VADER


作者|Kevin C Lee编译|VK来源|Towards Data Science原文链接:

https:

//towardsdatascience。com/sentiment-analysis-comparing-3-common-approaches-naive-bayes-lstm-and-vader-ab561f834f89注意:

这个帖子的代码可以在这里找到:

https:

//github。com/kevinclee26/sentiment_analysis_classification 情感分析,或观点挖掘,是自然语言处理(NLP)的一个子领域,旨在从文本中提取态度、评价、观点和情感。

受客户的互动迁移到数字格式(如电子邮件、聊天室、社交媒体帖子、评论和调查)的启发,情感分析已成为分析组织必须执行的一个组成部分,以了解其在市场中的定位。

明确地说,情感分析不是一个新颖的概念。

事实上,它一直是CRM(客户关系管理)和市场研究的重要组成部分——公司依靠更好地了解客户来发展和创新。

最近的增长主要是由于客户交互记录的可用性/可访问性以及处理这些数据的计算能力的提高。

这一进步确实让消费者受益匪浅。

各组织比以往任何时候都更愿意听取选民的意见以改进。

情感分析有很多方法。

在本文中,我们将探讨三种方法:

1)朴素贝叶斯 2)深度学习LSTM, 3)预训练的基于规则的VADER模型。

我们将重点比较简单的开箱即用模型,并认识到每种方法都可以调整以提高性能。

我们的目的不是详细介绍每种方法的工作原理,而是对它们如何进行比较进行概念性研究,以帮助确定何时应该选择一种方法而不是另一种方法。

情感分析的背景 情感分析的目标范围从积极到消极。

与其他NLP工作一样,它通常被认为是一个分类问题,尽管当精度很重要时,它可以被视为一个回归问题。

情感分析过去是由大量劳动力阅读和手动评估文本来完成的。

这种方法成本高昂,而且容易出现人为错误。

为了使这一过程自动化,公司寻求先进的分析方法来解决这一问题。

情感分析的挑战在于人们表达和解释情绪的极性和强度不同。

此外,单词和句子可以根据上下文有多种含义(称为多义)。

虽然其中一些问题可以缓解,但与任何分析任务一样,速度和性能之间几乎总是存在权衡。

我们回顾了三种通用方法,每种方法各有优缺点:

介绍数据集

情感分析模型申请专利,浅谈“建模类”技术方案的专利撰写技巧


转载 来源:

徐师付的知产主义 原文链接:

浅谈“建模类”技术方案的专利撰写技巧 - 智匠人 人工智能、神经网络等不仅是近年来科技领域的热门词汇,相关专利申请的数量也有着显著增长。

对于此类技术方案,其中往往涉及到建立模型这一步骤,所以本文暂且将此类技术方案称为“建模类”技术方案。

无论是在指导培训工作中,还是在案例检索学习时,笔者发现,部分专利代理师在处理“建模类”技术方案时,存在一些普遍性的问题。

笔者希望通过本文与大家分享自己的观点及建议。

对于发明人,在撰写“建模类”技术方案的技术交底书时,通常的思路如下:

获取训练数据→基于训练数据对初始模型进行训练以获得最终模型→采用最终模型进行预测或分类等处理。

对于部分代理师,特别是不太熟悉神经网络相关专业知识的代理师,很有可能就按照这个思路进行独立权利要求的撰写了,然后在各从属权利要求中再进行进一步展开与限定。

但是,我们不妨跳出上述思路,思考这样一个问题:

在每次应用模型时,都要建一次模吗? 多数情况下,答案都是否定的。

站在发明人的角度,为了阐述清楚其技术方案,其当然会把如何建立模型以及如何使用模型的过程一次写清楚,正如上述思路所示。

但是,作为代理师,就不应仅停留在这一层次,而应从专利的角度进行更高维度的思考,思考一下对于此类技术方案,如何保护,或者说如何撰写权利要求才更合理。

将发明人的思路再次提炼一下,可以看到,其主要包括两个过程,也就是建立模型与使用模型,并且,在多数情况下,模型只需要建立一次,而使用则可以是成千上万次。

例如,某公司开发出一套高效的人脸识别系统,在不考虑更新等因素的情况下,该同一套系统可以同时应用于多个用户终端,其中,某公司完成的主要工作可以理解为建立模型的过程,而不同用户终端的执行动作则可以理解为使用模型的过程,用户终端在使用时并不需要建模。

通过这个例子可以看到,对于“建模类”技术方案,相对合理的权利要求撰写方式应该是把建立模型的过程与使用模型的过程分开。

两条相应的方法类权利要求可以示例为:

1。一种建立XX模型的方法,其特征在于,包括:

获取训练图片,其中,每幅所述训练图片对应一个标记分数;以所述训练图片作为样本,并以对应的所述标记分数作为标签,对初始神经网络进行训练,以获得XX模型。

…… 6。一种从视频中进行人像识别的方法,其特征在于,包括:

从视频文件中提取包括人像的图片;将所述图片输入根据权利要求1至5任一项所述的建立XX模型的方法所获得的XX模型中,获得……。

需要说明的是,为了便于描述,上述示例比较简单。

但是,在实际处理过程中,对于如何获取训练样本,如何确定标签,初始神经网络的具体结构,使用模型前对数据的预处理以及对使用模型所获得数据的进一步处理等,都有可能是创新点,无论在独立权利要求,还是在从属权利要求中都是需要根据实际情况进一步细化的。



情感分析模型申请专利,情感分析的3种常用方法:

朴素贝叶斯、LSTM和VADER 的介绍就聊到这里。

更多关于 情感分析模型申请专利,情感分析的3种常用方法:

朴素贝叶斯、LSTM和VADER 的资讯,可以咨询 乐知网。


关键词: 申请专利 如何申请专利