买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京邮电大学
摘要:本公开提供一种语句中方面词对应的观点词抽取方法,包括,获取目标语句的句法结构和顺序结构,针对每一个所述目标语句构建一个包含所述句法结构信息及所述顺序结构信息的目标多路异构图,其中,所述目标多路异构图的节点对应为所述目标语句中的每个单词;获取给定的所述目标语句中的目标方面词;获取预先构建的马尔可夫决策过程模型;应用所述马尔可夫决策过程模型在所述目标多路异构图上进行探索,抽取所述目标语句中所述目标方面词所对应的目标观点词。本发明提供的方法,有效解决方面词及其对应的观点词距离较远时难以准确抽取观点词的问题,实现观点词的准确抽取。
主权项:1.一种语句中方面词对应的观点词抽取方法,包括:获取目标语句的句法结构信息和顺序结构信息,针对每一个所述目标语句构建一个包含所述句法结构信息及所述顺序结构信息的目标多路异构图,其中,所述目标多路异构图的每个节点对应为所述目标语句中的每个单词;获取给定的所述目标语句中的目标方面词;获取预先构建的马尔可夫决策过程模型;应用所述马尔可夫决策过程模型在所述目标多路异构图上进行探索,抽取所述目标语句中所述目标方面词所对应的目标观点词;其中,所述马尔可夫决策过程模型构建过程为:构建包括状态空间、动作空间、奖励策略、转移函数、价值函数、策略函数的马尔可夫决策过程初始模型;构建训练语句,利用所述训练语句中的每个单词构建训练多路异构图,获取所述训练语句中的训练方面词与训练观点词,分别标注所述训练方面词与所述训练观点词在所述训练语句中的位置,获得所述训练语句中每个单词的方面词标签、所述训练语句中每个单词的观点词标签、训练语句的方面标签序列及训练语句的观点标签序列;利用所述训练语句对所述马尔可夫决策过程初始模型进行训练,得到所述马尔可夫决策过程模型;其中,所述状态空间包含有各个时刻的状态,所述动作空间包含各个时刻的状态下可以执行的动作;其中,所述状态空间、所述动作空间、所述奖励策略、所述转移函数、所述价值函数、所述策略函数的表达为:状态空间:用表示所述状态空间,s表示所述状态,st表示t时刻的状态, 其中,表示到t时刻所走过的历史路径,表示目标语句或训练语句,w表示中的单词,表示目标多路异构图或训练多路异构图,为方面标签序列,ex为x时刻选择的边e,e∈ε,ε为包含顺序边及句法边的边集合,wφx为x时刻选择ex到达的单词,为给单词wφx预测的观点词标签;动作空间:用表示所述动作空间,a表示所述动作,所述为根据st得到的所有可能的动作集合,即: 其中,为单词集合,lo为观点词标签,为词语标识标签,wφt表示在t时刻所到达的单词;奖励策略:采用延迟奖励策略,由终止奖励来评判整条路径,所述终止奖励的评判要素包括探索奖励、准确奖励和效率奖励: 其中,为探索奖励,为准确奖励,为效率奖励,为终止奖励,no为训练语句中训练观点词的单词数量,为历史路径里命中的训练观点词的单词数量,nc为历史路径正确预测的观点词标签数量,nsyn和nseq为历史路径里句法边和顺序边的数量,β为平衡选择倾向性的超参;转移函数:用表示所述转移函数,即: 其中,动作at中包含的信息为选择边et+1到达wφt+1单词,并给wφt+1单词预测观点词标签价值函数:用Vθ表示所述价值函数,计算所述状态的价值,针对状态st,有:st=BiGRUst-1,ht;θgru; Vθst=MLPst;θv;其中Vθst表示状态st的价值,st为状态st的向量表达,st-1为状态st-1的向量表达,ht为从st-1转移到st所执行的动作at-1的向量表达,et为边et的向量表达,边et为历史动作at-1中所选择的边;wφt为wφt的词向量,wφt为动作at-1选择边et所到达的单词,为针对单词wφt预测的观点词标签的向量表达,为wφt的方面词标签的向量表达,为连接符号,θgru为双向循环神经网络的参数,θstep和θv为两个多层感知器的参数;策略函数:用πθ表示所述策略函数,用于计算动作的概率;对于任意动作其概率计算如下: 其中πθa|st为状态st下动作a的概率,ha为动作a的向量表达,ha′为动作a′的向量表达,e为边e的向量表达,lo为给单词w预测的观点词标签的向量表达,la为单词w的方面词标签的向量表达,w′是单词w经所述信息填充之后生成的新的词向量;θπ、θstop是两个多层感知器的参数;其中,对马尔可夫决策过程初始模型进行训练包括:在包含有所述训练多路异构图的信息的状态空间进行至少一次搜索,得到至少一条完整的路径,其中每条路径中每个所述状态利用蒙特卡洛树搜索进行动作决策;根据完整路径的数据,计算损失值 其中,ρ控制l2正则;根据所述损失值反向传播至所述马尔可夫决策过程初始模型中所有需学习参数,对所述需学习参数进行优化,完成对所述训练语句的一次训练,得到训练后的马尔可夫决策过程初始模型;利用所述训练语句对训练后的马尔可夫决策过程初始模型进行再次训练,直至达到预设条件,得到马尔可夫决策过程模型。
全文数据:
权利要求:
百度查询: 北京邮电大学 语句中方面词对应的观点词抽取方法及电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。