买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:一种专利文本新颖性创造性预测方法及装置,涉及自然语言处理中的文本匹配技术,目的是为了对专利申请文件的新颖性和或创造性进行初步的预测判断。所述方法包括:利用主题模型对待预测专利文本与授权专利文本进行处理,得到各关键词的主题分布;计算各专利文本的各关键词的主题分布平均值;利用BERT模型对待预测专利文本与授权专利文本进行处理;将各专利文本的各关键词的主题分布的平均值和BERT模型的输出进行拼接,然后输入至全连接层;利用激活函数对全连接层的输出进行计算,得到待预测专利文本具备新颖性创造性的概率。所述装置包括主题模块、主题分布平均值计算模块、BERT模块、拼接模块和概率计算模块。
主权项:1.一种专利文本新颖性和创造性预测方法,其特征在于,包括:利用LDA主题模型对待预测专利文本与授权专利文本进行处理,得到所述待预测专利文本的各关键词的主题分布和所述授权专利文本的各关键词的主题分布;计算所述待预测专利文本的各关键词的主题分布的平均值和所述授权专利文本的各关键词的主题分布的平均值;利用BERT模型对所述待预测专利文本与所述授权专利文本进行处理;将所述待预测专利文本的各关键词的主题分布的平均值、所述授权专利文本的各关键词的主题分布的平均值、以及所述BERT模型的输出进行拼接,得到拼接矩阵,并利用全连接层对所述拼接矩阵进行处理;利用激活函数对所述全连接层的输出进行计算,得到所述待预测专利文本具备新颖性创造性的概率;在利用BERT模型对所述待预测专利文本与所述授权专利文本进行处理之前,所述方法还包括:提取所述待预测专利文本和所述授权专利文本的关键词,形成所述待预测专利文本的关键词序列和所述授权专利文本的关键词序列;在所述待预测专利文本的关键词序列前面增加[CLS],在所述待预测专利文本的关键词序列和所述授权专利文本的关键词序列之间增加[SEP]分隔符,然后输入至所述BERT模型;以一个授权专利文本为例,所述待预测专利文本的N个关键词的主题分布记为ωi,i=1,2,…,N,所述授权专利文本的M个关键词的主题分布记为ω′j,j=1,2,…,M,对于每个专利文本,把所有的关键词主题分布取平均得到一个固定长度的表示: 其中,Rt为t维实数空间,t为关键词W的向量维度,R为实数。
全文数据:
权利要求:
百度查询: 哈尔滨工业大学 黑龙江阳光惠远信息技术有限公司 一种专利文本新颖性和创造性预测方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。