北京大学仲为国获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京大学申请的专利文本分析的方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119441485B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411673153.2,技术领域涉及:G06F16/35;该发明授权文本分析的方法及系统是由仲为国设计研发完成,并于2024-11-21向国家知识产权局提交的专利申请。
本文本分析的方法及系统在说明书摘要公布了:本发明实施例公开了一种文本分析的方法及系统,包括:获取一定数量的政策文本,对政策文本进行预处理,得到预处理数据;将预处理数据输入自适应模型进行训练,以得到最优自适应模型;通过输入层接收预处理数据,通过多层次划分层对预处理数据进行划分处理,得到划分数据,通过嵌入表示层将划分数据映射到低维向量空间以获取划分数据的嵌入向量,通过主题建模层对嵌入向量进行主题分类,通过输出层对主题分类后的嵌入向量进行结构化解读输出政策文本对应政策关系的结构化数据;将待分析政策文本输入至最优自适应模型,得到待分析政策文本对应政策关系的结构化数据。解决现有技术中无法对产业政策深入、全面和精准分析的问题。
本发明授权文本分析的方法及系统在权利要求书中公布了:1.一种文本分析的方法,其特征在于,所述文本分析的方法具体包括: 获取一定数量的政策文本,对所述政策文本进行预处理,得到预处理数据; 构建自适应模型,将所述预处理数据输入所述自适应模型进行训练,以得到最优自适应模型,其中,所述自适应模型包括依次相连的输入层、多层次划分层、嵌入表示层、主题建模层和输出层; 在构建模型的过程中,引入了多层次嵌入聚类模型,基于文本的高阶语义亲和度,独立地将文本词条投射到20个政策标签向量空间;对于编码产生分歧的焦点词项,进入自适应迭代标签模型进行嵌套式迭代; 通过输入层接收所述预处理数据,通过多层次划分层对所述预处理数据进行划分处理,得到划分数据,通过嵌入表示层将所述划分数据映射到低维向量空间以获取所述划分数据的嵌入向量,通过主题建模层对嵌入向量进行主题分类,通过输出层对主题分类后的嵌入向量进行结构化解读输出政策文本对应政策关系的结构化数据; 所述通过多层次划分层对所述预处理数据进行划分处理,得到划分数据,包括: 基于政策维度和政策标签对所述预处理数据进行划分处理; 其中,政策维度包括经济、政治、社会福利、技术创新和环境; 所述经济维度下设有的政策标签包括业绩导向、经济机构、经济发展、吸引FDI、企业发展、产业规划、政策工具、协调,所述政治维度下设有的政策标签包括政治机构、政府效率、治安与社会稳定、统一战线和法律发展,所述社会福利维度下设有的政策标签包括就业、民生和医疗、城市化、农业、文化教育旅游,所述技术创新维度下设有的政策标签包括技术和创新,所述环境维度下设有的政策标签包括环境; 所述通过嵌入表示层将所述划分数据映射到低维向量空间以获取所述划分数据的嵌入向量,包括: 根据划分数据中单词或词组的语义关系和出现频率,为每个划分数据生成相应的嵌入向量; 所述通过主题建模层对嵌入向量进行主题分类,包括: 基于嵌入向量的分布特征和语义相似性,将每个嵌入向量分配到相应的主题类别中; 将待分析政策文本输入至最优自适应模型,得到所述待分析政策文本对应政策关系的结构化数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学,其通讯地址为:100091 北京市海淀区颐和园路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励