北京化工大学李大字获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京化工大学申请的专利一种融合辅助标注与依存分析的化工过程知识抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120407706B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510515130.7,技术领域涉及:G06F16/31;该发明授权一种融合辅助标注与依存分析的化工过程知识抽取方法是由李大字;纪天浩;刘持强设计研发完成,并于2025-04-23向国家知识产权局提交的专利申请。
本一种融合辅助标注与依存分析的化工过程知识抽取方法在说明书摘要公布了:本发明公开了一种融合辅助标注与依存分析的化工过程知识抽取方法,属于自然语言处理技术领域;所述方法包括:采集化工过程的生产资料和运维资料作为原始语料;对原始语料中部分数据进行处理和标注,包括数据集分割、关键词获取、关键词标注、数据集标注和数据集格式转换得到带标签的数据集;带标签的数据集与原始数据输入知识抽取模型中进行初步的知识抽取,包括BiLSTM‑CRF模型训练,利用训练好的模型进行命名实体识别,利用依存句法分析方法进行关系抽取;对初始结果进行融合,完成知识抽取任务;抽取到的知识以三元组的格式存储在图数据库中,便于工作人员查询和学习,以减少进行运维工作对专家的依赖,提高运维效率,降低人员培训成本。
本发明授权一种融合辅助标注与依存分析的化工过程知识抽取方法在权利要求书中公布了:1.一种融合辅助标注与依存分析的化工过程知识抽取方法,其特征在于,包括如下步骤: S1,原始语料采集;采集化工生产过程所涉及的生产资料和运维资料,作为原始语料;所述原始语料为纯文本数据; S2,数据预处理和数据辅助标注;所述数据预处理得到两部分内容,第一部分是分割后的数据集,第二部分是待标注的词汇列表;通过对原始语料中的每个句子进行分词得到的词汇列表,去停用词和去重处理得到新的词汇列表,对所述得到的新的词汇列表进行词性分析,形成最终输出的待标注的词汇列表;所述数据辅助标注对待标注的词汇列表中的部分词汇进行标注,得到带标签的词汇列表;对带标签的词汇列表与分割后的数据集进行标注,得到BMEOS格式标注的数据集; S3,模型训练与初步知识抽取;所述模型由双向长短期记忆神经网络与随机条件场结合得到,利用该模型进行化工文本的命名实体识别任务;首先,利用S2中产生的BMEOS格式标注的数据集训练该模型,训练好的模型用于完成化工文本的命名实体识别,得到化工文本实体集和对应的标签集;然后,将化工文本实体集中的实体与其对应的标签进行组合,得到头部实体-头部实体标签-尾部实体-尾部实体标签的化工文本实体四元组序列结构;采用依存句法分析方法进行关系抽取,得到多个头部实体-关系-尾部实体的初始化工过程知识三元组序列结构; S4,初步知识抽取结果融合;将化工文本实体四元组序列结构的头部实体与初始化工过程知识三元组序列结构的头部实体进行相似度计算,化工文本实体四元组序列结构的尾部实体与初始化工过程知识三元组序列结构的尾部实体进行相似度计算,对相似度达到设定值的化工文本实体四元组序列结构与初始化工过程知识三元组序列结构对应的数据进行融合操作完成知识融合; S5:知识存储和知识查询;将知识融合得到的所有新的头部实体-关系-尾部实体的化工过程知识三元组序列中的数据存储为化工过程知识图谱。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京化工大学,其通讯地址为:100000 北京市朝阳区北三环东路15号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励