首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种机构名称校对方法、装置、设备、介质及程序产品 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:四川封面传媒科技有限责任公司

摘要:本申请公开了一种机构名称校对方法、装置、设备、介质及程序产品,涉及信息处理技术领域。所述方法是在构建得到机构名称知识库后,先根据知识库中的所有机构结构化信息的机构全称、简称和别称建立倒排索引,然后将待校对文本输入已完成预训练的机构名称实体识别模型,输出得到待校对机构名称及其上下文信息,再然后利用倒排索引对待校对机构名称进行相似检索,得到多个候选机构名称,并根据上下文信息和候选机构名称的所属机构结构化信息,基于大语言模型的思维链技术筛选出与待校对机构名称最匹配的某个候选机构名称,最后比较这两名称的差异并给出具体校对建议,如此可高效并精准地完成真实场景中机构名称的校对,应对复杂多变的名称变化情况。

主权项:1.一种机构名称校对方法,其特征在于,包括:构建得到机构名称知识库,其中,所述机构名称知识库记录有所有机构的且以机构全称为主键进行聚合关联的机构结构化信息,所述机构结构化信息包含有所述机构全称、机构简称、机构别称、机构所在地区和机构所属行业;根据所述机构名称知识库中的所有所述机构结构化信息的机构全称、机构简称和机构别称,以分词粒度和或字粒度建立倒排索引;将待校对文本输入已完成预训练的且用于识别机构全称、机构简称和或机构别称的机构名称实体识别模型,输出得到待校对机构名称;根据所述待校对机构名称在所述待校对文本中的位置,从所述待校对文本中提取得到所述待校对机构名称的上下文信息;利用所述倒排索引对所述待校对机构名称进行相似检索,得到从所述机构名称知识库中检索出的且按照相似度从高至低顺序依次排列的前N个候选机构名称,其中,N表示大于等于3的正整数,所述候选机构名称为机构全称、机构简称或机构别称;根据所述待校对机构名称的上下文信息和所述前N个候选机构名称的所属机构结构化信息,基于大语言模型的思维链技术对所述前N个候选机构名称依次进行地区分类识别筛选处理、行业分类识别筛选处理和匹配机构识别处理,得到从所述前N个候选机构名称中筛选出的且与所述待校对机构名称最匹配的某个候选机构名称;判断所述待校对机构名称与所述某个候选机构名称是否存在名称差异;若是,则根据所述某个候选机构名称输出对所述待校对机构名称的校对建议。

全文数据:

权利要求:

百度查询: 四川封面传媒科技有限责任公司 一种机构名称校对方法、装置、设备、介质及程序产品

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。