北京百度网讯科技有限公司林泽南获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京百度网讯科技有限公司申请的专利文本标注模型的训练方法、文生图方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117290515B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311199753.5,技术领域涉及:G06F16/36;该发明授权文本标注模型的训练方法、文生图方法及装置是由林泽南;张硕;傅瑜;史亚冰设计研发完成,并于2023-09-15向国家知识产权局提交的专利申请。
本文本标注模型的训练方法、文生图方法及装置在说明书摘要公布了:本申请公开了文本标注模型的训练方法、文生图方法及装置,涉及人工智能技术领域,尤其涉及自然语言处理、深度学习等领域。实现方案:获取第一样本文本及第一样本文本中各字符分别对应的多级参考标签;利用初始文本标注模型对第一样本文本进行标注,以获取预测标签序列;根据各字符分别对应的预测多级标签与多级参考标签之间的差异,对初始文本标注模型进行训练,以获取文本标注模型。由此,通过利用多级标签标注后的第一样本文本可以训练得到能够进行多级标签标注的文本标注模型,利用该文本标注模型对文生图的输入文本进行标注,基于多级标签标注后的输入文本生成图像,可以提高生成的图像与输入文本的描述的匹配度。
本发明授权文本标注模型的训练方法、文生图方法及装置在权利要求书中公布了:1.一种文本标注模型的训练方法,包括: 获取第一样本文本及所述第一样本文本中各字符分别对应的多级参考标签; 利用初始文本标注模型对所述第一样本文本进行标注,以获取预测标签序列,所述预测标签序列包括各所述字符分别对应的预测多级标签; 根据各所述字符分别对应的预测多级标签与多级参考标签之间的差异,对所述初始文本标注模型进行训练,以获取文本标注模型; 其中,所述文本标注模型用于对文生图模型的输入文本进行标注,所述文生图模型用于对标注后的输入文本进行处理以生成所述输入文本对应的图像; 所述获取第一样本文本及所述第一样本文本中各字符分别对应的多级参考标签,包括: 获取所述第一样本文本; 对所述第一样本文本进行切词处理,以获取所述第一样本文本包含的第一分词; 将所述第一分词与预设图谱中的实体及实体之间的关系进行匹配,从多级标签集合中以确定出所述第一分词对应的多级参考标签; 根据所述第一分词对应的多级参考标签,对所述第一分词中的字符进行标注,以获取所述字符对应的多级参考标签; 所述将所述第一分词与预设图谱中的实体及实体之间的关系进行匹配,以确定所述第一分词对应的多级参考标签,包括: 在所述第一分词中的第一目标分词与所述预设图谱中的第一实体匹配的情况下,将所述第一实体的属性和或所述第一实体与相邻实体之间的关系与第一候选多级标签进行匹配,以确定所述第一目标分词对应的多级参考标签; 在所述第一分词中的第二目标分词与所述预设图谱中的两个实体之间的关系匹配的情况下,将任意两个实体之间的关系的属性与第二候选多级标签进行匹配,以确定所述第二目标分词对应的多级参考标签; 在所述第一分词中的第三目标分词与所述预设图谱中的实体及实体之间的关系均不匹配的情况下,将所述第三目标分词与所述第三目标分词所属语句中实体的属性进行匹配,确定所述第三目标分词对应的多级参考标签; 其中,所述第一候选多级标签是指所述多级标签集合中一级标签为第一预设标签的多级标签,所述第二候选多级标签是指所述多级标签集合中一级标签为第二预设标签的多级标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦二层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。