企商在线(北京)数据技术股份有限公司王新征获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉企商在线(北京)数据技术股份有限公司申请的专利一种基于大模型预标注的多模态数据标注方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121456489B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610007225.2,技术领域涉及:G06F18/214;该发明授权一种基于大模型预标注的多模态数据标注方法及系统是由王新征;贾晓洁;蔡媛;陈新蕾;赵玉兵设计研发完成,并于2026-01-06向国家知识产权局提交的专利申请。
本一种基于大模型预标注的多模态数据标注方法及系统在说明书摘要公布了:本发明的一种基于大模型预标注的多模态数据标注方法及系统,方法包括:S1:接收待标注的多模态原始数据及标注任务定义,生成结构化任务指令信号;S2:将结构化任务指令信号输入至多模态大模型,生成包含初步标签及其对应置信度的预标注结果信号;S3:基于预标注结果信号中的置信度,调度人工校验任务;S4:根据人工校验信号,对多模态大模型进行参数微调或提示优化,生成模型优化信号;S5:利用经模型优化信号更新后的多模态大模型对新的多模态原始数据进行预标注,并融合人工校验信号。本发明的一种基于大模型预标注的多模态数据标注方法及系统可以解决传统多模态数据标注效率低下、成本高昂且质量难以统一的问题。
本发明授权一种基于大模型预标注的多模态数据标注方法及系统在权利要求书中公布了:1.一种基于大模型预标注的多模态数据标注方法,其特征在于,包括: S1:接收待标注的多模态原始数据及标注任务定义,生成结构化任务指令信号; S2:将所述结构化任务指令信号输入至多模态大模型,生成包含初步标签及其对应置信度的预标注结果信号;所述结构化任务指令信号包含明确的输出格式规约与语义约束;所述输出格式规约定义了标签的数据结构、层级关系以及在不同模态数据上的映射方式,所述语义约束则通过自然语言指令限定了标签的属性、类别间的关系以及标注的粒度;该结构化任务指令信号被输入至多模态大模型时,首先激活模型内部的指令解析模块,该模块将信号分解为针对不同模态的理解子任务与一个统一的输出生成子任务;模型在所述语义约束的引导下,对多模态数据进行联合推理与跨模态语义对齐分析,进而按照所述输出格式规约生成结构化的初步标签,并为每个标签计算一个反映其生成可靠性的置信度分值,共同构成所述预标注结果信号; S3:基于所述预标注结果信号中的置信度,调度人工校验任务,并接收人工对初步标签的修正信息,生成人工校验信号;所述预标注结果信号中的置信度调度人工校验任务的步骤包括:设置高、中、低三档置信度阈值区间,对所述预标注结果信号进行自动分拣;对于置信度高于第一阈值的初步标签,直接将其标记为已验证信号并纳入最终结果池;对于置信度介于第一阈值与第二阈值之间的初步标签,将其打包为轻度审核任务包信号,分配给初级标注员进行快速核对与确认;对于置信度低于第二阈值的初步标签,则将其与相关的多模态上下文数据一同打包为深度校验任务包信号,分配给高级或专家级标注员进行详细审查与修正;所述接收人工对初步标签的修正信息,是指系统提供一个集成化的标注界面,该界面同步展示多模态数据、预标注结果及其置信度,标注员在该界面上进行的任何确认、修改、删除或新增标签的操作,均被实时捕获并编码为结构化的人机交互事件流,进而整合生成所述人工校验信号; S4:根据所述人工校验信号,对所述多模态大模型进行参数微调或提示优化,生成模型优化信号;所述多模态大模型是一种经过大规模跨模态数据预训练、具备理解与生成能力的通用人工智能模型;所述生成包含初步标签及其对应置信度的预标注结果信号的步骤具体为:该多模态大模型接收所述结构化任务指令信号后,其内部的视觉编码器、文本编码器与音频编码器分别对相应的模态数据进行特征编码,生成高阶特征表示信号;这些特征表示信号被输入到一个共享的跨模态注意力融合网络中进行深度交互与信息互补,产生一个统一的场景理解表示信号;该场景理解表示信号随后被馈送至任务特定的解码器头部,该解码器头部根据所述输出格式规约,并行生成包括分类标签、检测框、分割掩码、描述文本在内的多种类型的初步标签,并利用模型内部的校准模块为每个生成的标签附属一个基于其概率分布或逻辑一致性的置信度分值,从而输出所述预标注结果信号; S5:利用经所述模型优化信号更新后的多模态大模型对新的多模态原始数据进行预标注,并融合人工校验信号,输出最终的标注数据集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人企商在线(北京)数据技术股份有限公司,其通讯地址为:100080 北京市海淀区北三环西路32号楼17层1909;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励