同济大学蒋昌俊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉同济大学申请的专利一种基于隐层激活的偏见幻觉检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119829962B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411724634.1,技术领域涉及:G06F18/21;该发明授权一种基于隐层激活的偏见幻觉检测方法是由蒋昌俊;闫春钢;丁志军;王俊丽;张亚英;张东宇设计研发完成,并于2024-11-28向国家知识产权局提交的专利申请。
本一种基于隐层激活的偏见幻觉检测方法在说明书摘要公布了:本发明公开了一种基于隐层激活的偏见幻觉检测方法。该方法包括:根据语言模型回答的行为特征评估信念状态,获得信念状态评估结果,所述信念状态反映该语言模型对回答的不确定程度;基于所述信念状态评估结果构建训练集,并训练信念状态分类器,所述训练集反映所述语言模型的信念状态与隐层激活之间的对应关系;实时获取目标语言模型生成过程中的隐层激活,并根据该隐层激活,利用经训练的信念状态分类器判断信念状态;对于检测出的幻觉,结合所述目标语言模型的输出正确性与所述信念状态分类器判断出的信念状态,判断幻觉类别。本发明基于模型隐层激活进行信念状态判定,提高了偏见幻觉检测的准确率。
本发明授权一种基于隐层激活的偏见幻觉检测方法在权利要求书中公布了:1.一种基于隐层激活的偏见幻觉检测方法,包括以下步骤: 根据语言模型回答的行为特征评估信念状态,获得信念状态评估结果,所述信念状态反映该语言模型对回答的不确定程度; 基于所述信念状态评估结果构建训练集,并训练信念状态分类器,所述训练集反映所述语言模型的信念状态与隐层激活之间的对应关系; 实时获取目标语言模型生成过程中的隐层激活,并根据该隐层激活,利用经训练的信念状态分类器判断信念状态; 对于检测出的幻觉,结合所述目标语言模型的输出正确性与所述信念状态分类器判断出的信念状态,判断幻觉类别; 其中,根据以下步骤评估所述语言模型的信念状态: 对于设定的问题,从所述语言模型获取自由格式的多次答案; 从所述自由格式的多次答案中抽取答案,并计算答案的重复率; 以重复率最高的答案的出现频率作为所述语言模型对该问题的置信度的度量,并根据以下公式判断信念状态: 其中,是答案在设定回答总数中的出现次数,是所述语言模型对于问题的信念状态,和是设定阈值,,表示处于自信状态,表示处于不确定状态; 其中,根据以下步骤构建所述训练集: 将问题与所述语言模型的回答拼接,选取第i个token在第l层的隐层激活,表示为,其中为层序号,是隐层激活的维度; 以隐层激活作为所述信念状态分类器的输入,对应的信念状态作为标签,得到所述训练集,表示为,N是所述训练集中的样本数量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人同济大学,其通讯地址为:200092 上海市杨浦区四平路1239号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励