基于大模型的位置去偏的长期对话方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华中科技大学;中国平安财产保险股份有限公司

摘要：本发明公开了一种基于大模型的位置去偏的长期对话方法，包括以下步骤：1对于输入的对话D，对大模型使用位置嵌入的注意力进行调整，提取对话中的因果相关话语；2对大模型进行微调，将微调过程中的损失分为两部分：预测损失和因果感知损失；3使用经过步骤1和步骤2调整后的大模型作为长期对话系统的基座，使用时，系统指令和对话历史D连接起来并输入模型用以生成回复R。本发明通过对大模型进行微调，使模型不再受到位置偏见的影响，使用上述微调后的大模型作为长期对话系统的基座用以生成回复，增强其因果感知能力，提高模型的性能。

主权项：1.一种基于大模型的位置去偏的长期对话方法，其特征在于，包括以下步骤：1对于输入的对话D，对大模型使用位置嵌入的注意力进行调整，提取对话中的因果相关话语；其中，输入的对话D是由多个话语组成的对话，D＝{u1,u2,...,u|D|}，其中|D|表示话语所在的对话回合数；其中，使用位置嵌入的注意力进行调整包括：1.1限制句子中的位置信息，对句间注意力只使用语义相关性，实现语义信息和位置偏差之间的平衡；1.2测量对话中每个话语的处理效应TE，表示为处理集[TEu1，TEu2，，…，TEu|D|]；1.3根据对话中每个话语的处理效应TE差异，对处理集进行聚类，获得因果相关话语集C和非因果关联话语集S，提取对话中的最小因果相关话语集；2对大模型进行微调，将微调过程中的损失分为两部分：预测损失和因果感知损失；3使用经过步骤1和步骤2调整后的大模型作为长期对话系统的基座，使用时，通过系统指令和对话历史D连接起来并输入模型用以生成回复R。

全文数据：

权利要求：

百度查询：华中科技大学中国平安财产保险股份有限公司基于大模型的位置去偏的长期对话方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种数据流通方法及其系统、装置、通信节点

下一篇：一种铁基层状氧化物钠离子电池正极材料及其制备方法和应用

相关技术

一种数据流通方法及其系统、装置、通信节点

一种铁基层状氧化物钠离子电池正极材料及其制备方法和应用

获取剥离预测模型的方法及图形修正的方法

数据处理方法、装置、电子设备及存储介质

客户服务维系方法及装置、可读存储介质、计算机程序产品

一种快速一步法合成噻二唑-三嗪化合物的方法和应用

数据处理方法、装置及电子设备

业务管制方法、系统、电子设备及存储介质

半导体器件

数字签名方法、设备及存储介质

具有辅助层的半导体元件及其制备方法

利用率结构分布评估方法、装置、设备、介质及产品

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于大模型的位置去偏的长期对话方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务