买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于大语言模型的跨领域数据匹配方法,包括以下步骤:输入源数据和目标数据,且两者分别来自患者信息和药物数据;分别从源数据和目标数据中提取实体对,所述源数据中的实体对具有标签的,即被标记为匹配或者不匹配,目标数据中的实体对不具有标签;主动候选源数据生成;上下文演示选择;将每个实体对的域信息注入到预定义格式中,将提示发送给大语言模型进行处理,大语言模型根据接收到的提示返回特定实体对的结果。本申请探索了大语言模型执行跨域实体解析的上下文学习能力。本申请提高了大语言模型在跨域实体解析任务中的性能,能选择更有价值的演示并构建更高质量的提示。
主权项:1.一种基于大语言模型的跨领域数据匹配方法,其特征在于,包括以下步骤:S1:获取源数据和目标数据,所述源数据和目标数据分别来自患者信息和药物数据;S2:分别从源数据和目标数据中提取实体对,所述源数据中的实体对具有标签的,标记为匹配或者不匹配,目标数据中的实体对不具有标签;S3:利用主动学习方法,选择标记源数据的一个子集作为候选源数据,对源数据进行初步过滤,用于大语言模型学习;具体包括:根据源数据中每个记录的不确定性及其与目标数据的关联性,从源数据中选择记录作为候选者;S4:将演示选择的范围从源数据更改为候选源数据;结合结构和语义的相似性,以选择更有价值的演示;S5:将每个实体对的域信息注入到预定义格式中,将提示发送给大语言模型进行处理,大语言模型根据接收到的提示返回特定实体对的结果;S6:获得目标数据实体对的标签信息,并输出。
全文数据:
权利要求:
百度查询: 中国人民解放军国防科技大学 一种基于大语言模型的跨领域数据匹配方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。