恭喜数力聚(北京)科技有限公司李乐平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜数力聚(北京)科技有限公司申请的专利基于语言大模型的辅助报告快速生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119443062B 。
龙图腾网通过国家知识产权局官网在2025-05-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510038405.2,技术领域涉及:G06F40/166;该发明授权基于语言大模型的辅助报告快速生成方法及系统是由李乐平;叶泽阳设计研发完成,并于2025-01-10向国家知识产权局提交的专利申请。
本基于语言大模型的辅助报告快速生成方法及系统在说明书摘要公布了:本发明公开了基于语言大模型的辅助报告快速生成方法及系统,方法包括:数据采集、数据预处理、知识提取、信息压缩和报告优化。本发明属于语言大模型技术领域,具体是指基于语言大模型的辅助报告快速生成方法及系统,本方案采用知识提取,计算目标域中个体的质心,然后计算源域中每个个体到目标域质心的欧几里得距离,衡量个体与质心的差异程度,根据相似性,进行知识转移;采用信息压缩,利用卷积和下采样降低数据维度,并将输出作为LSTM层输入提取长期依赖关系和处理重建数据,解码过程利用反卷积和上采样生成近似原始输入的输出,训练自动编码器最小化输入数据和重建数据之间的差异。
本发明授权基于语言大模型的辅助报告快速生成方法及系统在权利要求书中公布了:1.基于语言大模型的辅助报告快速生成方法,其特征在于:该方法包括以下步骤:步骤S1:数据采集,收集与报告主题相关的大量文本数据;步骤S2:数据预处理,对收集到的文本数据进行清洗、分词操作,得到预处理后的文本数据;步骤S3:知识提取,基于预处理后的文本数据计算目标域中个体的质心,然后计算源域中每个个体到目标域质心的欧几里得距离,衡量个体与质心的差异程度,从源域中提取个体进行知识转移,计算与质心距离最接近的源域,进行更具有针对性的知识提取;步骤S4:信息压缩,将提取到的知识作为原始输入数据,利用卷积和下采样操作降低数据维度,并将卷积层的输出作为LSTM层的输入来提取长期依赖关系和处理重建数据,解码过程利用反卷积和上采样生成近似原始输入的输出,训练自动编码器最小化输入和重建数据差异;步骤S5:报告优化,具体为审查报告内容,确保知识提取和信息压缩过程中没有遗漏关键信息,根据报告质量调整语言大模型参数;在步骤S3中,所述知识提取,包括以下步骤:步骤S31:计算目标域中个体的质心,基于预处理后的文本数据进行个体质心计算时,先将文本数据进行向量化表示,将文本数据的向量化表示作为个体,将个体在各个维度上的值进行加权求平均,确定质心在向量空间中的位置,所用公式如下: ;式中,C表示目标域中个体的质心,表示满足帕累托最优条件的解的数量,用于确定在计算目标域个体质心时的权重,j表示个体的索引,J表示个体的总数,表示目标域中的第j个个体;步骤S32:计算从源域中每个个体到目标域质心的欧几里得距离,所用公式如下: ;式中,Ed表示计算得到的欧几里得距离,i表示维度索引,n表示维度总数,表示源域中第j个个体在第i个维度上的值,表示目标域质心的第i维度上的值;步骤S33:定义与每个源域关联的权重,从每个源域中提取个体进行知识转移,考虑到不同源域和目标域之间的相似性,定义与每个源域关联的权重,所用公式如下: ; ;式中,表示与第t个源域关联的权重,t表示源域的索引,T表示源域的总数,表示第t个源域的相似性度量,表示源域参数,表示目标域参数,f()表示将欧几里得距离转换为相似性度量的变换函数;步骤S34:计算与质心距离最接近的源域,用于在知识提取时,对与质心距离最接近的源域进行重点关注,筛选出更重要的源域进行针对性的知识提取和分析,所用公式如下: ;式中,表示最接近质心的源域,N表示源域特征值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人数力聚(北京)科技有限公司,其通讯地址为:100036 北京市海淀区翠微中里14号楼四层B567;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。