Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京中数睿智科技有限公司韩涵获国家专利权

北京中数睿智科技有限公司韩涵获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京中数睿智科技有限公司申请的专利基于大模型的交互式数据分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118886415B

龙图腾网通过国家知识产权局官网在2025-04-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410905470.6,技术领域涉及:G06F40/216;该发明授权基于大模型的交互式数据分析方法是由韩涵;王甫宁;何江;谢开浪;马文龙;陈善君;夏暄设计研发完成,并于2024-07-08向国家知识产权局提交的专利申请。

基于大模型的交互式数据分析方法在说明书摘要公布了:本申请提出一种基于大模型的交互式数据分析方法,包括获取文本样本以及对应的训练标签,构建训练集;对所述训练集中的文本样本进行格式转换,以将所述训练集转换成大模型的输入序列样本;将所述输入序列输入到所述大模型中,以使得所述大模型对所述输入序列进行预设维度的分析,得到分析结果;基于所述分析结果与所述训练集中的训练标签,计算所述大模型的损失函数,以基于所述损失函数对所述大模型进行训练,直至训练完成;获取待处理文本,并将其转换成待处理序列,以输入到训练完成的大模型中以对所述待处理以文本进行预设维度的分析并得到对应的分析结果。

本发明授权基于大模型的交互式数据分析方法在权利要求书中公布了:1.一种基于大模型的交互式数据分析方法,其特征在于,包括:获取文本样本以及对应的训练标签,构建训练集;对所述训练集中的文本样本进行分词处理,得到若干词单元;对所述若干词单元进行频率统计,以确定出高频词汇并据此组成高频词汇表,所述高频词汇为出现频率大于设定频率阈值的词单元;对所述高频词汇表进行编码处理,得到高频词索引序列,以作为所述训练集转换成大模型的输入序列样本;使用WordEmbeddings模型,确定所述高频词汇表中高频词汇的语义关联度;基于设置的自适应编码模型,对所述高频词汇表进行编码处理得到群组编码;基于所述高频词汇表中高频词汇的语义关联度,生成语义关联矩阵;基于所述语义关联矩阵,对所述高频词汇表中高频词汇进行聚类分析,以确定其中的群组代表词;对所述群组代表词进行语义流和逻辑结构扩展,以确定序列开头标记位置和结尾标记位置,以在所述群组代表词对应的群组编码中添加内置的序列开头标记和结尾标记,以生成高频词索引序列;将所述输入序列样本输入到所述大模型中,以使得所述大模型对所述输入序列样本进行预设维度的分析,得到分析结果;基于所述分析结果与所述训练集中的训练标签,计算所述大模型的损失函数,以基于所述损失函数对所述大模型进行训练,直至训练完成;获取待处理文本,并将其转换成待处理序列,以输入到训练完成的大模型中以对所述待处理以文本进行预设维度的分析并得到对应的分析结果;其中,所述获取文本样本以及对应的训练标签,构建训练集包括:对样本数据源进行结构解析,提取目标数据源中的文本类名以及文本属性标签;将所述文本类名以及文本属性标签分别映射为文本样本以及对应的训练标签,以构建训练集;其中,所述对样本数据源进行结构解析,提取目标数据源中的文本类名以及文本属性标签,包括:基于构建的DOM元素序列,启用DOMAPI对样本数据源进行结构解析,提取目标数据源中的文本类名以及文本属性标签。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中数睿智科技有限公司,其通讯地址为:100088 北京市海淀区知春路23号量子银座10层1014室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。