深圳微品致远信息科技有限公司周洪峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳微品致远信息科技有限公司申请的专利基于大语言模型的多源数据自动化采集方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120450015B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510829167.7,技术领域涉及:G06N5/022;该发明授权基于大语言模型的多源数据自动化采集方法是由周洪峰;潘孝挺;刘林峰;熊杰;杨欢设计研发完成,并于2025-06-20向国家知识产权局提交的专利申请。
本基于大语言模型的多源数据自动化采集方法在说明书摘要公布了:本发明提供的基于大语言模型的多源数据自动化采集方法,包括:分析历史采集数据的特征分布,结合当前数据源的状态,动态生成最优采集策略;实时调度采集任务,得到动态调度的数据流;对所述动态调度的数据流进行实时异常检测与自适应补偿,得到自容错数据流;分析所述自容错数据流的实体关联及业务逻辑,预测潜在的数据需求点;自动扩展数据采集范围,得到知识增强的数据资产;识别所述数据资产的数据传输流的协议特征,基于协议特征映射的解析器对数据进行解析,得到协议无关标准化数据;进行语义噪声过滤与跨模态清洗,得到语义纯净数据。在本发明中,克服了现有多源数据采集技术无法进行协议适配以及自适应策略优化的缺陷。
本发明授权基于大语言模型的多源数据自动化采集方法在权利要求书中公布了:1.一种基于大语言模型的多源数据自动化采集方法,其特征在于,包括以下步骤: 分析历史采集数据的特征分布,结合当前数据源的状态,动态生成最优采集策略,包括:对历史采集数据进行切片,并提取各个切片的数据量波动特征、价值密度分布及字段完整性特征,得到数据特征向量;监测各数据源的连接成功率、响应时效性及服务器负载压力,并进行分级评估,得到数据源状态矩阵;构建强化学习模型,对所述数据特征向量与数据源状态矩阵进行多目标强化学习优化处理,生成最优参数向量,基于最优参数向量得到最优采集策略; 基于所述最优采集策略实时调度采集任务,得到动态调度的数据流;对所述动态调度的数据流进行实时异常检测与自适应补偿,得到自容错数据流; 基于大语言模型构建领域知识图谱,分析所述自容错数据流的实体关联及业务逻辑,预测潜在的数据需求点,包括:识别所述自容错数据流中的实体,构建实体间的语义关联,生成实体关系三元组集合;基于大语言模型构建领域知识图谱,将所述实体关系三元组集合映射到领域知识图谱中,计算实体之间的相似度,并补全隐含关系,得到动态知识图谱;分析所述动态知识图谱中实体的关联路径,提取业务规则,结合通过时序分析识别事件序列模式,生成业务逻辑规则库;通过基于Transformer的需求预测模型,对所述业务逻辑规则库以及动态知识图谱进行分析,识别数据缺失点和业务关联空白,输出潜在的数据需求点; 基于预测的潜在的数据需求点,自动扩展数据采集范围,得到知识增强的数据资产; 识别所述数据资产的数据传输流的协议特征,基于协议特征映射的解析器对数据进行解析,得到协议无关标准化数据;对所述协议无关标准化数据进行语义噪声过滤与跨模态清洗,得到语义纯净数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳微品致远信息科技有限公司,其通讯地址为:518000 广东省深圳市光明区凤凰街道东坑社区光明凤凰广场2栋1001;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励