富璟科技(深圳)有限公司刘艳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉富璟科技(深圳)有限公司申请的专利基于机器学习的大数据预处理方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120256837B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510750257.7,技术领域涉及:G06F18/10;该发明授权基于机器学习的大数据预处理方法及系统是由刘艳设计研发完成,并于2025-06-06向国家知识产权局提交的专利申请。
本基于机器学习的大数据预处理方法及系统在说明书摘要公布了:本申请实施例公开了一种基于机器学习的大数据预处理方法及系统,方法包括:获取RPA系统的运行日志数据集合,运行日志数据集合包括多个会话交互记录;对运行日志数据集合进行数据清洗处理,得到预处理后的运行日志数据集合;基于预设的特征提取算法对预处理后的运行日志数据集合进行特征抽取处理,得到每个会话交互记录的文本语义特征和操作序列特征;调用机器学习模型对文本语义特征和操作序列特征进行联合建模处理,生成会话交互记录的异常检测结果,并基于异常检测结果调整RPA系统的任务执行策略。由此,可以提升RPA系统的稳定性和效率,保障业务流程的顺畅进行。
本发明授权基于机器学习的大数据预处理方法及系统在权利要求书中公布了:1.一种基于机器学习的大数据预处理方法,其特征在于,包括: 获取RPA系统的运行日志数据集合,所述运行日志数据集合包括多个会话交互记录; 对所述运行日志数据集合进行数据清洗处理,得到预处理后的运行日志数据集合; 基于预设的特征提取算法对所述预处理后的运行日志数据集合进行特征抽取处理,得到每个会话交互记录的文本语义特征和操作序列特征:对所述会话交互记录中的用户操作事件进行文本分词处理,得到多个操作词单元,并对所述多个操作词单元进行词性标注处理,识别所述用户操作事件中的核心操作动词和辅助操作对象;调用预训练的语言编码模型对所述核心操作动词和所述辅助操作对象进行语义编码处理,生成所述用户操作事件的文本向量表示,将所述文本向量表示作为所述文本语义特征;对所述会话交互记录中的系统响应事件进行操作序列解析处理,识别所述系统响应事件中包含的原子操作指令集合,并对所述原子操作指令集合进行序列模式编码处理,生成所述系统响应事件的操作序列编码;将所述操作序列编码与所述文本向量表示进行时间维度对齐处理,得到所述会话交互记录的操作序列特征; 所述对所述原子操作指令集合进行序列模式编码处理,生成所述系统响应事件的操作序列编码,包括:遍历所述原子操作指令集合中的每个原子操作指令,确定所述原子操作指令的操作类型标识符和操作参数集合;基于所述操作类型标识符将所述原子操作指令映射到预设的操作类型空间,生成所述原子操作指令的类型编码向量;对所述操作参数集合中的每个操作参数进行参数类型解析处理,确定所述操作参数的数据类型标识符和参数值范围,并基于所述数据类型标识符和所述参数值范围生成所述操作参数的参数编码向量;将所述类型编码向量与所述参数编码向量进行拼接处理,得到所述原子操作指令的指令编码向量,基于所述原子操作指令在所述系统响应事件中的执行顺序对所述指令编码向量进行序列化处理,生成所述操作序列编码; 调用机器学习模型对所述文本语义特征和所述操作序列特征进行联合建模处理,生成所述会话交互记录的异常检测结果,并基于所述异常检测结果调整所述RPA系统的任务执行策略。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人富璟科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市南山区粤海街道高新区社区科技南路18号深圳湾科技生态园12栋裙楼815;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。