首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于机器学习的人工智能数据分析方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州数亮科技股份有限公司

摘要:本发明公开了一种基于机器学习的人工智能数据分析方法及系统,涉及数据分析技术领域,包括采集数据源中的数据并进行预处理,对预处理后的数据进行特征提取;构建多模态机器学习模型进行数据预测,预测类别的概率;实施数据加密,构建交互式数据可视化界面,存储收集和分析产生的人工智能数据。本发明通过采集数据源中的数据并进行预处理,对预处理后的数据进行特征提取,构建多模态机器学习模型进行数据预测,预测类别的概率,提升了模型的泛化能力和预测精度,不仅优化了数据的处理质量,而且提高了数据分析的准确性和效率。

主权项:1.基于机器学习的人工智能数据分析方法,其特征在于:包括,采集数据源中的数据并进行预处理,对预处理后的数据提取特征;构建多模态机器学习模型进行数据预测,预测类别的概率;实施数据加密,构建交互式数据可视化界面,存储收集和分析产生的人工智能数据;所述构建多模态机器学习模型进行数据预测,预测类别的概率指收集历史数据源中采集文本、图像和声音数据,对历史数据源数据进行清洗和标准化,将历史数据源的数据合并成数据集,生成历史数据源训练集;使用随机森林、支持向量机和梯度提升树分别作为基模型,对基模型进行参数调整,使用网格搜索确定最优参数,输入历史数据源训练集进行独立训练,使用交叉验证方法评估参数组合的效果,得到最优参数;将融合特征向量分别输入到训练好的基模型中进行预测,得到三个基模型的预测每个类别的概率、和;构建堆叠泛化模型架构,第一层为训练并保存基模型的预测结果,第二层使用多层感知机MLP作为元模型,定义元模型的输入为第一层内容,元模型的输出为最终预测每个类别的概率;多层感知机MLP模型公式为: ,其中为每个类别的概率,为第o个基模型的预测结果,为对应模型的权重,D为基模型的数量;基于历史基模型的预测结果和原始训练样本的实际标签,生成元模型训练集;使用元模型训练集中历史基模型的预测结果作为基模型特征,真实标签作为目标值,通过优化算法求解权重,使用元模型训练集训练多层感知机MLP模型,使得整体预测误差最小化,优化权重公式为: ,其中为真实标签的独热编码,为模型输入,D为基模型数量,T为基模型的数量;初始化权重向量w,计算预测误差,并更新权重,公式为: ,其中为对应模型的权重,为学习率,L为交叉熵损失函数,为损失函数关于权重的梯度;使用交叉熵损失函数L公式为: ,其中为多层感知机MLP模型对j类的预测概率,M为类别的总数;将基模型预测每个类别的概率、和输入到多层感知机MLP模型中,得到最终的每个类别的概率。

全文数据:

权利要求:

百度查询: 杭州数亮科技股份有限公司 基于机器学习的人工智能数据分析方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。