首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种跨境电商大数据智能处理方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广东慧通科技有限公司

摘要:本发明提供一种跨境电商大数据智能处理方法及系统,属于数据处理技术领域,所述系统包括:大数据收集单元、大数据处理单元、大数据存储平台、结构化数据库、选取人工智能模型、本地大模型、公共大模型、工作辅助和反馈单元。所述方法流程如下:大数据收集和清洗后,进行基于模板的大数据分类,然后进行特征提取,再根据运营环节的任务选取特征数据,输入本地大模型生成提示,将提示输入公共大模型,输出完成任务的执行方法、结论和参考意见,辅助各岗位的工作,解决跨境电商引入大数据带来的工作量和人力成本显著增加的问题。

主权项:1.一种跨境电商大数据智能处理方法及系统,其特征在于,所述方法包括以下步骤:S1:大数据收集和清洗:收集跨境电商需要的数据并进行清洗,去除重复和无效的数据;S2、分类模板库管理:包括子步骤S201至S205;S201:选择典型的数据制作模板;S202:提取模板中的关键词并保存,设置特征提取规则和关键词的权重;S203:计算每一个关键词权重向量;S204、关键词的权重向量累加得到总权重向量;S205、计算模板的SimHash值后,将模板放入模板库;S3、基于模板的大数据分类包括子步骤S301至S305S301、在未分类大数据中搜索所有模板中的关键词并赋予权重;S302:计算未分类大数据的权重向量;S303、计算未分类大数据的总权重向量;S304、计算未分类大数据的SimHash值;S305、计算未分类大数据和各个模板的SimHash值的海明距离,将未分类大数据划入海明距离最小的模板所在的类别;S306、如果未分类大数据与所有模板的海明距离大于系统设定的值,返回S2,将该未分类数据处理成新的模板,放入模板库;S4、大数据存储分类后的数据存入非结构化大数据存储平台;S5、大数据特征提取大数据利用所在类别模板中的特征提取规则实现关键词对应的特征信息提取,关键词和特征信息组合后构成大数据的特征数据;S6、特征数据存储大数据的特征数据存储到结构化数据库,构成特征数据库;跨境电商运营中产生的运营数据,包括特征数据和运营结果,也存储到特征数据库;S7、不同任务的特征数据选取采用选取人工智能模型,使用运营数据做为标注好的数据训练模型,然后根据任务从特征数据库中选取系统设定数量的性能最好的特征数据;S8、大模型架构确定采用公共大模型和本地大模型两种模型协同的方式,将选取后的特征数据和任务依次输入本地大模型,由本地大模型生成公共大模型使用的提示,然后输入公共大模型;S9、本地大模型微调本地大模型按照系统要求进行微调,微调数据通过将运营数据做为有标记的训练数据集方式产生;S10、运营环节提示生成特征数据和任务组合构成提示输入本地大模型,本地大模型生成公共大模型的提示;S11、运营环节工作辅助和反馈本地大模型生成的提示输入公共大模型,生成对应任务的具体执行方法、参考意见或者结论,辅助工作人员完成工作。工作人员对结果不满意,反馈到本地大模型并重新生成新的提示输入到公共大模型,直到工作人员满意。

全文数据:

权利要求:

百度查询: 广东慧通科技有限公司 一种跨境电商大数据智能处理方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。