首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种跨领域的语义分析基准方法、装置、设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广州密码营地科技有限公司

摘要:本发明公开了一种跨领域的语义分析基准方法、装置、设备及介质,方法包括:将预设的基线模型运行在目标数据集上,得到所述基线模型在所述目标数据集上语义分析任务的第一性能;其中,所述目标数据集采用跨领域的多语言和多语义表示;将目标模型运行在所述目标数据集上,得到所述目标模型在所述目标数据集上语义分析任务的第二性能;根据所述基线模型的第一性能和所述目标模型的第二性能,确定所述目标模型对所述目标数据集的综合性能全面评估结果。本发明避免了单一领域数据集上从特定语言到特定语义表示的语义分析任务带来的局限性,有效提升了对语义分析算法评估的全面性和有效性,可广泛应用于语义分析技术领域。

主权项:1.一种跨领域的语义分析基准方法,其特征在于,包括:将预设的基线模型运行在目标数据集上,得到所述基线模型在所述目标数据集上语义分析任务的第一性能;其中,所述目标数据集采用跨领域的多语言和多语义表示;将目标模型运行在所述目标数据集上,得到所述目标模型在所述目标数据集上语义分析任务的第二性能;根据所述基线模型的第一性能和所述目标模型的第二性能,确定所述目标模型对所述目标数据集的综合性能全面评估结果;所述基线模型为指针生成网络模型,所述指针生成网络模型在seq2seq模型的基础上增设attention机制、copy机制和coverage机制;所述目标数据集包括第一数据集和第二数据集;所述将预设的基线模型运行在目标数据集上,得到所述基线模型在所述目标数据集上语义分析任务的第一性能,包括:采用Glove840B作为英文输入的第一词向量预训练模型;采用fasttextmultilingualmodel作为除英文外其他输入语言的第二词向量预训练模型;配置编解码器LSTM网络层数、LSTM网络神经元个数以及学习率;配置批处理大小和防过拟合参数;根据所述第一词向量预训练模型和所述词向量预训练模型,通过所述编解码器LSTM网络层数、LSTM网络神经元个数、学习率、批处理大小和防过拟合参数对所述基线模型进行训练;根据所述基线模型的训练结果,获取最佳超参数;根据所述最佳超参数,确定所述基线模型在所述目标数据集上语义分析任务上的最佳模型;计算所述最佳模型的性能矩阵,确定所述基线模型的第一性能;所述将目标模型运行在所述目标数据集上,得到所述目标模型在所述目标数据集上语义分析任务的第二性能,包括:当所述目标数据集不为空时,从所述目标数据集中选取候选数据集,从所述候选数据集中剔除自然语言集合;当所述自然语言集合不为空时,从所述自然语言集合中剔除一种候选自然语言;当所述目标数据集中的语义表示集合不为空时,从所述语义表示集合中剔除一种候选语义表示;根据所述候选自然语言和所述候选语义表示来训练所述目标模型,得到目标模型的最佳模型;获取所述目标模型的最佳模型在测试集上的测试准确率;统计所有测试结果,计算所述目标模型的第二性能。

全文数据:

权利要求:

百度查询: 广州密码营地科技有限公司 一种跨领域的语义分析基准方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。