Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种语句生成方法、装置、终端设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本申请提供了一种语句生成方法、装置、终端设备及存储介质,适用于计算机技术领域,该方法包括:获取语料信息;根据所述语料信息以及预设的语料组合顺序信息,生成多个初始语句;根据多个所述初始语句以及预设的语料库,进行语义分析计算,得到语义错误率;根据所述多个初始语句、所述语义错误率以及预设的错误率阈值,对初始语句进行调整,生成多个目的语句。本申请根据词汇内容与预设的词汇组合顺序,生成带有语料信息的语句,通过对生成的语句进行特征提取与语义特征的分析运算,判定生成语句的语义准确性,从而确保用于供人工智能模型训练的语句的数量与准确性,有效解决通过人工对文本内容中的语料进行标注的效率低下以及准确性不高的问题。

主权项:1.一种语句生成方法,其特征在于,包括:获取语料信息;根据所述语料信息以及预设的语料组合顺序信息,生成多个初始语句;根据多个所述初始语句以及预设的语料库,进行语义分析计算,得到语义错误率;根据所述多个初始语句、所述语义错误率以及预设的错误率阈值,对初始语句进行调整,生成多个目的语句;所述根据多个所述初始语句以及预设的语料库,进行语义分析计算,得到语义错误率的步骤,具体包括:提取预设的语料库中的语义组合句式;根据所述初始语句以及所述语义组合句式,进行语义分析计算,得到距离函数值;判断所述距离函数值是否小于预设的距离阈值;若是,则将所述初始语句确定为语义正确语句;若否,则将所述初始语句确定为语义错误语句;统计语义正确语句数目以及语义错误语句数目,计算语义错误率;所述根据所述初始语句以及所述语义组合句式,进行语义分析计算,得到距离函数值的步骤,具体包括:根据所述语义组合句式,得到语义组合句式向量;将所述初始语句进行分割并转换,得到初始文本向量;根据所述初始文本向量以及预设的查询权重矩阵,得到查询向量;根据所述初始文本向量以及预设的键权重矩阵,得到键向量;根据所述初始文本向量以及预设的值权重矩阵,得到值向量;将所述查询向量与所述键向量相乘,得到相似度矩阵;将所述相似度矩阵中的数值进行归一化处理,得到相似度权重矩阵;将所述相似度权重矩阵与所述值向量相乘,得到权重值矩阵;根据所述初始文本向量、所述权重值矩阵、所述语义组合句式向量以及预设的语义处理模型,计算距离函数值;所述根据所述初始文本向量、所述权重值矩阵、所述语义组合句式向量以及预设的语义处理模型,计算距离函数值的步骤,具体包括:将所述初始文本向量进行非线性变换,得到非线性特征向量;将所述初始文本向量与所述非线性特征向量进行求和,得到连接矩阵;将所述连接矩阵与所述权重值矩阵进行加权求和,得到第一中间文本向量;将所述第一中间文本向量进行均方根标准化计算,得到第二中间文本向量;根据所述语义组合句式向量对预设的语义处理模型进行训练,得到多个特征表示向量;将所述第二中间文本向量与多个所述特征表示向量进行加权求和,得到第三中间文本向量;计算所述第三中间文本向量以及所述初始文本向量的距离,得到距离函数值;所述根据所述多个初始语句、所述语义错误率以及预设的错误率阈值,对初始语句进行调整,生成多个目的语句的步骤,具体包括:对所述语义错误语句进行语义提取,得到错误语料组合信息;判断所述语义错误率是否大于预设的错误率阈值;若是,则根据所述错误语料组合信息对所述语料组合顺序信息进行更改,得到更改后语料组合顺序信息,并返回至所述根据所述语料信息以及预设的语料组合顺序信息,生成多个初始语句的步骤;若否,则根据所述错误语料组合信息,确定所述语义错误语句的错误内容;根据所述错误内容,对所述语义错误语句进行更正,得到更正后语句;将所述语义正确语句与所述更正后语句进行整合,生成多个目的语句。

全文数据:

权利要求:

百度查询: 北京资采信息技术有限公司 一种语句生成方法、装置、终端设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。