首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于人工智能的成句概率的处理方法、装置及相关设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国平安人寿保险股份有限公司

摘要:本发明公开了一种基于人工智能的成句概率的处理方法,应用于人工智能技术领域,用于解决对原始语料库中没有出现过的句子的成句概率的预测准确性低的技术问题。本发明提供的方法包括:判断语料库中是否存在与待识别的语句相同的句子,若否则对待识别的语句进行分词处理得到原始词语;统计各原始词语的初始上文先验概率;获取初始上文先验概率为零的原始词语得到第一词语;计算第一词语与语料库中各词语的相似度,根据计算出的相似度从语料库的各词语中确定替换词语,选用替换词语对第一词语进行替换得到替换语句;统计替换语句中各词语的上文先验概率,根据替换词语与第一词语的相似度及替换语句中各词语的上文先验概率得到待识别语句的成句概率。

主权项:1.一种基于人工智能的成句概率的处理方法,其特征在于,所述方法包括:获取待识别的语句;判断语料库中是否存在与所述待识别的语句相同的句子,若否,则对所述待识别的语句进行分词处理,得到多个原始词语;根据所述语料库中存储的所有句子,统计各所述原始词语的初始上文先验概率;从各所述原始词语中获取所述初始上文先验概率为零的原始词语,得到第一词语;计算所述第一词语与所述语料库中各词语的相似度,根据计算出的所述相似度从所述语料库的各词语中确定替换词语,选用所述替换词语对所述第一词语进行替换,得到与所述待识别的语句相对应的替换语句;统计所述替换语句中各词语的上文先验概率,根据所述替换词语与所述第一词语之间的相似度以及所述替换语句中各词语的上文先验概率得到所述待识别的语句的成句概率;所述根据所述替换词语与所述第一词语之间的相似度以及所述替换语句中各词语的上文先验概率得到所述待识别的语句的成句概率的步骤进一步包括,根据所述替换语句中各词语的上文先验概率计算所述替换语句的成句概率;将所述替换语句的成句概率与所述相似度的乘积作为所述待识别的语句的成句概率;所述相似度为余弦相似度,所述根据所述替换语句中各词语的上文先验概率计算所述替换语句的成句概率的步骤进一步包括:通过以下公式计算所述替换语句的成句概率:PW=Pw1*Pw2*Pw3*…*Pwn=Pw1*Pw2|w1*Pw3|w1w2*…*Pwn|w1w2w3…wn-1;其中,PW表示所述替换语句的成句概率,Pw1表示在所述语料库的各句子中词语w1出现在句首的概率,Pw2|w1表示词语w2出现在词语w1之后的概率,Pw3|w1w2表示词语w2出现在词语w1之后且词语w3出现在词语w2之后的概率,Pwn|w1w2w3…wn-1表示词语wn出现在词语wn-1之后且词语w3出现在词语w2之后的概率且词语w2出现在词语w1之后的概率,n表示所述替换语句包含的词语的总数量;所述根据所述替换词语与所述第一词语之间的相似度以及所述替换语句中各词语的上文先验概率得到所述待识别的语句的成句概率的步骤进一步包括:将所述替换语句的成句概率与所述余弦相似度的乘积作为所述待识别的语句的成句概率。

全文数据:

权利要求:

百度查询: 中国平安人寿保险股份有限公司 基于人工智能的成句概率的处理方法、装置及相关设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。