Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

检测叠词错误的方法、装置及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:新方正控股发展有限责任公司;北京北大方正电子有限公司

摘要:本发明提供一种检测叠词错误的方法、装置及系统,该方法包括:获取文本,并得到多个待检测文本,且获得待检测文本中的重复词组;对重复词组所在的原始文本片段进行分词,检测是否存在相邻叠词;若存在相邻叠词,将相邻叠词的词性在预设词性数据库中进行匹配;若匹配成功,则将原始文本片段中的一个叠词进行删除得到待检测文本片段,并得到原始文本片段和待检测文本片段的使用概率;若原始文本片段的使用概率小于待检测文本片段的使用概率,则确定相邻叠词在原始文本片段中使用错误。实现了叠词误用的判断,提高检测的准确率和检测速度,且能够适应不同长度的句子,进而提高长句叠词判断的准确率。

主权项:1.一种检测叠词错误的方法,其特征在于,包括:获取文本,并得到所述文本中的标点符号、字符串信息;根据所述标点符号、所述字符串信息得到多个待检测文本,且获得所述待检测文本中的重复词组;对所述重复词组所在的原始文本片段进行分词,检测是否存在相邻叠词;若存在所述相邻叠词,将所述相邻叠词的词性在预设词性数据库中进行匹配;若匹配成功,则将所述原始文本片段中的一个叠词进行删除得到待检测文本片段,并根据所述原始文本片段与所述待检测文本片段,设置移动窗口的参数;根据所述移动窗口的大小参数,所述移动窗口分别从所述原始文本片段、所述待检测文本片段中所述叠词位置开始,依次向两端部分位置移动,获得除去所述叠词的多个目标检验字;通过预设语言模型,分别检测所述目标检验字在所述原始文本片段、所述待检测文本片段中的使用概率后,确定所述原始文本片段和所述待检测文本片段的使用概率;若所述原始文本片段的使用概率小于所述待检测文本片段的使用概率,则确定所述相邻叠词在原始文本片段中使用错误。

全文数据:

权利要求:

百度查询: 新方正控股发展有限责任公司 北京北大方正电子有限公司 检测叠词错误的方法、装置及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。