买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国平安人寿保险股份有限公司
摘要:本发明涉及大数据技术领域,公开了一种纠错词组候选项的筛选方法,包括:读取待纠错词组对应的多个候选项,分别测算每个候选项的初级权重值并进行排序,确定候选项的第一排序结果,根据第一排序结果,获取待纠错词组对应第一备选候选项;调用预置二级打分排序模型,分别测算第一备选候选项的二级权重值并进行排序,得到第一备选候选项的第二排序结果,获取待纠错词组对应的第二备选候选项,筛选第二备选候选项中二级权重值最高的第二备选候选项,并将对应第二备选候选项标注为目标候选项。本发明还公开了一种纠错词组候选项的筛选装置、设备及计算机可读存储介质。本发明为用户提供了更精准的纠错词组候选项的筛选服务,提高了风险监测的的准确性。
主权项:1.一种纠错词组候选项的筛选方法,其特征在于,所述纠错词组候选项的筛选方法包括以下步骤:读取待纠错词组对应的多个候选项;分别获取每个所述候选项的属性值,其中所述候选项的属性值包括词频、编辑距离及拼音jaccard距离;基于所述候选项的词频、编辑距离及拼音jaccard距离,分别计算所述候选项的初级权重值;其中,采用如下公式计算所述候选项的初级权重值:M=log10(T)-P-Q;其中,M表示候选项的初级权重值,T表示对应候选项的词频,P表示对应候选项的编辑距离,Q表示拼音jaccard距离;基于所述候选项的初级权重值,将所述候选项按权重值大小排序,得到第一排序结果;基于所述第一排序结果,获取所述待纠错词组对应的多个第一备选候选项;调用预置二级打分排序模型,分别测算所述第一备选候选项的二级权重值并进行排序,得到所述第一备选候选项的第二排序结果;基于所述第二排序结果,获取所述待纠错词组对应的多个第二备选候选项;筛选所述第二备选候选项中二级权重值最高的第二备选候选项,并将对应第二备选候选项标注为目标候选项。
全文数据:
权利要求:
百度查询: 中国平安人寿保险股份有限公司 纠错词组候选项的筛选方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。