买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明实施例公开了一种数据纠错方法、装置及服务器,该方法包括:获取用户输入的搜索词;将所述搜索词与预先创建的字典树进行匹配,得到匹配结果,所述字典树包括多个节点,所述多个节点中的每个节点用于表示参考词列表中参考词的一个分词片段;若所述匹配结果指示所述搜索词与所述字典树不匹配,则获取所述搜索词的特征向量,并根据所述搜索词的特征向量从所述参考词列表包括的多个参考词中确定出目标参考词;将数据库中与所述目标参考词匹配的内容作为所述搜索词的搜索结果。该方法可以准确地对搜索词进行自动化纠错,提升数据查询的效率和准确度。
主权项:1.一种数据纠错方法,其特征在于,应用于中小型门户网站对搜索词的纠错,包括:从数据库包括的内容中提取关键数据,所述关键数据包括多个关键词以及所述多个关键词中每个关键词的出现次数;获取用户一定时间内的搜索记录,所述用户搜索记录包括多个搜索词以及所述多个搜索词中每个搜索词的出现次数;根据所述关键数据和所述用户搜索记录创建参考词列表;获取用户输入的搜索词;将所述搜索词与预先创建的字典树进行匹配,得到匹配结果,所述字典树包括多个节点,所述多个节点中的每个节点用于表示参考词列表中参考词的一个分词片段;若所述匹配结果指示所述搜索词与所述字典树不匹配,则获取所述搜索词的特征向量,并根据所述搜索词的特征向量从所述参考词列表包括的多个参考词中确定出目标参考词;将数据库中与所述目标参考词匹配的内容作为所述搜索词的搜索结果;获取搜索词纠错日志,所述搜索词纠错日志包括多个纠错记录,所述多个纠错记录中的每个纠错记录包括输入的搜索词以及对应的目标参考词;获取根据所述搜索词纠错日志中出错的纠错记录输入的待添加参考词;将所述待添加参考词添加到所述参考词列表中,并更新所述字典树。
全文数据:
权利要求:
百度查询: 腾讯科技(深圳)有限公司 一种数据纠错方法、装置及服务器
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。