买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:土巴兔集团股份有限公司
摘要:本发明公开一种利用词根表进行数据查询的方法、设备及存储介质。所述方法包括:接收用户输入的第一查询指令,获取所述第一查询指令的中文关键词;将所述中文关键词进行分词,得到至少一个中文词根;根据预设中英文对照的词根表,获取与所述多个中文词根对应的多个英文词根;将所述多个英文词根进行组合,生成英文关键字;根据所述英文关键字,生成第二查询指令,响应所述第二查询指令,获取数据库中与所述英文关键字相关的数据。本发明公开的利用词根表进行数据查询的方法有利于关键字的维护以及数据库的管理。
主权项:1.一种利用词根表进行数据查询的方法,其特征在于,包括:接收用户输入的第一查询指令,获取所述第一查询指令的中文关键词;基于字符串匹配的分词方法将所述中文关键词进行分词,得到至少一个中文词根;基于统计以及预设机器学习的分词方法对所述至少一个中文词根进行检测,在未检测到不符合条件的分词后,根据预设中英文对照的词根表,获取与至少一个中文词根对应的多个英文词根;将所述多个英文词根进行组合,生成英文关键字;根据所述英文关键字,生成第二查询指令;预设Stopwords词汇表,所述Stopwords词汇表的作用是在全文检索过程中忽略非常常用的单词;数据库中的数据经所述预设Stopwords词汇表过滤之后,保留有效文本数据;响应所述第二查询指令,遍历所述有效文本数据包含的每个字符;判断所述有效文本数据与所述英文关键字的匹配度是否大于预设值;当所述有效文本数据与所述英文关键字的匹配度大于预设值,则所述有效文本数据对应的数据作为与所述英文关键字相关的数据。
全文数据:
权利要求:
百度查询: 土巴兔集团股份有限公司 一种利用词根表进行数据查询的方法、设备、及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。