恭喜平安科技(深圳)有限公司李鹏宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜平安科技(深圳)有限公司申请的专利一种文本数据集管理方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114328844B 。
龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210026588.2,技术领域涉及:G06F16/334;该发明授权一种文本数据集管理方法、装置、设备及存储介质是由李鹏宇;李剑锋设计研发完成,并于2022-01-11向国家知识产权局提交的专利申请。
本一种文本数据集管理方法、装置、设备及存储介质在说明书摘要公布了:本发明涉及大数据技术领域,揭露了一种文本数据集管理方法、装置、设备及存储介质,方法包括:根据查询需求从索引库中搜索最相关的预设数量个候选文本数据集;从数据库中读取每一候选文本数据集的元数据,并利用所述元数据确定每一候选文本数据集与查询需求之间的匹配度;根据匹配度从预设数量个候选文本数据集中选择至少一个符合查询需求的候选文本数据集;从分布式文件系统中读取候选文本数据集包含的样本。通过索引库检索候选文本数据集、查询数据库获取候选文本数据集的元数据用于进一步计算匹配度、读取分布式文件系统获取最终数据集的样本,相对于现有技术中使用数据库管理文本数据集,能够使得数据集检索更加快捷,便于远程使用数据集。
本发明授权一种文本数据集管理方法、装置、设备及存储介质在权利要求书中公布了:1.一种文本数据集管理方法,其特征在于,所述方法包括: 根据用户输入的查询需求从索引库中搜索最相关的预设数量个候选文本数据集; 从数据库中读取每一候选文本数据集的元数据,并利用所述元数据确定每一候选文本数据集与所述查询需求之间的匹配度; 根据所述匹配度从预设数量个候选文本数据集中选择至少一个符合所述查询需求的候选文本数据集; 从分布式文件系统中读取所选候选文本数据集包含的样本; 所述利用所述元数据确定每一候选文本数据集与所述查询需求之间的匹配度,包括: 针对每一候选文本数据集,确定所述候选文本数据集的元数据与所述查询需求之间的第二相似度;利用所述第二相似度和所述候选文本数据集对应的第一相似度确定所述匹配度,所述第一相似度为所述查询需求中主要关键词与所述索引库中简要描述词之间的匹配度; 所述根据所述匹配度从预设数量个候选文本数据集中选择至少一个符合所述查询需求的候选文本数据集,包括: 按照匹配度对预设数量个候选文本数据集进行倒序排列,将候选文本数据集的排列结果以列表方式输出展示;在接收到用户针对一个候选文本数据集的第一查看请求时,将用户选择的候选文本数据集的元数据输出展示;在接收到用户针对多个候选文本数据集的第二查看请求时,对用户选择的多个候选文本数据集的元数据进行汇总后输出展示;在接收到用户选定的候选文本数据集时,将用户选定的候选文本数据集作为符合所述查询需求的候选文本数据集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518048 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。