北京百度网讯科技有限公司王首勋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京百度网讯科技有限公司申请的专利确定文档标签的方法、装置、电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114048315B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111365672.9,技术领域涉及:G06F40/20;该发明授权确定文档标签的方法、装置、电子设备和存储介质是由王首勋;王安琦;靳雨霏设计研发完成,并于2021-11-17向国家知识产权局提交的专利申请。
本确定文档标签的方法、装置、电子设备和存储介质在说明书摘要公布了:本公开提供了一种确定文档标签的方法,涉及计算机技术领域,尤其涉及自然语言处理技术和文档推荐技术。具体实现方案为:对目标文档进行切词处理,得到M个第一字段,其中,M为大于1的整数;将M个第一字段与预定词库中的多个预定字段进行匹配,得到N个目标字段,其中,N为大于或等于1的整数;以及根据N个目标字段,确定目标文档的标签。本公开还提供了一种确定文档标签的装置、电子设备和存储介质。
本发明授权确定文档标签的方法、装置、电子设备和存储介质在权利要求书中公布了:1.一种确定文档标签的方法,包括: 对目标文档进行切词处理,得到M个第一字段,其中,M为大于1的整数; 将所述M个第一字段与预定词库中的多个预定字段进行匹配,得到N个目标字段,包括:响应于所述M个第一字段中存在语义相同的至少两个第一字段,重复执行以下操作之一,得到K个语义不同的第一字段,其中,K是大于或等于1的整数:响应于所述语义相同的至少两个第一字段中每个第一字段的长度均大于或等于预设长度阈值,删除所述语义相同的至少两个第一字段中长度最长的第一字段;响应于所述语义相同的至少两个第一字段中存在长度小于所述预设长度阈值的第一字段,删除所述语义相同的至少两个第一字段中长度最小的第一字段;根据所述K个语义不同的第一字段,得到所述N个目标字段,N为大于或等于1的整数; 根据所述N个目标字段中每个目标字段在所述目标文档中的词频,确定每个目标字段的第一权重; 根据所述N个目标字段中每个目标字段在目标文档中的位置,确定每个目标字段的第二权重,所述N个目标字段包括位于目标文档的正文中的目标字段和位于目标文档的标题中的目标字段,位于所述目标文档的标题中的目标字段的第二权重大于位于所述目标文档的正文中的目标字段的第二权重; 根据每个目标字段的第一权重和每个目标字段的第二权重,确定每个目标字段的第三权重; 根据N个目标字段的第三权重,确定所述目标文档的标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦2层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励