买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江有数数智科技有限公司
摘要:本申请涉及电数字数据处理技术领域,特别是涉及一种网页中人物识别的处理方法、装置、设备及介质。该方法包括:获取目标网页文档对应的文档对象模型树;按照从根节点向下的顺序依次判断文档对象模型树中的节点是否满足第一预设条件,若不满足,则继续判断下一节点;否则,停止判断;如果存在满足第一预设条件的节点,则获取其对应的子树集合;如果集合满足第二预设条件,则判断集合中每一子树是否满足第三预设条件;如果集合中每一子树均满足第三预设条件,则判定集合中每一子树对应一个人物,并对集合中每一子树进行解析,获取集合中每一子树对应的人物的信息。本发明能够从网页的HTML文档中提取网页展示的人物的相关信息。
主权项:1.一种网页中人物识别的处理方法,其特征在于,所述处理方法包括以下步骤:获取目标网页文档;所述目标网页文档为HTML语言的网页文档;获取目标网页文档对应的文档对象模型树;所述文档对象模型树包括若干节点;按照从所述文档对象模型树的根节点向下的顺序依次判断所述文档对象模型树中的节点是否满足第一预设条件,若不满足,则继续判断下一节点;否则,停止判断;所述第一预设条件包括:节点包括大于等于2个的子节点,且节点包括的子节点的类型均相同;如果所述文档对象模型树中存在满足第一预设条件的节点,则获取满足第一预设条件的节点对应的子树集合;所述子树集合中子树的数量为满足第一预设条件的节点包括的子节点的数量,且所述子树集合中每一子树的根节点均为满足第一预设条件的节点的子节点;判断所述子树集合是否满足第二预设条件;所述第二预设条件包括:子树集合中不同子树包括的节点数量相同,子树集合中不同子树包括的节点的类型相同,且子树集合中不同子树包括的相同类型的节点在对应子树中的位置相同;如果所述子树集合满足第二预设条件,则判断所述子树集合中每一子树是否满足第三预设条件;所述第三预设条件包括:子树集合中每一子树均包括第一预设类型的节点;如果所述子树集合中每一子树均满足第三预设条件,则判定所述子树集合中每一子树对应一个人物,并对所述子树集合中每一子树进行解析,获取所述子树集合中每一子树对应的人物的信息。
全文数据:
权利要求:
百度查询: 浙江有数数智科技有限公司 一种网页中人物识别的处理方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。