买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京搜狗科技发展有限公司
摘要:本发明实施例提供了一种数据处理方法、装置和用于数据处理的装置。其中的方法具体包括:依据网页源码所包括的页面元素,对网页进行分块,以得到所述网页包括的多个页面块;确定所述页面块所对应图片的图片特征;所述图片特征包括:图片周围环绕文本特征和页面结构特征;依据所述图片特征,判断对应的图片是否为目标图片。本发明实施例可以节省网页的渲染过程中消耗的系统资源和时间资源,且可以提高目标图片的召回效率。
主权项:1.一种数据处理方法,其特征在于,所述方法包括:依据网页源码中的页面元素,得到对应的一维向量;依据预设边界元素,对所述一维向量进行分块,以得到网页包括的多个页面块;其中,所述预设边界元素包括:样式元素、脚本元素、注释元素、外部内容元素、或者包含非数字标识的元素;确定所述页面块所对应图片的图片特征;所述页面块所对应图片的图片特征包括:图片周围环绕文本特征和页面结构特征;所述页面结构特征包括图片对应的页面块特征、和或、图片周围页面元素特征,所述页面块特征包括针对页面块的图片特征;所述页面块特征包括针对页面块对应的图片所提取的图片特征;依据所述页面块所对应图片的图片特征,判断对应的图片是否为目标图片。
全文数据:
权利要求:
百度查询: 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。