Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京羽乐创新科技有限公司杨泽获国家专利权

北京羽乐创新科技有限公司杨泽获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京羽乐创新科技有限公司申请的专利一种网页商户信息智能采集和解析的方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120086427B

龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510580124.X,技术领域涉及:G06F16/951;该发明授权一种网页商户信息智能采集和解析的方法及系统是由杨泽;李思萌设计研发完成,并于2025-05-07向国家知识产权局提交的专利申请。

一种网页商户信息智能采集和解析的方法及系统在说明书摘要公布了:本发明公开了一种网页商户信息智能采集和解析的方法及系统,通过智能网页抓取、智能字段识别、地址信息精确解析、智能商户分组和自动页面发现五个主要步骤实现商户信息的自动化采集。本发明摒弃了传统基于规则的提取方法,利用上下文语义分析和模式识别技术自动识别网页中的商户名称、电话号码和地址等信息,通过动态权重多维相似度计算方法实现字段的精准关联分组,并利用自动页面发现机制无需人工指定采集路径即可持续发现和采集商户信息。本发明突破了传统方法需针对不同网站编写特定规则、难以应对网页结构变化、无法处理多商户信息分组等技术瓶颈,适应各类网页结构变化,大幅提高了商户信息采集的自动化程度、准确性和效率。

本发明授权一种网页商户信息智能采集和解析的方法及系统在权利要求书中公布了:1.一种网页商户信息智能采集和解析的方法,其特征在于,包括: 根据商户品牌名称,对搜索引擎进行查询访问并解析搜索结果页面中的链接,构建初始URL抓取队列,采用浏览器自动化工具对所述初始URL抓取队列中的链接进行网页访问,获取网页DOM结构数据流; 利用所述网页DOM结构数据流,结合关键标识词和文本段落的语义关联,对网页内容进行商户名称、电话号码和地址的识别,生成候选字段集合; 对所述候选字段集合中的地址字段进行行政区划识别和地址成分解析,输出结构化地址数据; 针对所述候选字段集合,计算字段间的路径相似度、视觉邻近度和语义关联度,通过非线性融合确定字段间关联关系,生成结构化商户信息; 当获取新网页的网页DOM结构数据流,对所述新网页的网页DOM结构数据流中的链接进行文本内容和URL特征分析,识别包含商户信息的目标链接,将所述目标链接加入所述初始URL抓取队列,实现自动化信息采集; 其中,所述针对所述候选字段集合,计算字段间的路径相似度、视觉邻近度和语义关联度,通过非线性融合确定字段间关联关系,生成结构化商户信息,包括: 基于所述候选字段集合,计算候选字段XPath路径深度差异,生成路径相似度特征; 基于所述候选字段集合,计算DOM元素坐标距离,生成视觉邻近度特征; 基于所述候选字段集合,计算不同文本内容相关性,生成语义关联度; 基于所述路径相似度特征、所述视觉邻近度特征和所述语义关联度,执行径向基函数融合,输出字段间关联关系。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京羽乐创新科技有限公司,其通讯地址为:102200 北京市昌平区中关村科技园区昌平园超前路5号4幢2层220B;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。