厦门市美亚柏科信息股份有限公司吴顺平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门市美亚柏科信息股份有限公司申请的专利一种非结构化数据分析方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115617895B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211320729.8,技术领域涉及:G06F16/25;该发明授权一种非结构化数据分析方法及装置是由吴顺平;李俊莉;黄锴;鄢小征;袁泉;毕永辉设计研发完成,并于2022-10-26向国家知识产权局提交的专利申请。
本一种非结构化数据分析方法及装置在说明书摘要公布了:本申请提出了一种非结构化数据分析方法及装置,该方法包括以下步骤:S1、接收前端数据,并且将数据以大文本格式转到高速消息队列,以备消费处理;S2、将大文本格式的数据划分成多个词组,获得分词结果;S3、利用正则匹配对分词结果进行二次校验,筛选出待处理要素;以及S4、补全待处理要素的其他字段,组织成结构化数据并对结构构化数据进行存储。本申请能够简化数据要素的提取,提高数据提取性能,并结构化长期存储。通过提前配置提取规则,实现数据的流式自动化生产流入,自动化消费并执行提取,并把提取结果结构化。
本发明授权一种非结构化数据分析方法及装置在权利要求书中公布了:1.一种非结构化数据分析方法,其特征在于,包括以下步骤: S1、接收前端数据,并且将所述数据以大文本格式转到高速消息队列,以备消费处理,对所述大文本格式的数据进行标记处理,所述标记用于判断是否消费,若所述大文本格式的数据已进行标记处理,则直接结束进程,若所述大文本格式的数据未进行标记处理,则执行步骤S2的操作; S2、按特殊字符对所述大文本格式的数据进行分割拆分,划分成多个单独词语,所述特殊字符包括:逗号、句号、等号、分号、冒号、括号、中括号、与或非,将大文本格式的数据划分成多个词组,获得分词结果; S3、利用正则匹配对所述分词结果进行二次校验,筛选出待处理要素;以及 S4、补全所述待处理要素的其他字段,组织成结构化数据并对所述结构化数据进行存储。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门市美亚柏科信息股份有限公司,其通讯地址为:361000 福建省厦门市思明区软件园二期观日路12号102-402单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励