Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文本处理方法、装置、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安国际智慧城市科技股份有限公司

摘要:本发明涉及人工智能,提供一种文本处理方法、装置、设备及存储介质。该方法根据项目标识及项目信息生成待申请项目的目标项目向量,获取历史项目的历史项目向量,根据目标项目向量与历史项目向量的项目相似度统计历史项目中大于第一预设阈值的项目数量,根据项目数量从历史项目中提取待申请项目的相似项目,获取相似项目中申报成功的文本作为成功申报文本,根据待申报文本与每个成功申报文本的文本相似度,生成待申报文本对于待申请项目的申报成功率,若申报成功率小于预设成功率阈值,基于预设成功率阈值从待申报文本中筛选出目标段落进行标识,能够准确的标识出目标段落。此外,本发明还涉及区块链技术,所述申报成功率可存储于区块链中。

主权项:1.一种文本处理方法,其特征在于,所述文本处理方法包括:获取待申请项目的项目标识及项目信息;根据所述项目标识及所述项目信息生成所述待申请项目的目标项目向量,包括:从第一预设向量映射表中获取与所述项目标识中每个标识符对应的标识编码;根据每个标识符在所述项目标识中的顺序拼接所述标识编码,得到第一项目向量;基于预设词典对所述项目信息进行划分,得到多个划分路径及每个划分路径的路径分词;获取所述路径分词在所述预设词典中的词典权值,并计算每个划分路径中所述词典权值的总和,得到路径分数;将所述路径分数最大的划分路径所对应的路径分词确定为项目分词;基于预设停用词对所述项目分词进行清洗处理,得到目标分词;基于第二预设向量映射表对所述目标分词进行编码,得到多个分词向量;基于所述目标分词在所述项目信息中的位置拼接所述多个分词向量,得到第二项目向量;根据所述第一项目向量及所述第二项目向量生成目标项目向量,所述目标项目向量用于表征所述待申请项目;获取历史项目的历史项目向量,所述历史项目向量用于表征所述历史项目;根据所述目标项目向量与所述历史项目向量的项目相似度统计所述历史项目中大于第一预设阈值的项目数量;根据所述项目数量从所述历史项目中提取所述待申请项目的相似项目;获取所述相似项目中申报成功的文本作为成功申报文本,并获取待申报文本;根据所述待申报文本与每个成功申报文本的文本相似度,生成所述待申报文本对于所述待申请项目的申报成功率;若所述申报成功率小于预设成功率阈值,则基于所述预设成功率阈值从待申报文本中筛选出目标段落进行标识。

全文数据:

权利要求:

百度查询: 平安国际智慧城市科技股份有限公司 文本处理方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。