买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明实施例公开了一种文本分析方法、装置及计算机设备,所述方法包括:获取待分析的文本;将所述文本输入预先训练的物料文本提取模型,提取包含物料特征的物料文本;将所述物料文本输入预先训练的物料单元分割模型,得到所述物料文本中对应的各物料单元及标记结果;将所述物料单元输入预先训练的型号提取模型,提取所述物料单元中各物料的物料型号;将各物料的型号输入预先训练的型号分析模型,得到物料型号分析结果。通过上述方法,可以实现对工程量文本中的物料单元进行精准切分,对物料单元进行语义层面的精细分析,对物料型号进行精准提取与解析;提高了工程量文本语义分析的效率和准确度。
主权项:1.一种文本分析方法,其特征在于,所述方法包括:获取待分析的文本;将所述文本输入预先训练的物料文本提取模型,提取包含物料特征的物料文本,其中,所述物料特征包括物料用量及物料信息,物料信息包括物料类型、物料名称、物料型号中的至少一种;将所述物料文本输入预先训练的物料单元分割模型,得到所述物料文本中对应的各物料单元及标记结果,其中,所述物料单元包括同时包含物料名称、物料型号和物料用量的至少一个文本块;将所述物料单元输入预先训练的型号提取模型,提取所述物料单元中各物料的物料型号;将各物料的物料型号输入预先训练的型号分析模型,得到物料型号分析结果;其中,所述将所述物料文本输入预先训练的物料单元分割模型,得到所述物料文本中对应的各物料单元及标记结果,包括:将所述物料文本根据分隔符分割为多个文本块;将所述多个文本块输入所述物料单元分割模型进行处理,输出多个物料单元;对物料单元中缺失的量词进行补充;其中,所述将所述多个文本块输入所述物料单元分割模型进行处理,包括:将所述多个文本块按照在所述物料文本中的顺序输入所述物料单元分割模型;若所述文本块中同时包含物料名称、物料型号和物料用量,则将所述文本块标记为物料单元;若所述文本块中不同时包含物料名称、物料型号和物料用量,则继续输入下一个文本块,直至输入的全部文本块中累积包含物料名称、物料型号和物料用量,将全部文本块的组合标记为物料单元。
全文数据:
权利要求:
百度查询: 湖南特能博世科技有限公司 文本分析方法、装置及计算机设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。