买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:江苏中威科技软件系统有限公司
摘要:本发明公开一种人工造句自动生成实体训练成果的装置,包括数据收集模块,数据分析模块,实体训练模块,实体校验模块,数据更新模块,数据收集模块采用excel收集数据并设立数据列表规则;数据分析模块分析收集的数据,对数据进行自动标注;实体训练模块将上述数据进行规则字段转换,获取训练模型数据,将训练模型数据输入到训练模型中,进行训练;实体校验模块对标注出来的实体数据进行双层校验;数据更新模块对执行的数据进行二次训练,并针对性的在线覆盖解决原先的错误数据,本发明创新了一种能够直接利用数据表或者数据库,在人工造句建立训练模型的同时,建立起训练的对象和训练要素的逻辑关系,从而自动实现训练目标,有利于提升训练准确度。
主权项:1.一种人工造句自动生成实体训练成果的装置,其特征在于:包括数据收集模块,数据分析模块,实体训练模块,实体校验模块,数据更新模块,所述数据收集模块采用excel收集数据并设立数据列表中的行、列规则,所述数据收集模块中列表中的行、列规则为第一行表示需要标注的内容,其中在第一行字段中,第一个字段表示为造句内容,后续字段表示为需要对语句采集标注的内容信息;列字段规则为可设置为表示时间、身份证、电话号码;所述数据分析模块分析获取导入到系统中收集的数据,并对数据进行自动标注,所述数据分析模块具体分析过程为:分析系统中导入的excel数据,自动解析excel中的表头,获取表头对应的实体属性,并在导入数据的系统中自动将语句上的实体标注起来;所述实体训练模块用于将上述数据进行规则字段转换,获取训练模型数据,将训练模型数据输入到训练模型中,进行模型训练;所述实体校验模块用于对标注出来的实体数据进行双层校验,若数据不正确,则再次进行标注;所述数据更新模块用于在线或者离线状态下,对执行的数据进行二次训练,并针对性的覆盖原先数据;所述数据更新模块包括数据在线更新模块,数据离线更新模块;数据在线更新模块是在线状态下,在系统中对执行的数据修正后,直接导入训练模型中二次训练,针对性的覆盖解决原先的错误数据;数据离线更新模块是指针对训练后的数据,利用训练模型推理出来的数据内容,按照excel原样进行反向导出,并进行排错、标记数据后,二次导入到训练模型中,然后再次训练,并覆盖解决原先的错误数据。
全文数据:
权利要求:
百度查询: 江苏中威科技软件系统有限公司 一种人工造句自动生成实体训练成果的装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。