买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国农业科学院都市农业研究所
摘要:本发明涉及农村信息化技术领域,具体为一种非固定格式表格信息自动检索和自动填表系统;包括信息预处理单元、第一数据单元、第二数据单元和信息存储单元,其中:信息预处理单元用于获取待处理表格信息,并提取表格中文字和表格格式,生成json数据,将所得到的json数据可视化编辑后,转换成md格式数据;第一数据单元用于将md格式表格的数据按照固定大小切割成小表格并保留表头,并将切割的小表格转换成向量数据,并存储于信息存储单元中;本发明所提供的非固定格式表格信息自动检索和自动填表系统,降低了填表工作人员的工作负担,提高了工作效率,并且降低了错误率,提高了农业农村数字化水平,改善了农民生活。
主权项:1.一种非固定格式表格信息自动检索和自动填表系统,其特征在于,包括信息预处理单元100、第一数据单元200、第二数据单元300和信息存储单元400,其中:所述信息预处理单元100用于获取待处理表格信息,并提取表格中文字和表格格式,生成json数据,将所得到的json数据可视化编辑后,转换成md格式数据;所述第一数据单元200用于将md格式表格的数据按照固定大小切割成小表格并保留表头,并将切割的小表格转换成向量数据,并存储于信息存储单元400中,所述第一数据单元200与信息预处理单元100连接;所述第二数据单元300用于将空表格中表头和目录信息转换成向量数据,然后再匹配向量数据库中向量数据,筛选相似度最高的向量数据,并把向量数据格式转换成对应的文本语句,以及用于定位并筛选出表格的内容,生成md格式的表格,并将md表格转换成json数据,然后可视化生成可以编辑的表格,所述第二数据单元300与信息预处理单元100和第一数据单元200均连接;所述信息存储单元400用于存储所接收的信息,所述信息存储单元400与第一数据单元200和第二数据单元300均连接。
全文数据:
权利要求:
百度查询: 中国农业科学院都市农业研究所 一种非固定格式表格信息自动检索和自动填表系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。