买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国科学院信息工程研究所
摘要:本发明公开了一种基于布局感知的文档合成方法及装置,涉及文档数据处理领域,对布局生成模型生成的布局进行质量评估、筛选和校正,根据校正的布局创建文档融合模板,根据文档融合模板进行文本容量预估;基于约束条件构建提示语,输入到LLM模型学习生成符合约束条件的文本;根据文档融合模板的布局元素进行文本自适应处理和图表自适应选择;将文本和图表按照文档融合模板的布局结构进行填充融合,生成合成文档。本发明从布局结构和语义信息两方面对合成文档的仿真性和可用性进行了提高,解决了当前合成文档技术中存在的问题,具有良好的效果。
主权项:1.一种基于布局感知的文档合成方法,其特征在于,包括以下步骤:对布局生成模型针对文档生成的初始布局进行质量评估,筛选出可用布局结构;对可用布局结构进行布局自动校正,调整布局元素的位置和尺寸,得到校正的布局;根据校正的布局创建文档融合模板,其布局元素由文本类元素和图表类元素组成;根据文档融合模板的文本类元素的数值几何属性进行文本容量预估;将预估值、目标输入约束以及预设的由样本输入约束和样本输出文本的样本对作为约束条件,构建提示语;将提示语输入到大语言模型LLM模型中,通过对样本对的学习,生成符合约束条件的文本;根据文档融合模板的文本类元素的数值几何属性,对生成的文本进行文本自适应处理;根据文档融合模板的图表类元素的数值几何属性,从图表素材库中进行图表自适应选择;通过文本自适应处理和图表自适应选择,将文本和图表按照文档融合模板的布局结构进行填充融合,生成合成文档。
全文数据:
权利要求:
百度查询: 中国科学院信息工程研究所 一种基于布局感知的文档合成方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。