买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨工业大学(威海);长江时代通信股份有限公司
摘要:本发明公开了一种基于一致性模型的文生图方法,步骤包括:使用原始数据集来训练Tokenizer和变分自编码器;将Tokenizer和变分自编码器用于处理原始的图像和文本对,将图像和文本对转化为图像特征向量和文本特征向量对;构建文本条件生成的一致性模型并进行训练;由Tokenizer、随机采样高斯噪声、一致性模型以及变分自编码器的解码器构建推理模型,将待生成文本输入至Tokenizer,从变分自编码器的解码器处获得生成的图像。该文生图方法利用Tokenizer嵌入文本信息,利用变分自编码器压缩数据集,实现一步采样,且在训练过程中,只需训练单个条件采样器,节省了训练的时间。
主权项:1.一种基于一致性模型的文生图方法,其特征在于,包括如下步骤:步骤1,使用原始的包含相对应的图像和文本对的原始数据集来训练Tokenizer和变分自编码器,Tokenizer用于将离散的文本条件转化为连续的文本特征向量,变分自编码器用于压缩图像数据的维度获得图像特征向量;步骤2,将训练好的Tokenizer和变分自编码器用于处理原始数据集中的图像和文本对,将图像和文本对转化为图像特征向量和文本特征向量对,并将图像特征向量和文本特征向量对作为训练一致性模型的训练数据集;步骤3,构建文本条件生成的一致性模型,并利用训练数据集对一致性模型进行训练;步骤4,由Tokenizer、随机采样高斯噪声、一致性模型以及变分自编码器的解码器构建推理模型,在推理模型中,Tokenizer的输出结果以及随机采样高斯噪声一起输入至一致性模型,一致性模型的输出结果输入到变分自编码器的解码器中,将待生成文本输入至Tokenizer,从变分自编码器的解码器处获得生成的图像。
全文数据:
权利要求:
百度查询: 哈尔滨工业大学(威海) 长江时代通信股份有限公司 一种基于一致性模型的文生图方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。