买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广州启生信息技术有限公司
摘要:本发明提供一种文章自动配图方法,包括:图片库预处理获取归一化图库;根据所述归一化图库执行模型向量运算获取图片向量列表;根据所述归一化图库执行图片转文本运算获取文本向量列表;根据所述图片向量列表和所述文本向量列表执行第一去重运算获取第一去重MD5列表;根据所述图片向量列表和所述文本向量列表执行第二去重运算获取标题列表向量;根据所述图片向量列表和所述标题向量列表执行相等标题图片的COS余弦相似度去重比较;根据文章内容执行文本配图指令;解决了传统的配图技术人工方式的工作量大,缺乏灵活性问题。
主权项:1.一种文章自动配图方法,其特征在于,包括:图片库预处理获取归一化图库,包括图片像素修改、执行图片裁剪指令、执行图片的比例缩放指令;根据所述归一化图库执行模型向量运算获取图片向量列表;根据所述归一化图库执行图片转文本运算获取文本向量列表;所述图片转文本运算包括BLIP模型运算和CLIP模型运算;根据所述归一化图库执行递归遍历,比较图片文件的MD5字串,执行第一重复图片删除运算获取第一去重图片列表;根据所述第一去重图片列表和所述图片向量列表执行第二去重运算获取第二去重图片列表;其中所述的第二去重运算包括:根据所述第一去重图片列表提取图片标题执行比较运算;如果所述图片标题相等执行图片相似度比较运算,其中所述相似度比较为根据所述图片向量列表执行余弦相似度比较;如果所述图片相似度比较90%,判定为重复图片;执行所述第一去重图片列表删除并获取第二去重图片库;执行所述文本向量列表和所述第二去重图片库存储指令,将所述图库元数据列表保存于磁盘;根据文章内容执行文本配图指令,包括:执行LLM模型运算获取配图标题列表;根据所述配图标题列表执行CLIP模型向量运算获取配图标题向量列表;根据所述配图标题向量列表和所述图片向量列表执行COS余弦相似度运算获取第一文章配图相似度列表;根据所述配图标题向量列表和所述文本向量列表执行COS余弦相似度运算获取第二文章配图相似度列表;根据所述第一文章配图相似度列表和第二文章配图相似度列表执行平均相似度大于等于0.7的阈值相似度列表获取;跟据所述阈值相似度列表和所述第二去重图片获取倒序排名列表;根据所述倒序排名列表获取前N个图片。
全文数据:
权利要求:
百度查询: 广州启生信息技术有限公司 一种文章自动配图方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。