基于深度学习的面向图像的端到端中文古诗词推荐方法

导航：龙图腾网> 最新专利技术> 基于深度学习的面向图像的端到端中文古诗词推荐方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：吴致远

摘要：本发明公开了一种基于深度学习的面向图像的端到端中文古诗词推荐方法，本发明首先对图像和中国传统古诗词两类数据进行自动化分析处理，分别得到图像和中文古诗词的特征提取模型，从而针对用户输入的图像，推荐合适的中文古诗词。与现有的古诗词推荐方法相比，本发明一方面考虑了中文古诗词的多标签假设充分提取了标签之间的相关性；另一方面现有大部分古诗词推荐方法先基于图像特征提取关键词信息然后基于关键词推荐古诗词，而本发明是基于图像推荐中文古诗词的端到端模型框架，直接根据提取的图像特征推荐中文古诗词，避免将关键词作为中间结果导致的信息缺失。

主权项：1.一种基于深度学习的面向图像的端到端中文古诗词推荐方法，其特征在于，包括以下步骤：步骤1：根据中文古诗词数据特点，在开源图像数据的基础上，进行图像的增减和标签空间的调整，并利用调整后的数据集完成图像特征提取模型的训练；所述步骤1包括以下子步骤：1.1在图像的标签空间中增加了诗词的意象和主题，记为Yitemm，得到图像数据训练集表示如下：其中，i为图像的索引，n为图像总数量，xi为图像像素特征，yi为图像的分类标签，并满足yi∈Ye∪Yitem，即yi属于原有标签集合Ye或新增标签集合Yitem；1.2利用图像数据训练集训练神经网络，训练损失为均方误差，优化策略为梯度下降，损失函数表示如下：其中，xi表示从训练集输入的图片，li表示图片对应的标签向量，F1表示用于图像标签预测的神经网络，||·||2是向量的L2范数，ΩF1表示神经网络的正则项，用于控制模型复杂度；将神经网络F1最后几层线性映射层丢弃，即获得图像特征提取模型，记为F1′；步骤2：从互联网收集中文古诗词构建诗词数据库，训练用于古诗词特征提取的Bert模型，提取数据库中诗词的特征向量；所述步骤2包括以下子步骤：2.1收集中文古诗词；2.2利用标签间的低秩假设提取标签和隐层特征间的相关性，矩阵的低秩假设通过最小化矩阵的奇异值之和进行近似；模型Bert的训练损失可以表示如下：其中，m表示古诗词总数量，x′j表示输入的某个古诗词，l′j表示诗词对应的标签向量，F2表示用于诗词标签预测的Bert模型，ΩF2表示Bert的正则项，用于控制模型复杂度，F2X′表示所有古诗词的预测标签矩阵，||·||*是核范数，用于计算矩阵奇异值之和；将Bert模型F2最后几层线性映射层丢弃，即获得中文古诗词特征提取模型，记为F2′；2.3确保图像特征提取模型F1′和中文古诗词特征提取模型F2′提取到的特征维度相同，将F1′和F2′结合相同线性映射模型，最后利用和交替优化图像特征提取模型F1′和中文古诗词特征提取模型f2′；其中，所述利用和交替优化图像特征提取模型F1′和中文古诗词特征提取模型F2′具体为：a固定F1′和F2′，根据图像数据和中文古诗词数据，分别用和计算线性映射模型参数的梯度并更新；b固定线性映射层，根据图像数据和中文古诗词数据，分别用和计算特征提取模型F1′和F2′的参数的梯度并更新；步骤3：输入图片，中文古诗词深度推荐模型推荐合适的古诗；所述步骤3具体为：针对用户输入的图像，利用图像特征提取模型F1′提取输入图像的特征，记特征向量为F1′x，同时利用F2′提取诗词库中所有诗词的特征，生成对应特征向量，记第j首诗词的特征向量pj，所有特征向量组成的矩阵为P；已知模型F1′和F2′提取的特征在同一特征空间中，即F1′x与P位于同一特征空间，直接用该特征空间内的欧氏距离衡量输入图像与诗词的距离，并选择最邻近诗词进行推荐，即求解以下最小化问题，其中，诗词的索引j满足1≤j≤m，m表示古诗词总数量，表示返回使式子最小化时j的取值，pj是第j首诗词的特征向量，||·||2是向量的L2范数。

全文数据：

权利要求：

百度查询：吴致远基于深度学习的面向图像的端到端中文古诗词推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种变压器电磁温度流体多物理场间接耦合计算方法及系统

下一篇：用于确定泡沫生产的参数的系统和方法

相关技术

一种变压器电磁温度流体多物理场间接耦合计算方法及系统

用于确定泡沫生产的参数的系统和方法

一种轮胎X光检验机输送定位系统及工作方法

一种地表及地下浅层铀矿化的探测方法

基于鸿蒙系统的Web端与原生同步通信方法、系统及产品

基于高强柔性索环连接的混凝土圆形筒状结构与预制筒片

植物的耐热性或耐干燥性提高剂、耐盐性提高剂、活性提高剂

一种光伏构件

具备适应不同体型患者的呼吸内科胸腔穿刺辅助装置

一种变电站光伏系统发电量与站用电负荷匹配的控制系统及控制方法

一种煤矿井下风水管路在线监测系统

一种汽车电子设备和菊花链通信的超时复位系统

端相关技术

一种基于语义理解的端到端文本匹配辅助标注方法_上交所技术有限责任公司_202410947826.2

基于动态混合标签分配的端到端目标检测方法及系统_厦门理工学院_202411154081.0

一种端到端多尺度风格迁移的歌声转换方法及系统_中国科学院声学研究所_202410944150.1

一种连接探测方法、客户端、服务端、系统与存储介质_华为技术有限公司_202110713070.1

一种风速多尺度级联增强端到端预测方法_中南大学_202410974386.X

一种滤芯端盖的制作方法及滤芯端盖及滤芯_浙江开能润鑫电器有限公司_202411084560.X

一种基于企业业务流程地图的端到端流程贯通方法及装置_中国航空工业集团公司沈阳飞机设计研究所_202411051166.6

一种微服务端到端链路的可视化管理系统及方法_贵州电网有限责任公司_202410863052.5

一种类脑多模态模型端到端预训练装置及方法_同济大学_202411018453.7

一种针对噪声的新型端到端旋转机械故障诊断框架_东北林业大学_202410992892.1

中文相关技术

一种中文长文本特征提取方法及装置_国家电网有限公司大数据中心_202411089604.8

一种扫描跟踪中文图形化快速编程自动化焊接系统_山东万德自动化科技有限公司_202411294138.7

一种基于知识蒸馏技术的中文事件抽取方法_郑州大学_202410979697.5

基于拼音嵌入增强和多层信息融合的中文机器阅读理解方法和装置_浙江工业大学_202410567560.9

基于大型语言模型的中文小样本实体关系联合抽取方法及系统_西安交通大学_202410951777.X

面向中文医疗文本的异常检测方法、装置、设备和介质_香港中文大学(深圳)_202411031446.0

一种基于中文语义增强的法律文书实体抽取方法_上海交通大学_202410987528.6

一种中文资讯热点事件生成系统_车智互联(北京)科技有限公司_202411219744.2

中文地址加密方法、装置、设备及存储介质_深圳市智慧城市科技发展集团有限公司_202411390819.3

基于改进YOLOv5的中文标注手势识别方法与系统_扬州大学_202111551115.6

图像相关技术

预测图像生成装置、运动图像解码装置、运动图像编码装置以及预测图像生成方法_夏普株式会社_201980087778.1

用于对数字图像记录中的图像模糊进行图像校正的方法_威克胜成像有限公司_202380030427.3

图像处理装置、图像处理系统、存储介质及图像处理方法_富士胶片商业创新有限公司_201910832308.5

图像编码/解码设备和发送图像数据的设备_LX半导体科技有限公司_202411300002.2

图像处理设备和图像处理系统_索尼集团公司_202380029653.X

图像处理装置、图像处理方法和程序_索尼集团公司_202380029511.3

图像获取方法、图像获取装置和晶片检查装置_细美事有限公司_202111003805.8

图像处理设备、图像处理方法和程序_佳能株式会社_202380030899.9

距离图像摄像装置以及距离图像摄像方法_凸版控股株式会社_202380030309.2

图像形成装置_京瓷办公信息系统株式会社_202410581604.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于深度学习的面向图像的端到端中文古诗词推荐方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务