结合CNN和Transformer的多特征融合对联生成方法

导航：龙图腾网> 最新专利技术> 结合CNN和Transformer的多特征融合对联生成方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：重庆大学

摘要：本发明公开了结合CNN和Transformer的多特征融合对联生成方法，包括以下步骤，在数据预处理阶段，分别构建带词性特征和平仄特征的对联语料库；根据对联上联构建结合词性特征和平仄特征的多特征融合词向量。将对联上联的多特征融合词向量分别输入到CNN编码器和Transformer模型的编码器中进行对联特征提取和对联语义编码，分别得到特征编码向量和语义编码向量。将特征编码向量和语义编码向量结合起来输入到Transformer模型的解码器中。本方法将对联的词性特征和平仄特征加入到词向量中，得到多特征融合的词向量。多特征融合的词向量能提高生成对联的对仗性；将CNN模型和Transformer模型结合起来，强化对联的重点信息，提高生成对联的语义连贯性。

主权项：1.结合CNN和Transformer的多特征融合对联生成方法，其特征在于，包括以下步骤：步骤1.在数据预处理阶段，分别构建带词性特征和平仄特征的对联语料库；步骤2.根据对联上联构建结合词性特征和平仄特征的多特征融合词向量；步骤3.将对联上联的多特征融合词向量分别输入到CNN编码器和Transformer模型的编码器中进行对联特征提取和对联语义编码，分别得到特征编码向量和语义编码向量；步骤4.将特征编码向量和语义编码向量结合起来输入到Transformer模型的解码器中；步骤5.Transformer模型的解码器根据对联语料库预测并输出下联；步骤1中分别构建带词性特征和平仄特征的对联语料库具体如下：S11.获取对联语料库；S12.对对联语料库里的对联数据进行逐字分词；S13.采用LTP对分词后的对联语料进行词性特征标注，得到具有词性特征的对联语料库；S14.采用Python中的PyPinyin对分词后的对联语料进行拼音标注，然后根据拼音音调与平仄音调的转换规则将拼音转换成为平仄特征，得到具有平仄特征的对联语料库；其中拼音音调与平仄音调的转换规则为：拼音音调的一二声为平声，拼音音调的三四声为仄声；步骤2中多特征融合词向量构建过程如下：S21.对对联上联进行逐字分词；S22.根据分词后的上联数据构建语义向量；S23.采用LTP对分词后的上联的每个字进行词性特征标注，然后根据标注有词性特征的上联数据构建词性特征向量；S24.采用PyPinyin对分词后的上联的每个字进行拼音标注，然后根据拼音音调与平仄音调的转换规则将拼音转换成为平仄特征，得到标注有平仄特征的对联上联数据，最后根据标注有平仄特征的对联上联数据构建平仄特征向量；S25.将语义向量、词性特征向量和平仄特征向量按照一定维度先后拼接起来，得到多特征融合词向量；设定多特征融合词向量的向量矩阵表示为X＝[x1,x2,…xi]T，其中xi是对联上联句子分词后每个词语的词向量，xi＝[xii1,xii2,…xiin]，其中ii是对联上联句子分词后的词语个数，n是词向量维度；步骤3中CNN编码器结构及特征编码向量生成过程如下：CNN编码器由两个卷积层、一个池化层和一个全连接层构成；两个卷积层采用不同尺寸的卷积核wk进行特征编码；第一层卷积层采用多个1×1卷积核w1×1扩充神经网络深度和加强非线性，进而增强网络的表达能力；第二层卷积层采用多个不同尺寸的卷积核wk对对联句子进行特征提取，分别是：w2×n∈R2×n、w3×n∈R3×n和w4×n∈R4×n，卷积核的宽度与输入的对联句子矩阵X中每个词语的词向量的维度一致；第一层卷积层采用多个卷积核w1×1对输入矩阵X进行卷积操作，输出的特征图c与输入矩阵X的形状一致，第二层卷积层采用多个不同尺寸的卷积核w2×n、w3×n和w4×n对第一层卷积层输出的特征图c进行卷积操作，得到特征图c*，然后将特征图c*输入到池化层中，分别进行最大池化操作和平均池化操作，得到最具代表性的特征，平均池化操作使得到的特征更全面，将最大池化操作和平均池化操作得到的特征值进行融合，将所有融合的特征值进行拼接得到特征融合向量，最后经过一个全连接层生成最终的特征编码向量；第一层卷积层使用1×1卷积核w1×1对矩阵X进行卷积操作，每个卷积核在单词窗口Xi:i+j-1上生成的特征值cl的计算公式为：cl＝RELUw1×1Xi：i+j-1+b1RELU＝max0，x2其中，i表示矩阵X的行，j表示卷积核的高，b为偏置项；当卷积核w1×1将整个对联句子矩阵X遍历完成后，每个卷积核都会输出包含多个特征值cl的特征图c，特征图c的尺寸与矩阵X一致；第二个卷积层中使用多个卷积核w2×n、w3×n和w4×n对特征图c进行卷积操作，每个卷积核在特征图窗口ci:i+j-1上生成的特征值cp的计算公式为：Cp＝RELUwkci：i+j-1+b3其中，i表示矩阵X的行也表示为特征图c的高，j表示卷积核的高，b为偏置项；当卷积核wk将整个特征图c遍历完成后，每个卷积核都会输出包含多个特征值cp的特征图c*，特征图c*的尺寸为i-j+1×1；将得到的特征图c*传给池化层，池化层对特征图c*进行最大池化操作和平均池化操作，计算公式如下：公式4是最大池化操作，公式5是平均池化操作，最大池化操作和平均池化操作的窗口的尺寸均为i-j+1×1，与特征图c*的尺寸一致，所以经过池化操作后得到的最大特征值和平均特征值的尺寸均为1×1；将最大特征值和平均特征值进行融合得到特征值公式如下：其中，g·代表融合操作；将所有特征图c*进行如上池化操作后，把所有得到的特征值拼接成一个特征融合向量e，特征融合向量e的维度为1×v，v代表一个卷积层中所有卷积核的个数，卷积核w2×n、w3×n和w4×n的数量都为10，则v＝10×3＝30；将特征融合向量e输入到一个全连接层中，生成特征编码向量z：Z＝RELUeW+b7其中，W是权重参数，b是偏置项，z的维度为1×n，n表示输入矩阵X中每个词语的词向量维度；步骤4中特征编码向量和语义编码向量结合计算如下：语义编码向量由Transformer模型的编码器计算得到，是矩阵形式，包含所有上联句子词向量的编码信息；将语义编码向量和特征编码向量直接相加，公式如下： ID＝[ID1、ID2、...、IDi]T10其中，Wh和Wz是权重参数，i是对联句子分词后的词语个数；ID是语义编码向量和特征编码向量融合后的新向量，维度与一致。

全文数据：

权利要求：

百度查询：重庆大学结合CNN和Transformer的多特征融合对联生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：显示装置

下一篇：光学瞄准镜防震动冲击转换装置

相关技术

显示装置

光学瞄准镜防震动冲击转换装置

一种托辊式管状带式输送机

一种基于B2b信号的低轨卫星实时定轨与时频同步方法

头孢维星衍生物中间体的制备方法

一种利用手机信令数据识别家庭关系的方法

一种基于红外摄像头与定位识别垫的人机协作与预防人机碰撞的系统及方法

一种基于改进蚁群算法的飞机低空突防航线规划方法

一种含梯级水电的电力市场出清方法、装置、设备及介质

一种基于图形处理器的三维重建方法、装置及系统

起吊装置

基于IPV6的分段路由报文的转发方法、配置方法及设备

特征相关技术

物体特征点检测装置_株式会社爱信_202380021361.1

融合颜色特征和边缘特征的双目视觉绿色植被匹配定位方法_福州大学_202111436002.1

基于注意力特征融合与多列特征增强的人群计数方法_南京信息工程大学_202411125494.6

基于模型的特征化和分类_格瑞尔有限责任公司_202080036172.8

一种遥感影像特征识别方法_南通拓尔普测绘信息有限公司_202410907870.0

具有集成盖、手柄及屏蔽特征的收集瓶_泰尔茂比司特公司_202380026825.8

具有高度可调特征的冰箱门铰接件_伊莱克斯巴西有限公司_201980101050.X

眼底特征获取的方法、装置、介质和设备_依未科技(北京)有限公司_202111463020.9

刀具特征筛选方法、系统、电子设备及介质_中国计量大学_202410963521.0

电动外科缝合器的击发限制特征_西拉格国际有限公司_202380029266.6

融合相关技术

椎间融合器_苏州爱得科技发展股份有限公司_202322979114.2

雷达红外融合探测方法_珠海正和微芯科技有限公司_202411145611.5

一种用于多传感器信息融合的全局椭球密度融合方法_上海海事大学_202410949082.8

一种轻量级复杂场景图像融合模型和实时图像融合方法_佛山大学_202411408162.9

一种椎间融合器以及椎间融合器横置装置_河北医科大学第三医院_202411179658.3

基于渐进滤波融合的人体姿态估计方法_温州大学_202311572460.7

多结构域融合蛋白及其应用_浙江道尔生物科技有限公司_202411001710.6

用于有效目标检测的相机-雷达数据融合_伟摩有限责任公司_202380033221.6

多源异构数据分布式融合方法_上海金润联汇数字科技有限公司_202411035308.X

融合蛋白、包含其的泛素化系统及其应用_上海青煜医药科技有限公司_202410993860.3

对联相关技术

一种针对联邦学习多元投毒攻击的联合审计安全防御方法_中山大学·深圳_202411201304.4

一种大批量化对联裁切设备_山东乐庆印刷有限公司_202411167012.3

一种可更换字体对联结构_姜芃_202323655688.0

一种对联_佛山市新精典智能科技有限公司_202420234866.8

一种针对联邦学习通信开销的优化处理方法及装置_清华大学_202210023353.8

一种卫星激光测高数据和立体像对联合地形建模方法_南京信息工程大学_202411174654.6

一种免粘贴对联固定装置_郑德春_202321454820.9

基于无监督扰动的针对联邦学习的自监督对抗防御框架_上海工程技术大学_202410689504.2

对联网车辆系统中的驾驶行为的基于共识的监测_国际商业机器公司_202080080959.4

结合CNN和Transformer的多特征融合对联生成方法_重庆大学_202310499796.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

结合CNN和Transformer的多特征融合对联生成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务