买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆大学
摘要:本发明公开了结合CNN和Transformer的多特征融合对联生成方法,包括以下步骤,在数据预处理阶段,分别构建带词性特征和平仄特征的对联语料库;根据对联上联构建结合词性特征和平仄特征的多特征融合词向量。将对联上联的多特征融合词向量分别输入到CNN编码器和Transformer模型的编码器中进行对联特征提取和对联语义编码,分别得到特征编码向量和语义编码向量。将特征编码向量和语义编码向量结合起来输入到Transformer模型的解码器中。本方法将对联的词性特征和平仄特征加入到词向量中,得到多特征融合的词向量。多特征融合的词向量能提高生成对联的对仗性;将CNN模型和Transformer模型结合起来,强化对联的重点信息,提高生成对联的语义连贯性。
主权项:1.结合CNN和Transformer的多特征融合对联生成方法,其特征在于,包括以下步骤:步骤1.在数据预处理阶段,分别构建带词性特征和平仄特征的对联语料库;步骤2.根据对联上联构建结合词性特征和平仄特征的多特征融合词向量;步骤3.将对联上联的多特征融合词向量分别输入到CNN编码器和Transformer模型的编码器中进行对联特征提取和对联语义编码,分别得到特征编码向量和语义编码向量;步骤4.将特征编码向量和语义编码向量结合起来输入到Transformer模型的解码器中;步骤5.Transformer模型的解码器根据对联语料库预测并输出下联;步骤1中分别构建带词性特征和平仄特征的对联语料库具体如下:S11.获取对联语料库;S12.对对联语料库里的对联数据进行逐字分词;S13.采用LTP对分词后的对联语料进行词性特征标注,得到具有词性特征的对联语料库;S14.采用Python中的PyPinyin对分词后的对联语料进行拼音标注,然后根据拼音音调与平仄音调的转换规则将拼音转换成为平仄特征,得到具有平仄特征的对联语料库;其中拼音音调与平仄音调的转换规则为:拼音音调的一二声为平声,拼音音调的三四声为仄声;步骤2中多特征融合词向量构建过程如下:S21.对对联上联进行逐字分词;S22.根据分词后的上联数据构建语义向量;S23.采用LTP对分词后的上联的每个字进行词性特征标注,然后根据标注有词性特征的上联数据构建词性特征向量;S24.采用PyPinyin对分词后的上联的每个字进行拼音标注,然后根据拼音音调与平仄音调的转换规则将拼音转换成为平仄特征,得到标注有平仄特征的对联上联数据,最后根据标注有平仄特征的对联上联数据构建平仄特征向量;S25.将语义向量、词性特征向量和平仄特征向量按照一定维度先后拼接起来,得到多特征融合词向量;设定多特征融合词向量的向量矩阵表示为X=[x1,x2,…xi]T,其中xi是对联上联句子分词后每个词语的词向量,xi=[xii1,xii2,…xiin],其中ii是对联上联句子分词后的词语个数,n是词向量维度;步骤3中CNN编码器结构及特征编码向量生成过程如下:CNN编码器由两个卷积层、一个池化层和一个全连接层构成;两个卷积层采用不同尺寸的卷积核wk进行特征编码;第一层卷积层采用多个1×1卷积核w1×1扩充神经网络深度和加强非线性,进而增强网络的表达能力;第二层卷积层采用多个不同尺寸的卷积核wk对对联句子进行特征提取,分别是:w2×n∈R2×n、w3×n∈R3×n和w4×n∈R4×n,卷积核的宽度与输入的对联句子矩阵X中每个词语的词向量的维度一致;第一层卷积层采用多个卷积核w1×1对输入矩阵X进行卷积操作,输出的特征图c与输入矩阵X的形状一致,第二层卷积层采用多个不同尺寸的卷积核w2×n、w3×n和w4×n对第一层卷积层输出的特征图c进行卷积操作,得到特征图c*,然后将特征图c*输入到池化层中,分别进行最大池化操作和平均池化操作,得到最具代表性的特征,平均池化操作使得到的特征更全面,将最大池化操作和平均池化操作得到的特征值进行融合,将所有融合的特征值进行拼接得到特征融合向量,最后经过一个全连接层生成最终的特征编码向量;第一层卷积层使用1×1卷积核w1×1对矩阵X进行卷积操作,每个卷积核在单词窗口Xi:i+j-1上生成的特征值cl的计算公式为:cl=RELUw1×1Xi:i+j-1+b1RELU=max0,x2其中,i表示矩阵X的行,j表示卷积核的高,b为偏置项;当卷积核w1×1将整个对联句子矩阵X遍历完成后,每个卷积核都会输出包含多个特征值cl的特征图c,特征图c的尺寸与矩阵X一致;第二个卷积层中使用多个卷积核w2×n、w3×n和w4×n对特征图c进行卷积操作,每个卷积核在特征图窗口ci:i+j-1上生成的特征值cp的计算公式为:Cp=RELUwkci:i+j-1+b3其中,i表示矩阵X的行也表示为特征图c的高,j表示卷积核的高,b为偏置项;当卷积核wk将整个特征图c遍历完成后,每个卷积核都会输出包含多个特征值cp的特征图c*,特征图c*的尺寸为i-j+1×1;将得到的特征图c*传给池化层,池化层对特征图c*进行最大池化操作和平均池化操作,计算公式如下: 公式4是最大池化操作,公式5是平均池化操作,最大池化操作和平均池化操作的窗口的尺寸均为i-j+1×1,与特征图c*的尺寸一致,所以经过池化操作后得到的最大特征值和平均特征值的尺寸均为1×1;将最大特征值和平均特征值进行融合得到特征值公式如下: 其中,g·代表融合操作;将所有特征图c*进行如上池化操作后,把所有得到的特征值拼接成一个特征融合向量e,特征融合向量e的维度为1×v,v代表一个卷积层中所有卷积核的个数,卷积核w2×n、w3×n和w4×n的数量都为10,则v=10×3=30;将特征融合向量e输入到一个全连接层中,生成特征编码向量z:Z=RELUeW+b7其中,W是权重参数,b是偏置项,z的维度为1×n,n表示输入矩阵X中每个词语的词向量维度;步骤4中特征编码向量和语义编码向量结合计算如下:语义编码向量由Transformer模型的编码器计算得到,是矩阵形式,包含所有上联句子词向量的编码信息;将语义编码向量和特征编码向量直接相加,公式如下: ID=[ID1、ID2、...、IDi]T10其中,Wh和Wz是权重参数,i是对联句子分词后的词语个数;ID是语义编码向量和特征编码向量融合后的新向量,维度与一致。
全文数据:
权利要求:
百度查询: 重庆大学 结合CNN和Transformer的多特征融合对联生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。