Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜重庆邮电大学朱智勤获国家专利权

恭喜重庆邮电大学朱智勤获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜重庆邮电大学申请的专利一种基于序列统计表征学习的miRNA-mRNA靶标预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114664376B

龙图腾网通过国家知识产权局官网在2025-04-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210337726.9,技术领域涉及:G16B20/30;该发明授权一种基于序列统计表征学习的miRNA-mRNA靶标预测方法是由朱智勤;姚政;丛柏森;杨攀;李晓磊;李嫄源设计研发完成,并于2022-03-31向国家知识产权局提交的专利申请。

一种基于序列统计表征学习的miRNA-mRNA靶标预测方法在说明书摘要公布了:本发明涉及一种基于序列统计表征学习的miRNA‑mRNA靶标预测方法,属于生物信息学领域。采用神经网络和注意力机制结合的方式对miRNA和mRNA序列的结构特征进行多尺度,多粒度的特征提取,使得到特征即既含序列各个碱基字符和靶标区域序列的局部、全局的多尺度特征,又包含细粒度、粗粒度的多粒度语义信息特征联系。并使用变分自动编码器结构作整体框架,利用输入数据的概率分布保证预测的精确度,并增加了模型的可解释性。本发明采用基于序列统计表征学习的miRNA‑mRNA靶标预测方法能够有效地完成miRNA‑mRNA的靶标预测。

本发明授权一种基于序列统计表征学习的miRNA-mRNA靶标预测方法在权利要求书中公布了:1.一种基于序列统计表征学习的miRNA-mRNA靶标预测方法,其特征在于:该方法包括以下步骤:S1:基于序列统计表征学习的miRNA-mRNA靶标预测方法使用卷积神经网络与基于注意力机制的网络结构的结合来提取miRNA和mRNA序列的多尺度序列结构特征信息和多粒度序列语义特征信息;首先选取一个基本的卷积神经网络和一个基于注意力机制的结构构建miRNAmRNA表征学习网络,然后将经过数据挖掘算法处理后的miRNAmRNA序列输入网络中;S2:经过数据挖掘算法处理后的miRNAmRNA序列输入到骨干网络中,该网络专注于序列信息的局部结构特征和浅层语义信息;基于注意力机制的机构网络层接骨干网络的输出,结合已标记的序列中碱基字符和靶标序列的位置信息,提取序列信息的全局、局部的多尺度结构特征信息,以及细粒度和粗粒度的多粒度序列语义信息;通过公式4将序列信息的不同特征进行有机的合并,得到聚合特征Favg;S3:交互学习将miRNA和mRNA表征学习提取的多尺度结构信息特征和多深度语义特征通过一个基于注意力机制的网络进行传递;通过不同的碱基字符和靶标区域序列在miRNAmRNA序列内的位置关系,建立起它们的特征联系;交互的深度和次数,由超参数α和β确定;S4:得到提取的多尺度结构信息特征和多深度语义特征后,利用miRNA和mRNA输入序列转化参数后的均值和方差和miRNA-mRNA序列交互学习的输出结合得到模型的隐藏向量;通过公式6和公式7的约束条件,经过Transformer的解码器结构,即得到靶标区域的预测结果;S5:再利用miRNAmRNA序列统计表征学习得到特征与miRNAmRNA输入序列转化参数后的均值和方差结合分别得到各自输入数据的隐藏向量;隐藏向量经过与输入模块相反结构的解码和重构得到新的miRNA和mRNA输出;整个网络采用端到端的训练方式,不断更新权值参数,直至网络收敛;所述S1中,经过数据挖掘算法处理后的miRNAmRNA序列输入到骨干网络中,具体如下:a分别给定多组miRNA和mRNA序列,记为和b对序列组初始化标记算法,提取miRNA和mRNA序列中碱基和靶标区域的位置信息,并记为数据集合和然后扫描并记录模型输入数据集中靶标信息重复出现的次数,为中的靶标区域序列标记添加一个新的重要度标记cr和ctr,构成新的数据标记集合和序列标记算法构建由序列中所有碱基和靶标区域组成的序列标记字典,字典的键是碱基或靶标区域所代表的序列,字典的值是它们在序列中的位置和重要度标记构成的集合;c将大于阈值V的重要度标记所代表的序列区域裁剪记为和d把含重要度标记c*的miRNA和mRNA中所有的靶标序列各自拼合成维度大小为k×n的矩阵和o×m的矩阵其中,n和m分别代表miRNA和mRNA序列数量;*代表miRNA或mRNA;代表碱基标记集合、代表靶标区域序列标记集合;k和o分别代表新标记数据集合中miRNA和mRNA的标记序数量大小;p和c分别代表标记点或区域的位置和重要度标记;h和g代表重要度标记大于阈值的序列数目;阈值为2;先将序列拆分为更小的碱基字符和靶标区域序列,并按有效靶标出现的重复次数给与重要度标记,建立更全面的序列信息联系;所述S2中,miRNAmRNA序列统计表征学习:miRNA序列统计表征学习和mRNA序列统计表征学习结构相同,由一个卷积神经提取网络和注意力机制结构组成,包括LeNet5、CNN和AlexNet,基于注意力机制的结构,包括Muti-headattention、Hierarchicalattention和Attentionoverattention;其中,卷积神经网络CNN和多头注意力机制构成的miRNA序列统计表征学习过程包括以下步骤:a将碱基标记集合转换为独热编码形式的n维矩阵矩阵中每一行代表该碱基在序列中表示的符号,每一列表示该碱基在序列中所处的位置;b把和拼接送入编码网络;在经过卷积神经网络时,使用完全卷积运算对序列依赖进行建模;二维的矩阵序列信息每一列从左到右都与原始的miRNA序列中的一个局部区域相关联;使用宽度大小为v的过滤器卷积两个输入矩阵,从而在输入矩阵代表的各个元素上产生上下文信息;为了更好的提取邻域特征,利用层叠残差连接卷积层的方法扩大感受野大小,并保持对特征提取的高效率;通过控制卷积层和残差块的堆叠数量调节建立的序列区域相关性的空间范围;通过该过程输出得到尺寸为C×H×W的特征图其中C、H和W分别代表输入通道、高度和长度;c按Fi的列裁剪其特征通道C,并将所有通道C的相同列合并成一个维数为C×W的向量;借此得到一个带有W向量的序列,将特征Fi表达的上下文特征信息记为d将S降维至1D序列馈送入多头注意力机制中,其中每个元素表示多头注意力机制中的一个序列Token;为聚合CNN的局部特征和自注意力机制的全局特征,此阿勇miRNA\mRNA多尺度表征学习;在注意力机制中加入正则化,随机挑选一个token使用上下文信息S作正则化,用于标记所有token;这允许模型在每个阶段减少token数量,同时增加其特征维度;帮助实现卷积机制与多头注意力机制提取的不同特征信息的多尺度聚合;该过程通过公式1表示: 其中FMQ,K,V表示由S分别线性投影到子空间Q、K和V构成的注意力特征聚合函数,分别表示在不同维度空间下对应的线性投影,h表示注意力模块的数量,i表示每个注意力模块中的头数;总的输出表示为: 同理得miRNA表征学习的此阶段输出为Or;所述S3中,通过切分序列表示对miRNA和mRNA不同的子序列或碱基表示建立联系,模拟miRNA-mRNA的相互作用机理;将miRNA和mRNA经过表征学习得到的上下文特征信息Sr和Str降维至1D序列Sr和Str馈送至注意力机制中;为miRNA和mRNA序列的子空间Q、K和V建立联系,利用和为token序列添加位置权重Wtp和通过公式2和3表示: 其中{fQr,Kr,Vr,fQtr,Ktr,Vtr}分别表示为miRNA和mRNA的注意力函数,输入{SmRNA,SmiRNA}分别线性投影到子空间Qr、Kr、Vr和Qtr、Ktr、Vtr中,权重系数分别为和将所有特征空间聚合得: 其中Favg为1×n维的聚合特征矩阵,i指示各变量在序列总数n中的位置,dr和dtr分别表示输入序列Sr和Str的维度;所述S4中,得到miRNAmRNA表征学习的结果Or和Otr,mRNA-miRNA交互学习的结果Favg;mRNA-miRNA靶标预测的结构对应多头注意力机制设定解码机制;以Transformer解码器为例对该过程进行说明;提到miRNAmRNA表征学习是一个编码器结构,通过学习输入数据的均值μ和方差σ将输出Or和Otr转为关于miRNAmRNA输入x的隐藏变量zr和ztr;zr和ztr合并得到miRNA-mRNA交互学习隐藏表示zs;然后送入解码器得到靶标预测概率值,此过程由向量表示为:y=LWzs+b5其中y是靶标预测概率值,L是线性函数,为sigmod,W表示权重系数,b是偏移量;该过程通过最小化6式来获得y: 其中和分别是识别模型和生成模型;φ和θ是神经网络模型的参数;*表示{r,tr};{r,tr}分别表示miRNA和mRNA;是隐藏特征变量z*的先验分布;预测模型和产生对应输入x*和{xr,xtr}的分布px*和py;所述miRNAmRNA表征学习按其结构设定对应解码器;设立对应的反卷积层和多头注意力解码结构,得到与输入结构相似的miRNA和mRNA序列;以z和x指代输入和对应输入的隐藏变量,通过最小化7式得到生成变量 识别模型qφz|x和生成模型pθz|x,logpθxi是边界对数似然值;其中DKLqφz|xi||pθz是关于qφz|xi和pθz的KL散度;整个网络采用端到端的训练方式,通过最小化6式和7式,不断更新网络权值,直到模型收敛。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区黄桷垭崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。