买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供了一种基于自监督学习的piRNA与疾病关联关系的识别方法,包括以下步骤:步骤1,构建piRNA与疾病关联关系识别研究的基准数据集;步骤2,计算多维度piRNA相似性和疾病相似性;步骤3,创建基于多视图的特征矩阵;步骤4,构建一种基于自监督学习的piRNA与疾病关联关系的识别模型,获取关联关系识别分数;步骤5,利用步骤S4得到的识别分数,详细分析和量化piRNA与疾病之间是否存在边的关系,以便识别piRNA与疾病的关联关系。本发明用于识别piRNA与疾病关联关系,它基于三个公开数据库构建可靠数据集,并计算相似性创建多视图特征矩阵;在模型识别中,采用奇异值分解优化结点间的关系、组合增广策略保留关键信息以及KAN网络令后续分类结果更为可靠和可信。
主权项:1.一种基于自监督学习的piRNA与疾病关联关系的识别方法,其特征在于,包括如下步骤:步骤S1:构建piRNA与疾病关联关系识别研究的基准数据集;步骤S2:计算多维度piRNA相似性和疾病相似性;步骤S3:创建基于多视图的特征矩阵;步骤S4:构建一种基于自监督学习的piRNA与疾病关联关系的识别模型,获取关联关系识别分数;步骤S5:利用步骤S4得到的识别分数,详细分析和量化piRNA与疾病之间是否存在边的关系,以便识别piRNA与疾病的关联关系;其中,所述步骤S1具体包括:步骤S11:根据MeSH数据库中疾病ID,针对piRDisease、pirpheno和MNDR三个公开数据库中的疾病表述数据,标准化疾病名称,确保疾病名称的一致性和唯一性;步骤S12:根据piRBase数据库中piRNAID和序列,统一三个公开数据库中的piRNA标识符,确保piRNA的一致性和唯一性;步骤S13:根据步骤S11中MeSH数据库,合并三个公开数据库中的piRNA与疾病关联数据得到二值化的piRNA与疾病关联矩阵,确保每对piRNA与疾病关联都被包括在内;对关联关系进行去重清洗,确保每对piRNA与疾病关联在最终数据集中唯一存在;其中,所述步骤S4具体包括:步骤S41:根据步骤S13获得的piRNA与疾病关联矩阵,通过奇异值分解技术对关联矩阵进行分解,重构SVD视图,并与原始视图进行对比,得到重构后的矩阵和原始矩阵;步骤S42:将得到的原始矩阵和重构的矩阵基于特征和结构的两种增广策略进行数据增强操作;步骤S43:将数据增强后的两个矩阵作为嵌入初始矩阵,分别输入到两个共享权重的轻量图卷积网络编码器进行特征提取;步骤S44:利用提取后的两个特征矩阵,分别通过两个KAN网络进行特征映射,得到两个映射矩阵;步骤S45:基于映射矩阵计算对称归一化温度交叉熵损失函数及均方误差优化图结构;其中,所述步骤S42具体包括:步骤S421:根据步骤S3所获得的多视图特征矩阵,通过遮蔽关联度较低的结点特征向量来进行数据增强操作;步骤S422:根据步骤S412获得的重构矩阵,通过丢弃权重较低的边进行数据增强操作。
全文数据:
权利要求:
百度查询: 西安理工大学 一种基于自监督学习的piRNA与疾病关联关系的识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。