买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京派森诺基因科技有限公司
摘要:本发明公开了一种基于miRNA靶基因预测以及相关表达分析进行ceRNA预测的方法,其特征在于,包括如下步骤:ceRNA作用对的相关性分析;根据共有MERs数量进行潜在ceRNA关系对筛选;根据miRNA与ceRNA作用对三者之间的表达相关性,采用两种打分方式来评价miRNA对一对竞争的lncRNA‑mRNA的调控功能;获取统计检验显著的结果,并将结果按照打分进行排序。本发明的有益效果在于:对ceRNA进行初步分析后,根据实际测序结果进分析基因间表达相关性,对结果进行筛选。对动物和植物采用不同的靶基因预测方法,从而都可以进行ceRNA预测分析。整合常用数据库中信息,增加分析结果的可靠性。
主权项:1.一种基于miRNA靶基因预测以及表达相关性分析进行ceRNA预测的方法,其特征在于,包括如下步骤:ceRNA作用对的相关性分析:筛选于与lncRNA的皮尔逊相关系数高于0.7的RNA关系对;根据共有MERs数量进行潜在ceRNA关系对筛选:具有ceRNA关系的RNA对之间共有的miRNA数量符合负二项分布,进行超几何检验,筛选pvalue值小于0.05的显著性结果;根据miRNA与ceRNA作用对三者之间的表达相关性,采用两种打分方式来评价miRNA对一对竞争的lncRNA-mRNA的调控功能:i调控相似性打分,miRNA与一对ceRNA两者之间的表达相关性,所述表达相关性范围在-1-1,绝对值大于0.7则为相关,绝对值越大相关性越高;之间的相似性越高,结果越可靠;ii敏感相关性打分,一对ceRNA之间的表达相关性与miRNA的介入的关联越高,结果越可靠,该分值大于0.3时,结果显著,分值越高越可靠;获取统计检验显著的结果,并将结果按照打分进行排序;所述敏感相关性打分如下:计算RNA1和RNA2之间相关性,受它们共有的miRNA的影响程度,公式如下,corrl,g为RNA1和RNA2之间的相关性系数;corrmk,l为miRNA与RNA1的相关性系数,corrmk,g为miRNA与RNA2的表达量相关性系数,M为RNA1和RNA2共有的miRNA数次;筛选分值大于0.3的结果; 。
全文数据:一种基于miRNA靶基因预测以及相关表达分析进行ceRNA预测的方法技术领域本发明涉及基因工程领域,具体涉及一种基于miRNA靶基因预测以及相关表达分析进行ceRNA预测的方法。背景技术已知microRNA可以通过结合RNA,从而进行转录后表达调控,RNA上的miRNA结合位点成为miRNA反应元件MERs。具有相同MERs元件的RNA分子之间会竞争性结合同一类miRNA,从而进行彼此间的间接调控,这种调控机制成为ceRNA假说竞争性内源RNA,CompetingendogenousRNAs。lncRNA、mRNA、circRNA等同种或者不同种RNA之间都可能竞争miNRA的结合,形成ceRNA调控网络。ceRNA网络的稳定对于维持生物体正常功能有重要意义。目前公开数据库中仅有个别物种的ceRNA信息,有的ceRNA筛选方法没有考虑表达量的影响,有的软件对于输入数据有一定要求,无法满足普遍的ceRNA分析要求。在线的一些分析平台对一次提交的数据量有限制。发明内容为了克服现有技术所存在的上述缺陷,本发明的目的在于提供一种基于miRNA靶基因预测以及相关表达分析进行ceRNA预测的方法。为了实现本发明的目的之一,所采用的技术方案是:一种基于miRNA靶基因预测以及表达相关性分析进行ceRNA预测的方法,包括如下步骤:S1ceRNA作用对的相关性分析:在ceRNA调控网络中,miRNA负调控基因的表达,如果更多的miRNA被lncRNA所占有,那抑制靶标mRNA的miRNA就越少,导致基因的表达量升高,因此,在ceRNA网络中一对mRNA与lncRNA应该符合正相关:因此筛选皮尔逊相关系数高于0.7的RNA关系对。S2根据共有MERs数量进行潜在ceRNA关系对筛选:具有ceRNA关系的RNA对之间共有的miRNA数量符合负二项分布,进行超几何检验,筛选显著的结果;S3根据miRNA与ceRNA作用对三者例如RNA1,RNA2都可以结合miRNA_A,则RNA1和RNA2有可能是一对存在竞争关系的ceRNA之间的表达相关性,采用两种打分方式来评价miRNA对一对竞争的lncRNA-mRNA的调控功能:i调控相似性打分,miRNA与一对ceRNA两者之间的表达相关性之间的相似性越高,结果越可靠;ii敏感相关性打分,一对ceRNA之间的表达相关性与miRNA的介入的关联越高,结果越可靠;S4获取统计检验显著的结果,并将结果按照打分进行排序。在本发明的一个优选实施例中,所述的进行超几何检验,筛选显著的结果为:在本发明的一个优选实施例中,所述的计算敏感相关性为:RNA之间的相关性,减去miRNA与两者的相关性,得到miRNA对两者的敏感性系数。本发明的主要创新点在于:1考虑表达量影响,在对ceRNA进行初步分析后,根据实际测序结果进分析基因间表达相关性,从而对结果进行筛选。2适用于所有物种,对动物和植物采用不同的靶基因预测方法,从而都可以进行ceRNA预测分析。3在进行超几何检验计算时,由于计算复杂度高,脚本运行过程中会出现数字位数溢出的现象,对公式的计算过程进行改进避免这种情况,即超几何检验内存溢出是因为计算时分子和分母的数值非常大,采用约分的思想,先计算除法运算,在进行成积,避免内存溢出。附图说明图1为本发明的流程示意图。图2为RNA1、2相关性示意图。图3为结果示例示意图。具体实施方式以下通过实施例对本发明作进一步的说明,但这些实施例不得用于解释对本发明的限制。参见图1,本发明的分析步骤如下:首先需要准备待分析的RNA和miRNA的表达量数据,及其之间的靶基因互作关系文件。将这些数据输入后直接获取最终结果。作为示例的,该方法在读取相关数据后,进行以下步骤的运算。I采用皮尔逊相关性系数计算长RNA之间的表达相关性,保留相关性系数高于0.7的结果。II整理miRNA与各个靶基因之间的关系,获得由共有miRNA作用对的RNA。III根据RNA之间共有的miRNA数量,进行超几何检验,保留显著性水平小于0.05的结果。III计算调控相似性分值,及miRNA与一对RNA之间相关性的相似性,IV计算敏感相关性,即RNA之间的相关性,减去miRNA与两者的相关性,得到miRNA对两者的敏感性系数。将显著结果按照最后的调控相似性分值和敏感相关性分值进行排序,得到最终的结果。例如,参见图2,RNA1图左和RNA2图右分别是两个长RNA两个可以是mRNA,lncRNA,circRNA等,种类可以相同也可以不同。有四个miRNA图中线条都可以结合到RNA1和RNA2上。则RNA1和RNA2可能是一对有竞争关系的RNA。1首先进行超几何检验:通过RNA1上能结合的所有miRNA数量n红点数量,RNA2上可以结合的所有miRNA数量K绿点数量,以及RNA1和RNA都可以结合的miRNA数量m紫色线条数量,进行超几何检验,其中N为所有待分析的miRNA数量公式如下。2相关性计算:采用皮尔逊相关系数计算RNA1和RNA2之间的表达相关性。筛选相关性系数大于0.7的结果。3计算调控相似性打分:计算miRNA与RNA1的相关系,和miRNA与RNA2的相关性,两个相关性之间的相关性。公式如下,corrmk,l为miRNA与RNA1的相关性系数,corrmk,g为miRNA与RNA2的表达量相关性系数,M为RNA1和RNA2共有的miRNA数次。4敏感相关性打分:计算RNA1和RNA2之间相关性,受它们共有的miRNA的影响程度。公式如下,orrl,g为RNA1和RNA2之间的相关性系数,其他变量同上。筛选分值大于0.3的结果。5结果示例参见图3:其中,第一二列为有ceRNA机制的RNA,第三列为两者共有的miRNA数量,第四五列分别为RNA1和RNA2上结合的所有miRNA数量,第六列为待分析的所有miRNA数量,第七列为超几何检验pvalue,第八列为RNA1和RNA2的表达相关性系数,第九列为调控相似性打分,第十列为敏感相关性分值。
权利要求:1.一种基于miRNA靶基因预测以及表达相关性分析进行ceRNA预测的方法,其特征在于,包括如下步骤:ceRNA作用对的相关性分析:筛选于与lncRNA的皮尔逊相关系数高于0.7的RNA关系对;根据共有MERs数量进行潜在ceRNA关系对筛选:具有ceRNA关系的RNA对之间共有的miRNA数量符合负二项分布,进行超几何检验,筛选pvalue值小于0.05的显著性结果;根据miRNA与ceRNA作用对三者之间的表达相关性,采用两种打分方式来评价miRNA对一对竞争的lncRNA-mRNA的调控功能:i调控相似性打分,miRNA与一对ceRNA两者之间的表达相关性相关性范围在-1~1,绝对值大于0.7为相关,绝对值越大相关性越高之间的相似性越高,结果越可靠;ii敏感相关性打分,一对ceRNA之间的表达相关性与miRNA的介入的关联越高,结果越可靠,该分值大于0.3是,结果显著,分值越高越可靠;获取统计检验显著的结果,并将结果按照打分进行排序。2.如权利要求1所述的一种基于miRNA靶基因预测以及表达相关性分析进行ceRNA预测的方法,其特征在于,所述的计算敏感相关性为:一对RNA之间的相关性,减去miRNA分别与所述一对RNA中的分别两条RNA的相关性,得到miRNA对两者的敏感性系数。
百度查询: 南京派森诺基因科技有限公司 一种基于miRNA靶基因预测以及相关表达分析进行ceRNA预测的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。