买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种T细胞受体序列motif组合识别检测方法、存储介质及设备,构建Tumor‑Health矩阵和Tissue‑Blood矩阵作为输入矩阵;以motif组合的类内类间距离可分性作为优化目标函数;设计双种群遗传算法,对输入矩阵中的每一motif列和label列进行相关性分析,采用点二列相关性作为衡量motif列和label列是否相关的指标;以优化目标函数作为算法优化目标,利相关性指标对输入矩阵的motif进行初步筛选,过滤掉不相关的motif列,通过遗传算法进行迭代计算,得到两组种群的优势解,取两组种群中适应度排前三的染色体作为最优解,并解码成为对应的motif集合,取对应集合的交集作为最终挖掘出的motif,完成识别检测。本发明能够为免疫治疗提供可能的生物标志物研究方向。
主权项:1.一种T细胞受体序列motif组合识别检测方法,其特征在于,包括以下步骤:S1、将健康样本和肿瘤样本的基因组DNA比对到胚系序列,鉴定对应的CDR3区段并将CDR3区段翻译成氨基酸序列;进行氨基酸序列剪切并将健康样本和肿瘤样本的CDR3区段对应的氨基酸序列解构为多个相同长度的连续氨基酸片段;利用健康样本的外周血数据、肿瘤样本的组织数据和肿瘤样本外周血数据解构后的信息构建Tumor-Health矩阵,利用肿瘤样本组织数据和肿瘤样本外周血数据构建Tissue-Blood矩阵,Tumor-Health矩阵和Tissue-Blood矩阵的最后一列为label列,代表样本对应的标签,剩余列为motif列,代表样本对应氨基酸片段的克隆数,将Tumor-Health矩阵和Tissue-Blood矩阵共同作为输入矩阵;S2、根据步骤S1得出的两个输入矩阵分别构建求解对应的优化目标函数,以motif组合的类内类间距离可分性作为优化目标计算方法,将两个优化目标函数加和得到总的优化目标函数;S3、根据步骤S1得到的输入矩阵和步骤S2得到的总优化目标函数设计双种群遗传算法并进行求解,确定编码方法和初始种群,采用锦标赛选择法加精英保留制度选择算子对种群进行选择,保留最优个体;采取种群内和种群间的混合交叉方式确定交叉算子;采用基本位变异的操作确定变异算子;S4、对步骤S1构建的输入矩阵中的每一motif列和label列进行相关性分析,采用点二列相关性作为衡量motif列和label列是否相关的指标,根据计算得到的相关性指标ρ判断显著水平,确定相关性指标ρ0.05为相关性不显著;S5、以步骤S2构建的优化目标函数作为算法优化目标,利用步骤S4计算的相关性指标对步骤S1构建的输入矩阵进行初步筛选,过滤掉不相关的motif列,通过步骤S3设计的双种群遗传算法进行迭代计算,得到两组种群的优势解,取两组种群中适应度排前三的染色体作为最优解,并解码成为对应的motif集合,最终得到六组motif集合,两两对应,取对应集合的交集作为最终挖掘出的motif,完成识别检测。
全文数据:
权利要求:
百度查询: 西安交通大学 一种T细胞受体序列motif组合识别检测方法、存储介质及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。