买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:江门市中心医院;五邑大学
摘要:本发明公开了一种基于CAFs、WSIs和临床信息的三组学IDC预后模型建立方法及预后模型系统。该方法包含:数据获取步骤,获取IDC患者组学数据,IDC患者组学数据包含若干份IDC‑CAFs基因数据、若干份WSI数据和若干份临床信息数据;数据预处理步骤,对获取到的IDC患者组学数据进行预处理;数据划分步骤,将预处理后的IDC患者组学数据划分为训练集和测试集;数据训练步骤,基于三组学特征进行多因素cox回归建模,并通过划分好的训练集和测试集对模型进行训练。本发明的基于CAFs、WSIs和临床信息的三组学IDC预后模型建立方法及预后模型系统,通过CAFs、WSIs以及部分临床信息三种组学数据来搭建预后模型,来提高IDC生存分析模型的性能。
主权项:1.一种基于CAFs、WSIs和临床信息的三组学IDC预后模型建立方法,其特征在于,包含以下步骤:数据获取步骤,获取IDC患者组学数据,所述IDC患者组学数据包含若干份IDC-CAFs基因数据、若干份WSI数据和若干份临床信息数据;数据预处理步骤,对获取到的所述IDC患者组学数据进行预处理;数据划分步骤,将预处理后的所述IDC患者组学数据划分为训练集和测试集;数据训练步骤,基于三组学特征进行多因素cox回归建模,并通过划分好的训练集和测试集对模型进行训练;所述数据预处理步骤包含:IDC-CAFs基因数据处理步骤:从MSigDB中下载与fibroblast相关的57个基因集,分别将其与数据清洗后的IDC转录组基因集进行富集分析,保留p-value小于预设值的分析结果;将符合的分析结果中的基因集进行数据合并,与IDC转录组基因集取重合部分,得到包含若干个CAF基因的数据集;对数据集进行wilcox差异分析,保留与IDC相关的CAF差异基因;对所述CAF差异基因进行单因素cox回归分析,保留p-value小于预设值的若干个CAF差异基因;WSIs数据处理步骤:将每份WSI按统一倍数放大,然后裁剪成若干tile子图片;对每张裁剪的tile子图片进行方差检验,去除方差值小于预设值的tile子图片;从每张tile子图片中提取m个人工特征变量,每份WSI得到对应的特征数组m*n,n为裁剪数量;根据显著性将每个特征数组m*n的不定长特征数组形状固定到50,特征数组为m*50;对每一个特征做均值化处理,得到特征数组m*1;采用levene+Ttest组合技术将每个特征数组中的m个WSI人工特征变量筛选至a个,得到特征数组a*1,a小于m;采用lasso回归再将每个特征数组中的a个WSI人工特征变量筛选至b个,得到特征数组b*1,b小于a;临床信息数据处理步骤:从所述临床信息数据选择若干临床特征。
全文数据:
权利要求:
百度查询: 江门市中心医院 五邑大学 基于CAFs、WSIs和临床信息的三组学IDC预后模型建立方法及预后模型系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。