首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种DNA甲基化数据分析系统及其构建方法和控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:深圳市早知道科技有限公司;深圳韦格纳医学检验实验室

摘要:本发明公开了一种DNA甲基化数据分析系统及其构建方法和控制方法,该构建方法包括如下具体步骤:S1、文献检索及资料查询;S2、样本收集及DNA甲基化水平检测;S3、算法构建;S4、算法测试和优化;S5、外推算法至其他Illumina甲基化检测芯片产品;S6、打包算法,形成DNA甲基化数据分析系统的IlluminaioR语言程序包;该系统可复现IlluminaGenomeStudio软件甲基化模块的各项结果,可在多种处理系统中使用,并可实现DNA甲基化下机数据的全自动处理,相较于现有软件更为高效,并能节省更多的运行内存。

主权项:1.一种DNA甲基化数据分析系统的构建方法,其特征在于,包括如下步骤:S1、通过查询公开资料,获取InfiniumMethylationEPICv2.0BeadChip芯片的Manifest文件、产品信息文件和探针相关信息文件,并推导出IlluminaGenomeStudio软件的算法,包括检测P值的计算公式,Beta值的计算公式,以及归一化的类型和计算公式;S2、采集中国人群样本,先使用IlluminaInfiniumMethylationEPICv2.0BeadChip芯片进行DNA甲基化水平的检测,获得人体DNA甲基化信息数据;然后通过iScan扫描所述芯片,获得DNA甲基化荧光信号数据和样品信息文件;再使用IlluminaGenomeStudio软件的甲基化模块读取所述DNA甲基化荧光信号数据和样品信息文件,并根据所述芯片的Manifest文件,分别输出不做任何处理的结果,进行归一化后的结果,以及进行了归一化和背景提取后的结果;S3、基于步骤S1推导的算法,构建GS-Auto程序,使用该程序读取步骤S2获得的DNA甲基化荧光信号数据和样品信息文件,并分别输出不做任何处理的结果,进行归一化处理后的结果,以及进行了归一化和背景提取后的结果,再与步骤S2输出的结果进行一致性比较,得到一致性比较的结果;S4、基于步骤S3一致性比较的结果,对步骤S1推导的算法进行测试,并根据测试的结果调整算法的结构,再对调整过的算法进行最终测试,得到通过最终测试的GS-Auto程序;S5、基于步骤S4通过最终测试的GS-Auto程序,分别使用IlluminaGenomeStudio软件和GS-Auto程序读取处理经由IlluminaInfiniumMethylationEPICBeadChip芯片和IlluminaInfiniumHumanMethylation450BeadChip芯片检测的DNA甲基化荧光信号数据和样品信息文件,对GS-Auto程序的适用性进行测试,得到通过适用性测试的GS-Auto程序;S6、将步骤S5通过适用性测试的GS-Auto程序打包,并内置IlluminaInfiniumMethylationEPICv2.0BeadChip芯片、IlluminaInfiniumMethylationEPICBeadChip芯片,以及IlluminaInfiniumHumanMethylation450BeadChip芯片的Manifest文件,生成可调用函数,以及撰写用户使用指南,得到DNA甲基化数据分析系统的IlluminaioR语言程序包;步骤S1中,检测P值的计算方式如下: 其中,为探针的检测P值,为阴性参照探针的总数,为探针相较于阴性参照探针的秩,具体如下:(1-1)当探针为I型探针时:当其总信号强度小于所有阴性参照探针的两倍信号强度时,;当其总信号强度大于所有阴性参照探针的两倍信号强度时,;当其总信号强度在阴性参照探针的两倍信号强度范围内时,,为两倍信号强度小于探针总信号强度的阴性参照探针的个数;(1-2)当探针为II型探针时:当其总信号强度小于所有阴性参照探针的信号强度时,;当其总信号强度大于所有阴性参照探针的信号强度时,;当其总信号强度在阴性参照探针的信号强度范围内时,,为信号强度小于探针总信号强度的阴性参照探针的个数;步骤S1中,Beta值的计算方式如下: 其中,为探针的检测Beta值,为探针为甲基化信号强度,为探针的非甲基化信号强度;步骤S1中,归一化的类型包括均值归一化、内部控制归一化、背景提取,具体如下:(3-1)均值归一化的计算方式如下:假设有个样本,、、……分别为个样本的第一个颜色通道的平均信号强度,为个样本整体的平均信号强度,则: 针对某一样本的探针,其第一个颜色通道归一化后的信号强度为原始信号强度乘以,则: (3-2)内部控制归一化的计算方式如下:基于归一化控制探针分别计算不同颜色通道的归一化值,针对绿通道,使用CG控制值;针对红色通道,使用AT控制值;归一化指标通过参照样本的AT控制值和CG控制值归一控制探针计算,为该样本的归一化值的均值;针对某一样本的探针,其颜色通道归一化后的信号强度为原始信号强度乘以归一化指标并除以该颜色通道归一化值的均值,则: (3-3)背景提取的计算方式如下:背景信号值为阴性参照探针信号强度的均值,并使用绝对中位差移除极端值;分通道计算背景信号值,为每个通道阴性参照探针的前5%的信号强度的均值,针对探针,通道的信号强度减去该通道的背景值即为背景减法后的信号强度,若该通道的信号强度为负值,则将该通道的信号强度设置为0。

全文数据:

权利要求:

百度查询: 深圳市早知道科技有限公司 深圳韦格纳医学检验实验室 一种DNA甲基化数据分析系统及其构建方法和控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术