首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

采用核酸编码的大分子分析 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:ENCODIA有限公司

摘要:公开了采用核苷酸编码分析大分子,包括肽、多肽和蛋白质的方法。

主权项:1.一种分析大分子的方法,所述大分子是肽,该方法包括以下步骤:a提供所述大分子和与所述大分子共定位或直接或间接连接的核酸记录标签,该大分子和或核酸记录标签连接在固体支持物上;b使所述大分子与能够结合所述大分子的第一结合剂接触,其中所述第一结合剂包含第一核酸编码标签,该第一核酸编码标签包括关于所述第一结合剂的第一识别信息的第一编码器序列;c在所述第一结合剂与所述大分子结合后,将所述第一编码器序列传递到所述核酸记录标签,以产生与所述固体支持物连接的第一次序延伸核酸记录标签;d使所述大分子与能够结合所述大分子的第二结合剂接触,其中所述第二结合剂包含第二核酸编码标签,该第二核酸编码标签包括关于所述第二结合剂的第二识别信息的第二编码器序列;e在所述第二结合剂与所述大分子结合后,将所述第二编码器序列传递到所述第一次序延伸核酸记录标签,以产生与所述固体支持物连接的第二次序延伸核酸记录标签;以及f分析所述第二次序延伸核酸记录标签,其中第二次序延伸核酸记录标签的两端包含相同或不同的通用引发位点,其中,分析包括使用所述通用引发位点对所述第二次序延伸核酸记录标签进行扩增和或测序,以及获得关于第一结合剂的识别信息和关于第二结合剂的识别信息以提供关于所述大分子的信息,从而分析所述大分子;其中从核酸编码标签到核酸记录标签的信息传递通过核酸连接酶、核酸聚合酶或化学连接介导的引物延伸和或连接实现。

全文数据:采用核酸编码的大分子分析序列表声明与本申请相关的序列表以文本格式提供以代替纸质副本,并且通过引用并入到本说明书中。包含序列表的文本文件的名称是760229_401WO_SEQUENCE_LISTING.txt。该文本文件为38.7KB,于2017年5月2日创建,并通过EFS-Web以电子方式提交。背景技术技术领域本公开内容一般涉及使用条形码和分子识别事件的核酸编码来分析大分子,包括肽、多肽和蛋白质。相关技术说明编码标签蛋白质在细胞生物学和生理学中发挥着不可或缺的作用,扮演和促进许多不同的生物学功能。由于翻译后修饰PTM引入的额外多样性,不同蛋白质分子的集合非常丰富,比转录组复杂得多。另外,细胞内的蛋白质动态地改变在表达水平和修饰状态中以响应于环境、生理状态和疾病状态。因此,蛋白质含有大量未经探索的相关信息,特别是与基因组信息有关的信息。总的来说,相对于基因组学分析,蛋白质组学分析方面的创新一直滞后。在基因组学领域,新一代测序NGS已经通过在单个仪器运行中分析数十亿个DNA序列改变了这一领域,而在蛋白质分析和肽测序中,通量仍然有限。然而,迫切需要这种蛋白质信息,以便更好地了解健康和疾病中的蛋白质组动态,并帮助实现精准医学。因此,人们对开发“下一代”工具以使这种蛋白质组信息的收集小型化和高度并行化非常感兴趣。由于各种原因,高度平行的大分子表征和蛋白质识别具有挑战性。由于存在一些关键挑战,使用基于亲和力的测定通常是困难的。一个明显的挑战是将一组亲和试剂的读数多路复用到一组同源大分子集合中;另一个挑战是使亲和试剂和脱靶大分子之间的交叉反应最小化;第三个挑战是开发高效的高通量读出平台。该问题的一个例子发生在蛋白质组学中,其中一个目标是鉴定和定量样品中的大多数或所有蛋白质。此外,期望在单分子水平上表征蛋白质上的各种翻译后修饰PTM。目前,这是以高通量方式去完成的艰巨任务。蛋白质或肽大分子的分子识别和表征通常使用免疫测定法进行。有许多不同的免疫测定形式,包括ELISA、多路复用ELISA例如,斑点抗体阵列、液体粒子ELISA阵列、数字ELISA例如,Quanterix、Singulex,反相蛋白质阵列RPPA等等。这些不同的免疫测定平台都面临着类似的挑战,包括高亲和力和高特异性或选择性抗体结合剂的开发,在样品和分析物水平上复用的能力有限,灵敏度和动态范围有限,以及交叉反应性和背景信号。结合剂不可知方法,例如通过肽测序Edman降解或质谱的直接蛋白质表征提供了有用的替代方法。但是,这些方法都不是非常平行或高通量。基于Edman降解的肽测序首先由PehrEdman于1950年提出;即通过一系列化学修饰和下游HPLC分析后来被质谱分析取代逐步降解肽上的N-末端氨基酸。第一步,在轻度碱性条件下NMP甲醇H2O用异硫氰酸苯酯PITC修饰N-末端氨基酸,形成苯基硫代氨基甲酰基PTC衍生物。在第二步中,用酸无水TFA处理PTC修饰的氨基以产生裂解的环状ATZ2-苯胺基-54-硫代唑啉酮修饰的氨基酸,在肽上留下新的N-末端。所述裂解的环状ATZ-氨基酸被转化为PTH-氨基酸衍生物,并通过反相HPLC分析。该过程以迭代方式继续进行,直至从N-末端除去所有或部分数目的包含肽序列的氨基酸并鉴定。通常,Edman降解肽测序是缓慢的并且每天仅有少量肽的有限通量。在过去的10-15年中,使用MALDI、电喷雾质谱MS和LC-MSMS的肽分析在很大程度上取代了Edman降解。尽管MS仪器Rileyetal.,2016,CellSyst2:142-143最近取得了进展,但MS仍然存在一些缺点,包括仪器成本高、对用户的技术水平要求高、定量能力差并且跨越蛋白质组动态范的测量能力有限。例如,由于蛋白质电离效率水平不同,因此样本之间的绝对定量甚至相对定量都具有挑战性。采用质量标签有助于改善相对定量,但需要标记蛋白质组。动态范围是另外一个的难点,其中样品中蛋白质的浓度可以在很大范围内变化血浆超过10个数量级。MS通常仅分析高丰度种类,使低丰度蛋白质的表征非常挑战。最后,样品通量通常限于每次运行几千个肽,而对于数据独立分析DIA,这种通量不足以进行真正的自下而上的高通量蛋白质组分析。此外,对于每个样品记录的数千个复杂MS谱的去卷积存在显着的计算要求。因此,本领域仍需要与大分子测序和或分析有关的改进技术,应用于蛋白质测序和或分析,以及用于实现其的产品、方法和试剂盒。需要高度并行化,准确,灵敏和高通量的蛋白质组学技术。本发明提供了具有这些优势及其它益处的方法和设备。参考以下详细描述,本发明的各方面将是明显的。为此,本文阐述了各种参考文献,其更详细地描述了某些背景信息、工艺、化合物和或组合物,并且每个都通过引用整体并入本文。发明内容本公开的实施方案总体上涉及高度平行的、高通量数字大分子分析,特别是肽分析的方法。在第一个实施方案中是分析大分子的方法,包括以下步骤:a提供大分子和连接在固体支持物上的相关记录标签;b使所述大分子与能够结合所述大分子的第一结合剂接触,其中所述第一结合剂包含具有关于所述第一结合剂的识别信息的第一编码标签;c将所述第一编码标签的信息传递到所述记录标签,以产生第一次序延伸记录标签;d使所述大分子与能够结合所述大分子的第二结合剂接触,其中所述第二结合剂包含具有所述第二结合剂的识别信息的第二编码标签;e将所述第二编码标签的信息传送到第一次序延伸记录标签以产生第二次序延伸记录标签;以及f分析所述第二次序延伸记录标签。在第二实施方案中是第一实施方案的方法,其中接触步骤b和d按顺序进行。在第三实施方案中是第一实施方案的方法,其中接触步骤b和d同时进行。在第四实施例中是第一实施例的方法,还包括在步骤e和f之间的以下步骤:x通过采用能够结合所述大分子的第三或更高次序结合剂替换所述第二结合剂以重复步骤d和e一次或多次,其中所述第三或更高次序结合剂包含具有第三或更高次序结合剂的识别信息的第三或更高次序的编码标签;和y将所述第三或更高次序编码标签的信息传送到所述第二或更高次序延伸记录标签,以产生第三或更高次序延伸记录标签;并且其中在步骤f中分析所述第三或更高次序延伸记录标签。在第五个实施方案中是分析大分子的方法,包括以下步骤:a提供大分子,相关的第一记录标签和连接到固体支持物的相关第二记录标签;b使所述大分子与能够结合所述大分子的第一结合剂接触,其中所述第一结合剂包含具有关于所述第一结合剂的识别信息的第一编码标签;c将所述第一编码标签的信息传送到所述第一记录标签以产生第一次序延伸记录标签;d使所述大分子与能够结合所述大分子的第二结合剂接触,其中所述第二结合剂包含具有所述第二结合剂的识别信息的第二编码标签;e将所述第二编码标签的信息传送到所述第二记录标签以产生第二次序延伸记录标签;并且f分析所述第一和第二延伸记录标签。在第六实施方案中是第五实施方案的方法,其中接触步骤b和d按先后顺序进行。在第七实施方案中是第五实施方案的方法,其中接触步骤b和d同时进行。在第八实施方案中是第五实施方案的方法,其中步骤a还包括提供与固体支持物连接的相关的第三或更高次序段记录标签。在第九实施例中是第八实施例的方法,还包括在步骤e和f之间的以下步骤:x通过采用能够结合所述大分子的第三或更高次序结合剂替换所述第二结合剂以重复步骤d和e一次或多次,其中所述第三或更高次序结合剂包含具有第三或更高次序结合剂的识别信息的第三或更高次序的编码标签;和y将所述第三或更高次序编码标签的信息传送到所述第三或更高次序记录标签,以产生第三或更高次序延伸记录标签;并且其中在步骤f中分析第一,第二和第三或更高次序延伸记录标签。在第10个实施方案中,是第五至第九实施方案中任一个的方法,其中所述第一编码标签,第二编码标签和任何更高次序编码标签包含结合的循环特异性间隔序列。在第11个实施方案中,是分析肽的方法,包括步骤:a提供肽和连接在固体支持物上的相关的记录标签;b用化学试剂修饰所述肽的N-末端氨基酸NTAA;c使所述肽与能够结合所述修饰的NTAA的第一结合试剂接触,其中所述第一结合试剂包含具有所述第一结合试剂的识别信息的第一编码标签;d将所述第一编码标签的信息传送到所述记录标签以产生一个延伸记录标签;并且e分析所述延伸记录标签。在第12个实施方案中是第11个实施方案的方法,其中步骤c还包括使所述肽与包含第二或更高次序编码标签的第二或更高次序结合剂接触,所述第二或更高次序编码标签具有第二或更高次序结合剂的识别信息,其中第二或更高次序结合剂能够结合除步骤b的修饰的NTAA之外的修饰的NTAA。在第13个实施方案中是第12个实施方案的方法,其中在所述肽与所述第一结合剂接触后,接着使所述肽与第二或更高级结合剂接触。在第14个实施方案中是第12个实施方案的方法,其中使所述肽与第二或更高级结合剂接触和所述肽与所述第一结合剂的接触同时发生。在第15个实施方案中是第11-14实施方案中任一个的方法,其中所述化学试剂是异硫氰酸酯衍生物,2,4-二硝基苯磺酸DNBS,4-磺酰基-2-硝基氟苯SNFB1-氟-2,4-二硝基苯、丹磺酰氯、7-甲氧基香豆素乙酸、硫代酰化试剂、硫代乙酰化试剂或硫代苄基化试剂。在第16实施方案中是分析肽的方法,包括以下步骤:a提供肽和连接在固体支持物上的相关的记录标签;b用化学试剂修饰所述肽的N-末端氨基酸NTAA以产生修饰的NTAA;c使所述肽与能够结合所述修饰的NTAA的第一结合试剂接触,其中所述第一结合试剂包含具有所述第一结合试剂的识别信息的第一编码标签;d将第一编码标签的信息传递到所述记录标签以产生第一次序延伸记录标签;e移除修饰的NTAA以暴露新的NTAA;f采用化学试剂修饰所述新的NTAA以产生新的修饰的NTAA;g使所述肽与能够结合所述修饰的NTAA的第二结合剂接触,其中所述第二结合剂包含具有所述第二结合剂的识别信息的第二编码标签;h将所述第二编码标签的信息传送到所述第一次序延伸记录标签以产生第二次序延伸记录标签;以及i分析所述第二延伸记录标签。在第17实施方案中是分析肽的方法,包括以下步骤:a提供肽和连接在固体支持物上的相关的记录标签;b使所述肽与能够结合所述肽的N末端氨基酸NTAA的第一结合试剂接触,其中所述第一结合试剂包含具有所述第一结合试剂的识别信息的第一编码标签;c将所述第一编码标签的信息传送到所述记录标签以产生一个延伸记录标签;并且d分析所述延伸记录标签。在第18个实施方案中是第17个实施方案的方法,其中步骤b还包括使肽与包含第二或更高次序编码标签的第二或更高次序结合剂接触,所述编码标签具有关于第二或更高次序结合剂的识别信息,其中所述第二或更高次序结合剂能够结合所述肽的NTAA以外的NTAA。在第19个实施方案中是第18个实施方案的方法,其中在所述肽与所述第一结合剂接触后,接着使所述肽与第二或更高级结合剂接触。在第20个实施方案中是第18个实施方案的方法,其中使所述肽与第二或更高级结合剂接触和所述肽与所述第一结合剂的接触同时发生在第21实施方案中,是一种用于分析肽的方法,包括以下步骤:a提供肽和连接在固体支持物上的相关的记录标签;b使所述肽与能够结合所述肽的N末端氨基酸NTAA的第一结合试剂接触,其中所述第一结合试剂包含具有所述第一结合试剂的识别信息的第一编码标签;c将第一编码标签的信息传递到所述记录标签以产生第一次序延伸记录标签;d移除所述肽的NTAA以露出新的NTAA;e使所述肽与能够结合所述新的NTAA的第二结合剂接触,其中所述第二结合剂包含具有所述第二结合剂的识别信息的第二编码标签;h将所述第二编码标签的信息传送到所述第一次序延伸记录标签以产生第二次序延伸记录标签;以及i分析所述第二延伸记录标签。在第22实施方案中,是第1至第10实施方案中任一项的方法,其中所述大分子是蛋白质、多肽或肽。在第23实施方案中,是第1至第10实施方案中任一项的方法,其中所述大分子是肽。在第24实施方案中,是第1至第23实施方案中任一项的方法,其中所述肽是通过自生物样品碎片化分离的蛋白而获得。在第25实施方案中,是第1至第10实施方案中任一项的方法,其中所述大分子是脂质、碳水化合物或大环。在第26实施方案中,是第1至第25实施方案中任一项的方法,其中所述记录标签是DNA分子、具有假互补碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子或其组合。在第27实施方案中,是第1至第26实施方案中任一项的方法,其中所述记录标签包含通用引发位点。在第28实施方案中,是第27实施方案中的方法,其中所述通用引发位点包含用于扩增、测序或二者的引物位点。在第29实施方案中,是第1至第28实施方案中任一项的方法,其中所述记录标签包含独特分子标识符UMI。在第30实施方案中,是第1至第29实施方案中任一项的方法,其中所述记录标签包含条形码。在第31实施方案中,是第1至第30实施方案中任一项的方法,其中所述记录标签在其3’-末端包含间隔子。在第32实施方案中,是第1至第31实施方案中任一项的方法,其中所述大分子和所述相关的记录标签共价结合在所述固体支持物上。在第33实施方案中,是第1至第32实施方案中任一项的方法,其中所述固体支持物是珠子、多孔珠子、多孔基质、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶芯片、流通芯片、包括信号转导电子器件的生物芯片、微量滴定孔、ELISA板,旋转干涉测量盘、硝酸纤维素膜、硝化纤维素基聚合物表面、纳米颗粒或微球。在第34实施方案中,是第33实施方案中的方法,其中所述固体支持物是聚苯乙烯珠子、聚合物珠子、琼脂糖珠子、丙烯酰胺珠子、固体核心珠子、多孔珠子、顺磁珠子、玻璃珠子,或可控孔珠子。在第35实施方案中,是第1至第34实施方案中任一项的方法,其中多个大分子和相关的记录标签结合到所述固体支持物上。在第36实施方案中,是第35实施方案中的方法,其中所述多个大分子在所述固体支持物上以50nm的平均距离间隔开。在第37实施方案中,是第1至第36实施方案中任一项的方法,其中所述结合剂是多肽或蛋白质。在第38实施方案中,是第37实施方案中的方法,其中所述结合剂是修饰的氨肽酶、修饰的氨酰tRNA合成酶、修饰的anticalin或修饰的ClpS。第39实施方案中,是第1至第38实施方案中任一项的方法,其中所述结合剂能够选择性地结合所述大分子。在第40实施方案中,是第1至第39实施方案中任一项的方法,其中所述记录标签是DNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子或其组合。在第41实施方案中,是第1至第40实施方案中任一项的方法,其中所述记录标签包含编码序列。在第42实施方案中,是第1至第41实施方案中任一项的方法,其中所述记录标签还包含间隔子、结合循环特异性序列、独特分子标识符、通用引发位点、或它们的任何组合。在第43实施方案中,是第1至第42实施方案中任一项的方法,其中所述结合剂和所述编码标签通过接头连接。在第44实施方案中,是第1至第42实施方案中任一项的方法,其中所述结合剂和所述编码标签通过SpyTagSpyCatcher或SnoopTagSnoopCatcher肽-蛋白质对连接。在第45实施方案中,是第1至第44实施方案中任一项的方法,其中传送所述编码标签的信息到所述记录标签是通过DNA连接酶介导。在第46实施方案中,是第1至第44实施方案中任一项的方法,其中传送所述编码标签的信息到所述记录标签是通过DNA合成酶介导。在第47实施方案中,是第1至第44实施方案中任一项的方法,其中传送所述编码标签的信息到所述记录标签是通过化学连接介导。在第48实施方案中,是第1至第47实施方案中任一项的方法,其中分析所述延伸记录标签包含核酸测序方法。在第49实施方案中,是第48实施方案中的方法,其中所述核酸测序方法是通过合成测序、连接测序、杂交测序、polony测序、离子半导体测序或焦磷酸测序。第50实施方案中,是第48实施方案中的方法,其中所述核酸测序方法是单分子实时测序、基于纳米孔测序、或使用高级显微镜的DNA直接成像。在第51实施方案中,是第1至第50实施方案中任一项的方法,其中所述延伸记录标签在分析之前扩增。在第52实施方案中,是第1至第51实施方案中任一项的方法,其中包含于所述延伸记录标签中的所述编码标签信息的次序提供关于结合到所述大分子的结合剂的结合次序的信息。在第53实施方案中,是第1至第52实施方案中任一项的方法,其中所述延伸记录标签中包含的所述编码标签信息的频率提供关于结合到所述大分子的结合剂的结合频率的信息。在第54实施方案中,是第1至第53实施方案中任一项的方法,其中代表多个大分子的多个延伸记录标签被平行分析。在第55实施方案中,是第54实施方案的方法,其中代表多个大分子的多个延伸记录标签在多路复用检测中分析。在第56实施方案中,是第1至第55实施方案中任一项的方法,其中所述多个延伸记录标签在分析之前进行靶标丰度检测。在第57实施方案中,是第1至第56实施方案中任一项的方法,其中所述多个延伸记录标签在分析之前进行减法分析。在第58实施方案中,是第1至第57实施方案中任一项的方法,其中所述多个延伸记录标签在分析之前进行标准化测定以降低高丰度种类。在第59实施方案中,是第1至第58实施方案中任一项的方法,其中所述NTAA采用修饰的氨肽酶、修饰的氨基酸tRNA合成酶、温和型埃德曼降解、埃德曼酶或无水TFA来移除。在第60实施方案中,是第1至第59实施方案中任一项的方法,其中所述至少一个结合剂结合到末端氨基酸残基。在第61实施方案中,是第1至第60实施方案中任一项的方法,其中所述至少一个结合剂结合到翻译后修饰氨基酸。在第62实施方案中,是分析来自于包含多个蛋白复合体、蛋白、或多肽的样本的一个或多个肽,所述方法包含:a将样品内的多个蛋白质复合物、蛋白质或多肽分区成多个隔室,其中每个隔室包括多个隔室标签,其任选地连接到固体支持物,其中在单个隔室内的所述多个隔室标签是相同的且不同于其他隔室的隔室标签;b将多种蛋白质复合物、蛋白质和或多肽片段化成多个肽;c在足以允许所述多个肽与所述多个隔室内的多个隔室标签退火或连接的条件下,使所述多个肽与所述多个隔室标签接触,从而产生多个隔室标记的肽;d从所述多个隔室收集隔室标记的肽;并且e根据第1-21实施方案中以及第26-61实施方案中任一项的方法分析一个或多个隔室标记的肽。在第63实施方案中,是第62实施方案中的方法,所述隔室是微流体液滴。在第64实施方案中,是第62实施方案中的方法,其中所述隔室是微孔。在第65实施方案中,是第62实施方案中的方法,其中所述隔室是表面上分离的区域。在第66实施方案中,是第62至第65实施方案中任一项的方法,其中每个隔室平均包含一个单独细胞。在第67实施方案中,是分析来自于包含多个蛋白复合体、蛋白、或多肽的样本的一个或多个肽,所述方法包含:a用多个通用DNA标签标记多种蛋白质复合物、蛋白或多肽;b将样品内的多个蛋白复合物、蛋白或多肽分区成多个隔室,其中每个隔室包括多个隔室标签,其中在单个隔室内的多个隔室标签是相同的且不同于其他隔室的隔室标签;c在足以允许所述多个肽与所述多个隔室内的所述多个隔室标签退火或连接的条件下,使所述多个蛋白复合物、蛋白、或多肽与所述多个隔室标签接触,从而产生多个隔室标记的蛋白复合物、蛋白、或多肽;d从所述多个隔室收集隔室标记的蛋白复合物、蛋白、或多肽;e任选地将隔室标记的蛋白复合物、蛋白或多肽片段化成隔室标记的肽片段化为隔室标签的肽;和f根据第1-21实施方案中以及第26-61实施方案中任一项的方法分析一个或多个隔室标记的肽。在第68实施方案中,是第62至第67实施方案中任一项的方法,其中所述隔室标签信息通过引物延伸或链接被传送到与肽相关的记录标签。在第69实施方案中,是第62至第68实施方案中任一项的方法,其中所述固体支持物包含珠子。在第70实施方案中,是第69实施方案中的方法,其中所述珠子是聚苯乙烯珠子、聚合物珠子、琼脂糖珠子、丙烯酰胺珠子、固体核心珠子、多孔珠子、顺磁珠子、玻璃珠子或可控孔珠子。在第71实施方案中,是第62至第70实施方案中任一项的方法,其中所述隔室标签包含单链或双链核苷酸分子。在第72实施方案中,是第62至第71实施方案中任一项的方法,其中所述隔室标签包含条形码和任选的UMI。在第73实施方案中,是第72实施方案的方法,其中所述固体支持物是珠子,所述隔室标签包含条形码,进一步其中包含多个连接到其上的隔室标签的珠子通过混合-切分合成形成。在第74实施方案中,是第72实施方案的方法,其中所述固体支持物是珠子,所述隔室标签包含条形码,进一步其中包含多个连接到其上的隔室标签的珠子通过个体合成或固定化形成。在第75实施方案中,是第62至第74实施方案任一项的方法,其中所述间隔标签是记录标签中的成分,所述记录标签任选地还包括间隔、特异分子标签、通用引发位点、或它们的任何组合。在第76实施方案中,是第62至第75实施方案任一项的方法,其中所述间隔标签还包含能够在所述多个蛋白质复合体、蛋白质、或多肽上与内部氨基酸或N-末端氨基酸反应的功能基团。在第77实施方案中,是第76实施方案的方法,所述功能基团是NHS基。在第78实施方案中,是第76实施方案的方法,其中所述功能基团是醛基。第79实施方案是第62至第78实施方案任一项的方法,其中所述多个隔室标签通过以下方法形成:打印、点样、将隔室标签喷墨到隔室中,或它们的组合。在第80实施方案中,是第62至第79实施方案任一项的方法,其中所述隔室标签还包含肽。在第81实施方案中,是第80实施方案的方法,其中所述隔室标签肽包含蛋白连接酶识别序列。第82实施方案是第81实施方案的方法,其中所述蛋白连接酶是butelaseI或其同源物。在第83实施方案中,是第62至第82实施方案任一项的方法,其中所述多个多肽用蛋白酶片段化。在第84实施方案中,是第83实施方案的方法,其中所述蛋白酶是金属蛋白酶。在第85实施方案中,是第84实施方案的方法,其中所述金属蛋白酶的活性通过金属阳离子的光子激发释放来调节。在第86实施方案中,是第62至第85实施方案任一项的方法,还包含在将所述多个多肽分区成多个隔室之前,从样品中减去一种或多种高丰度蛋白。在第87实施方案中,是第62至第86实施方案任一项的方法,还包含在将所述多个肽联合到所述隔室标签之前,从所述固体支持物上释放所述隔室标签。在第88实施方案中,是第62实施方案的方法,还包括以下步骤d,将所述隔室标签肽连接到与记录标签相关的固体支持物上。在第89实施方案中,是第88实施方案的方法,还包括将所述隔室标记的肽上的所述隔室标签的信息传送到相关的记录标签。在第90实施方案中,是第89实施方案的方法,还包括在步骤步骤e之前将所述隔室标签从所述隔室标记的肽上移除。在第91实施方案中,是第62至第90实施方案任一项的方法,还包括基于分析的肽的隔室标签序列来确定所分析的肽的来源单细胞的身份。在第92实施方案中,是第62至第90实施方案任一项的方法,还包括基于分析的肽的隔室标签序列来确定所分析的肽来源的蛋白质或蛋白质复合物的身份。在第93实施方案中是分析多个大分子的方法,包括以下步骤:a提供多个大分子和连接在固体支持物上的相关记录标签;b使所述多个大分子与能够结合所述多个大分子的多个结合剂接触,其中每个结合剂包含具有所述结合剂的识别信息的编码标签;ci将所述大分子相关记录标签的信息传递到与大分子结合的结合剂的所述编码标签,以产生延伸编码标签;或ii将大分子相关记录标签和结合到所述大分子的结合剂的编码标签的信息传递到di-tag构建体;d收集隔所述延伸编码标签或di-tag构建体;e任选地重复步骤b-d一个或多个结合循环;f分析所述延伸编码标签或di-tag构建体的集合物。在第94实施方案中,是第93实施方案中的方法,其中所述大分子是蛋白。在第95实施方案中,是第93实施方案中的方法,其中所述大分子是肽。在第96实施方案中,是第95实施方案中的方法,其中所述肽是通过碎片化分离自生物样品的蛋白获得。在第97实施方案中,是第93至第96实施方案中任一项所述的方法,其中所述记录标签是DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子或其组合。在第98实施方案中,是第93至第97实施中任一项的方法,其中所述记录标签包含独特分子标识符UMI。在第99实施方案中,是第93-98实施方案中任一项的方法,其中所述记录标签包含隔室标签。在第100实施方案中,是第93至第99实施方案中任一项的方法,其中所述记录标签包含通用引发位点。在第101实施方案中是第93-100实施方案任一项所述的方法,其中所述记录标签在其3'-末端包含间隔子。在第102实施方案中,是第93至第101实施方案中任一项的方法,其中所述记录标签的3'-末端是封闭的,以防止所述记录标签通过合成酶延伸,并且所述大分子相关记录标签的信息和结合到所述大分子的结合剂的编码标签的信息被传送到di-tag构建体。在第103实施方案中,是第93至第102实施方案中任一项的方法,其中所述编码标签包含编码序列。在第104实施方案中,是第93至第103实施方案中任一项的方法,其中所述编码标签包含UMI。在第105实施方案中,是第93至第104实施方案中任一项的方法,其中所述编码标签包含通用引发位点。在第106实施方案中,是第93-105实施方案任一项所述的方法,所述编码标签在其3'-末端包含间隔子。在第107实施方案中,是第93至第106实施方案中任一项的方法,其中所述编码标签包含结合循环特异性序列。在第108实施方案中,是第93至第107实施方案中任一项的方法,其中所述结合剂和所述编码标签通过接头连接。在第109实施方案中,是第93至第108实施方案中任一项的方法,其中传送所述记录标签的信息到所述编码标签是通过引物延伸实现的。在第110实施方案中,是第93至第108实施方案中任一项的方法,其中所述传送记录标签的信息到所述编码标签是通过连接实现的。在第111实施方案中,是第93至第108实施方案中任一项的方法,其中所述di-tag构建体是通过间隙填充、引物延伸或它们二者产生的。在第112实施方案中是实施方案93-97、107、108和111中任一项的方法,其中所述di-tag分子包含衍生自所述记录标签的通用引发位点、衍生自所述记录标签的隔室标签、衍生自所述记录标签的独特分子标识符、衍生自所述记录标签的可选间隔子、衍生自所述编码标签的编码序列、衍生自编码标签的独特分子标识符、衍生自编码标签的可选间隔子和衍生自编码标签的通用引发位点。在第113实施方案中,是第93-112实施方案中任一项的方法,其中所述大分子和相关的记录标签共价结合到所述固体支持物上。在第114实施方案中,是第113实施方案的方法,其中所述固体支持物是珠子、多孔珠子、多孔基质、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶芯片、流通芯片、包含信号转导电子器件的生物芯片、微量滴定孔、ELISA板、旋转干涉测量盘、硝酸纤维素膜、硝化纤维素基聚合物表面、纳米颗粒或微球。第115实施方案是依据第114实施方案的方法,其中所述固体支持物是聚苯乙烯珠子、聚合物珠子、琼脂糖珠子、丙烯酰胺珠子、固体核心珠子、多孔珠子、顺磁珠子、玻璃珠子,或可控孔珠子。第116实施方案是依据第93至第115实施方案中任一项的方法,其中所述结合剂是多肽或蛋白质。第117实施方案是依据第116实施方案的方法,其中所述结合剂是修饰的氨肽酶、修饰的氨酰tRNA合成酶、修饰的anticalin或者抗体或抗体的结合片段。第118实施方案是第95至第117实施方案中任一项的方法,其中所述结合剂结合单个氨基酸残基、二肽、三肽或肽的翻译后修饰。第119实施方案是依据第118实施方案的方法,其中所述结合剂与N-末端氨基酸残基、C-末端氨基酸残基或内部氨基酸残基结合。第120实施方案是依据第118实施方案的方法,其中所述结合剂结合N-末端肽、C-末端肽或内部肽。第121实施方案是依据第119实施方案的方法,其中所述结合剂与N-末端氨基酸残基结合,并且在每个结合循环后切割N-末端氨基酸残基。第122实施方案是依据第119实施方案的方法,其中所述结合剂结合C-末端氨基酸残基,并且在每个结合循环后切割C-末端氨基酸残基。实施方案123是实施方案121所述的方法,其中所述的N-末端氨基酸残基通过Edman降解法切割。实施方案124是实施方案93所述的方法,其中所述的结合剂是氨基酸或翻译后修饰的位点特异性共价标记。实施方案125是第93至第124实施方案中任一项的方法,其中所述在步骤b之后,将包含大分子和相关结合剂的复合物从固体支持物上解离并分配成液滴或微流体液滴的乳液。实施方案126是实施方案125所述的方法,其中所述的每个微流体液滴,平均而言,都包含一种复合物,包括大分子和结合剂。实施方案127是实施方案125或126所述的方法,其中所述的记录标签在产生延伸编码标签或di-tag构建体之前扩增。实施方案128是第125至第127实施方案中任一项的方法,其中所述的乳液融合PCR用于将记录标签信息传递到编码标签或创建一组di-tag构建体。实施方案129是第93至第128实施方案中任一项的方法,其中所述的延伸编码标签或di-tag构建体的集合是在分析之前扩增的。实施方案130是第93至第129实施方案中任一项的方法,其中所述的分析延伸编码标签或二标签构建体的集合包括核酸测序方法。实施方案131是第130实施方案所述的方法,其中所述核酸测序方法是通过合成测序、连接测序、杂交测序、polony测序、离子半导体测序或焦磷酸测序。实施方案132是实施方案130所述的方法,其中所述核酸测序方法是单分子实时测序、基于纳米孔测序、或使用高级显微镜的DNA直接成像。实施方案133是实施方案130所述的方法,其中所述的大分子的部分组成,是通过使用独特的隔室标签和可选UMI分析多个延伸的编码标签或di-tag标签构建体来确定的。实施方案134是第1至第133实施方案中任一项的方法,其中分析步骤用测序方法进行,所述测序方法具有5%、10%、15%、20%、25%或30%的每碱基错误率。实施方案135是第1至第134实施方案中任一项的方法,其中所述的编码标签、记录标签或两者的识别组件包含纠错码。实施方案136是实施方案135所述的方法,其中所述识别组件选自编码器序列、条形码、UMI、隔室标签、循环特定序列或其任何组合。实施方案137是实施方案135或136所述的方法,其中所述的纠错码,选自汉明码、李距离码、非对称李距离码、里德-所罗门码和Levenshtein-Tenengolts码。实施方案138是第1至第134实施方案中任一项的方法,其中所述的编码标签、记录标签或两者的识别组件能够产生独特的电流或离子通量或光学特征,其中所述的分析步骤包括检测独特的电流或离子通量或光学特征,以识别识别组件。实施方案139是实施方案138所述的方法,其中所述识别组件选自编码器序列、条形码、UMI、隔室标签、循环特定序列或其任何组合。实施方案140是分析多个大分子的方法,包括以下步骤:a提供多个大分子和连接在固体支持物上的相关记录标签;b使所述多个大分子与能够结合同源大分子的多个结合剂接触,其中每个结合剂包含具有所述结合剂的识别信息的编码标签;c将第一结合剂的第一编码标签的信息传递到与第一大分子相关的第一记录标签,以产生第一次序延伸记录标签,其中所述第一结合剂与所述第一大分子结合;d使所述多个大分子与能够结合同源大分子的多个结合剂接触;e将第二结合剂的第二编码标签的信息传递到第一次序延伸记录标签,以产生第二次序延伸记录标签,其中所述第二结合剂结合所述第一大分子;f任选地重复步骤d–e“n”个结合循环,其中将结合到第一大分子的每个结合剂的每个编码标签的信息传递到前一个结合循环产生的所述延伸记录标签,以产生代表所述第一个大分子的第n次序延伸记录标签;g分析所述第n次序延伸记录标签。实施方案141是实施方案140所述的方法,其中生成并分析表示多个大分子的多个第n次序延伸记录标签。实施方案142是第140或第141实施方案所述的方法,其中所述大分子为蛋白。实施方案143是第142实施方案所述的方法,其中所述大分子为肽。实施方案144是第143实施方案所述的方法,其中所述肽是通过碎片化分离生物样品的蛋白而获得。实施方案145是第140至第144实施方案中任一项的方法,其中所述多个大分子包含来自多个合并样品的大分子。实施方案146是第140至第145实施方案中任一项的方法,其中所述记录标签是DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子或其组合。实施方案147是第140至第146实施方案中任一项的方法,其中记录标签包含独特分子标识符UMI。实施方案148是第140至第147实施方案所述的方法,其中所述记录标签包含隔室标签。实施方案149是第140至第148实施方案中任一项的方法,其中所述的记录标签包含通用引发位点。实施方案150是第140至第149实施方案任一项所述的方法,其中所述记录标签在其3'-末端包含间隔子。实施方案151是第140至第150实施方案中任一项的方法,其中所述编码标签包含编码器序列。实施案例152是第140至第151实施方案中任一项的方法,其中所述编码标签包含UMI。实施方案153是第140至第152实施方案中任一项的方法,其中所述的编码标签包含通用引发位点。实施方案154是第140至第153实施方案中任一项所述的方法,其中所述编码标签在其3'-末端包含间隔子。实施方案155是第140至第154实施方案中任一项的方法,其中所述编码标签包含结合循环特异性序列。实施方案156是第140至第155实施方案中任一项的方法,其中所述的编码标签包含特异分子标签。实施方案157是第140至第156实施方案中任一项的方法,其中所述的结合剂和所述编码标签通过接头连接。实施方案158是第140至第157实施方案中任一项的方法,其中所述记录标签到编码标签的信息传递通过引物延伸介导。实施方案159第140至第158实施方案中任一项的方法,其中所述记录标签到编码标签的信息传递通过连接介导。实施方案160是第140至第159实施方案中任一项的方法,其中所述多个大分子和相关的记录标签或者两者都结合到所述固体支持物上。实施方案161是第140至第160实施方案中任一项的方法,所述固体支持物是珠子、多孔珠子、多孔基质、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶芯片、流通芯片、包括信号转导电子器件的生物芯片、微量滴定孔、ELISA板、旋转干涉测量盘、硝酸纤维素膜、硝化纤维素基聚合物表面、纳米颗粒或微球。实施方案162是实施方案161所述的方法,其中所述固体支持物是聚苯乙烯珠子、聚合物珠子、琼脂糖珠子、丙烯酰胺珠子、固体核心珠子、多孔珠子、顺磁珠子、玻璃珠子或可控孔珠子。实施方案163是第140至第162实施方案中任一项的方法,其中所述结合剂是多肽或蛋白质。实施方案164是实施方案163所述的方法,其中所述结合剂是修饰的氨肽酶、修饰的氨酰tRNA合成酶、修饰的anticalin或者抗体或抗体的结合片段。实施方案165是第142至第164实施方案中任一项的方法,其中所述结合剂结合单个氨基酸残基、二肽、三肽或肽的翻译后修饰。实施方案166是实施方案165所述的方法,其中所述结合剂与N-末端氨基酸残基、C-末端氨基酸残基或内部氨基酸残基结合。实施方案167是实施方案165所述的方法,其中所述结合剂结合N-末端肽、C-末端肽或内部肽。实施方案168是第142至第164实施方案中任一项的方法,其中所述结合剂结合修饰的N-末端氨基酸残基的化学标签、修饰的C-末端氨基酸残基,或修饰的内部氨基酸残基。实施方案169是第166或168实施方案的方法,其中所述结合剂与N-末端氨基酸残基或修饰的N-末端氨基酸残基的所述化学标签结合,并且所述N-末端氨基酸残基在每个结合循环后被切割。实施方案170是第166或168实施方案的方法,其中所述结合剂与C-末端氨基酸残基或修饰的C-末端氨基酸残基的所述化学标签结合,并且所述C-末端氨基酸残基在每个结合循环后被切割。实施方案171是实施方案169所述的方法,其中所述的N-末端氨基酸残基通过Edman降解法、埃德曼酶、修饰的氨基肽酶、或修饰的酰基肽水解酶切割。实施方案172是实施方案163所述的方法,其中所述的结合剂是氨基酸位点的特异性共价标记或翻译后修饰的位点特异性共价标记。实施方案173是第140-172实施方案中任一项的方法,其中所述多个第n次序延伸记录标签在分析之前扩增。实施方案174是第140至第173实施方案中任一项的方法,其中分析所述第n次序延伸记录标签包含核酸测序方法。实施方案175是实施方案174所述的方法,其中代表多个大分子的多个第n次序延伸记录标签被平行分析。实施方案176是第174或175实施方案所述的方法,其中所述核酸测序方法是通过合成测序、连接测序、杂交测序、polony测序、离子半导体测序或焦磷酸测序。实施方案177是根据实施方案174或175所述的方法,其中核酸测序方法是单分子实时测序、基于纳米孔的测序或采用高级显微镜的DNA的直接成像。附图说明通过参考附图的示例方式描述本发明的非限制性实施例,其是示意性的并且不旨在按比例绘制。出于说明的目的,并非每个部件都标记在每个图中,也未示出本发明的每个实施例中对于本领域普通技术人员来说理解本发明不是必需的每个部件。附图1A-B:附图1A示出了在所述附图中显示的功能元件的图例。图1B示出了将蛋白质编码转导成DNA编码的一般概述,其中多个蛋白质或多肽被片段化成多个肽,然后将其转化成延伸记录标签文库,以代表多个肽。所述延伸记录标签构成代表所述肽序列的DNA编码文库。所述文库可以适当地修改以在任何下一代测序NGS平台上进行测序。附图2A-2D示出了根据本公开的方法的蛋白质大分子分析的示例,其采用包含编码标签的结合剂例如抗体、anticalins、N-recognins蛋白例如,ATP依赖性Clp蛋白酶衔接蛋白ClpS,适配体等以及其变体同源物、所述编码标签与固定的蛋白质互相作用,所述固定的蛋白质与单个或多个记录标签共定位或共标记。所述记录标签由通用引发位点、条形码例如,分区条形码、隔室条形码、分级物条形码、可选的独特分子标识符UMI序列,以及用于编码标签的信息传递的间隔序列Sp构成。所述间隔标签Sp在所有结合循环之间可以是恒定的、结合试剂特异性的、或结合循环数特异性的。所述编码标签由为结合剂提供识别信息的编码序列,可选的UMI,和与记录标签上的互补间隔序列杂交的间隔序列构成,便于将编码标签信息传递给所述记录标签例如,引物延伸,在本文中也称为合成酶延伸。图2A示出了通过所述同源结合剂与蛋白质环状结合产生延伸记录标签的过程,以及相应信息从所述结合剂的编码标签到蛋白质记录标签的传送。在一系列按顺序的结合和编码标签信息传送步骤之后,产生最终的延伸记录标签,其包含结合剂编码标签信息,所述结合剂编码标签信息包括编码器序列,其来自于为所述结合剂例如抗体2Ab2,抗体3Ab3,...抗体“n”Abn提供识别信息的“n”结合周期、来自于所述记录标签的条形码可选UMI序列、来自于所述结合剂编码标签的可选UMI序列,以及在所述文库构建体的每一末端的侧翼通用引物序列,以便于通过数字下一代测序进行扩增和分析。图2B示出了用DNA条形码记录标签标记蛋白的示意性例子。在上部图中,N-羟基琥珀酰亚胺NHS是胺反应性偶联剂,并且二苯并环辛基DBCO是用于“点击”偶联到固体基质的表面的张紧性炔烃。在该方案中,所述记录标签通过NHS基团与所述蛋白的赖氨酸K残基和任选的N-末端氨基酸的ε胺偶联。在底部图中,用异双功能连接子NHS-炔标记赖氨酸K残基的ε胺以产生炔“点击”基团。然后叠氮化物标记的DNA记录标签可以通过标准点击化学将容易地连接到这些反应性炔基上。此外,所述DNA记录标签也可以设计有正交的甲基四嗪mTet基团,用于通过逆iEDDA反应下游偶联到TCO衍生的测序底物。图2C示出了采用记录标签的蛋白分析方法的的例子。在顶部附图中,蛋白质大分子通过捕获剂和任选地的通过交联固定在固体支持物上。所述蛋白或捕获剂可以采用记录标签标记。在底部附图中,记录标签相关的蛋白直接固定在固体支持物上。图2D示出了使用同源结合物的DNA编码和所述产生的延伸记录标签的测序的简单蛋白免疫侧定的整体工作流程实例。所述蛋白可以通过记录标签进行条形码化即,索引并在循环结合分析之前汇集,大大增加样品通量并节省结合试剂。该方法实际上是用于进行反相蛋白质测定RPPA的数字化、更简单且更可扩展的方法。图3A-D通过构建代表肽序列的DNA延伸记录标签进行基于降解的肽测序分析的流程。这是通过在固体支撑物上使用N-末端氨基酸NTAA结合的循环过程、编码标签信息传递到与所述肽连接的记录标签、NTAA切割,以及以循环方式重复该过程的Edman降解样方法来实现。提供了对来自肽的N-末端降解的延伸记录标签的示例性构建的概述:A标记肽的N-末端氨基酸例如,采用用苯基硫代氨基甲酰基PTC、二硝基苯基DNP、磺酰基硝基苯基SNP、乙酰基或胍基基团;B显示了结合剂与结合到所述标记的NTAA的相关编码标签;C显示了结合到固体支持物例如,珠子并与记录标签例如,通过三官能接头相关的肽,其中在所述结合剂结合到所述肽的NTAA时,所述编码标签的信息被传递到所述记录标签例如,通过引物延伸以产生延伸的记录标签;D通过化学或酶促方法切割标记的NTAA以暴露新的NTAA。如箭头所指,所述循环重复“n”次以产生最终的延伸记录标签。所述最终的延伸记录标签可选地通过通用引发位点设置在侧翼以便于下游扩增以及DNA测序。所述正向通用引发位点例如,Illumina的P5-S1序列可以是原始记录标签设计的一部分,并且所述反向通用引发位点例如,Illumina的P7-S2'序列可以在所述记录标签的延伸的最后一步添加。所述最后一步可以用一个结合试剂独立地完成。图4A-B示出了根据本文公开的方法的示例性蛋白测序流程。图4A示出了具有以浅灰色虚线勾画出的替代模式的示例性工作流程,其中特定实施例以箭头链接的框示出。所述流程的每个步骤的替代模型在箭头下的框中示出。图4B示出了进行循环结合和编码标签信息传送步骤以提高信息传送效率的选项。每个分子可以采用多个记录标签。此外,对于给定的结合事件,编码标签信息传递到所述记录标签可以多次进行,或可选地,采用表面扩增步骤以产生所述延伸记录标签文库的拷贝,等等。图5A-B示出了使用引物延伸以将结合剂的编码标签的识别信息传递到与大分子例如肽相关的记录标签以产生延伸记录标签的延伸记录标签的示例性构建的概述。包含具有关于结合剂的识别信息的独特编码序列的编码标签可选地通过共同的间隔序列Sp’侧接在每个末端。图5A示出了包含结合到一个连接到珠子的记录标签标记的肽的NTAA的编码标签的NTAA结合剂。所述记录标签通过互补间隔序列Sp与所述编码标签退火,并且通过使用间隔区Sp作为引物位点,引物延伸反应介导编码标签的信息向所述记录标签的传递。所述编码标签显示,是在远离结合剂的一端具有单链间隔区Sp’序列的双链体。该配置使所述编码标签与记录标签中的内部位点的杂交最小化,并有利于所述记录标签的末端间隔区Sp序列与所述编码标签的单链间隔突出Sp’的杂交。此外,所述延伸记录标签可以与寡核苷酸与编码器、间隔序列互补预退火以阻止所述编码标签与内部记录标签序列元件的杂交。图5B显示在“n”个结合循环后产生的最终延伸记录标签“***”表示在延伸记录标签中未显示的干预结合循环和所述编码标签信息的传递以及在3'-端添加通用引发位点。图6示出了通过酶连接将编码标签信息传递到延伸记录标签。显示了两种不同的大分子及其各自的记录标签,其中记录标签延伸平行进行。可以通过设计双链编码标签促进连接,使得所述间隔序列Sp具有与所述记录标签上的互补间隔序列Sp’退火的“粘性末端”突出。双链编码标签的互补链传递信息到所述记录标签。当连接用于延伸所述记录标签,延伸的方向可以是如图所示的5’到3’,或可选的3’到5’。图7示出了通过化学连接将编码标签信息传递到记录标签,以将记录标签或延伸记录标签的3'核苷酸连接到所述编码标签或其互补体的5'核苷酸而不插入间隔序列到所述延伸记录标签的“无间隔”方法。所述延伸记录标签和编码标签的方向也可以转换,以便于将所述记录标签的5’端连接到所述编码标签或互补体的3’端。在显示的示例中,所述记录标签上的互补“辅助”寡核苷酸序列“记录辅助”和所述编码标签之间的杂交用于稳定所述复合物,以促使所述记录标签与编码标签互补链的特异性化学连接。所述产生的延伸记录标签缺乏间隔序列。还示出了可以使用DNA、PNA或类似的核酸聚合物的化学连接例如,使用叠氮和炔基团显示为三线符的“点击化学”版本。图8A-B示出了在N-末端氨基酸降解前,将肽的翻译后修饰PTM写入延伸记录标签的示例性方法。附图8A:包含具有关于所述结合剂例如,包含具有磷酸酪氨酸抗体的识别信息的编码标签的磷酸酪氨酸抗体的识别信息的编码标签的结合剂能够结合所述肽。如果磷酸酪氨酸存在于所述记录标签标记的肽中,如图所示,当所述磷酸酪氨酸抗体与磷酸酪氨酸结合后,所述编码标签和记录标签通过互补间隔序列退火并且所述编码标签信息被传递到所述记录标签以产生延伸记录标签。图8B:延伸记录标签可以包含用于初始氨基酸序列例如“aa1”,“aa2”,“aa3”,…,“aaN”的编码标签信息和所述肽的翻译后修饰例如“PTM1”,“PTM2”的编码标签信息。图9A-B示出了结合剂结合大分子并将附着于结合剂的编码标签的信息传递到多个记录标签中的单个记录标签从而产生共同代表所述大分子的多个延伸记录标签的多个循环过程,所述多个记录标签共定位于单个大分子的一个位点,所述单个大分子附着于固体支持物例如珠子。在这个附图中,仅出于举例的目的,所述大分子是肽,并且每个循环涉及将结合剂结合至N-末端氨基酸NTAA、通过将编码标签信息传递至记录标签来记录结合事件,然后去除NTAA以曝露新的NTAA。图9A示出了与所述大分子共定位于固体支撑物上的多个记录标签包含通用的正向引物序列和UMI。单个的记录标签具有与结合剂的编码标签内的共同间隔序列互补的共同间隔序列Sp,其可用于引发延伸反应以将编码标签信息传递至记录标签。图9B示出了用于每个连续结合循环的循环特异性NTAA结合剂的不同库,每个库具有循环特异性间隔序列。图10A-C示出了包含将附着于结合剂的编码标签的信息传递到多个记录标签中的单个记录标签从而产生共同代表所述大分子的多个延伸记录标签的多个循环的示例模型,所述多个记录标签共定位于单个大分子的一个位点,所述单个大分子附着于固体支持物例如珠子。在这个附图中,仅出于举例的目的,所述大分子是肽,并且每个循环过程涉及结合至N-末端氨基酸NTAA、记录结合事件,然后去除NTAA以曝露新的NTAA。图10A示出了与所述大分子共定位于固体支撑物上的多个记录标签包含通用的正向引物序列和UMI,优选每珠子一个单分子。单个记录标签在它们的3'-末端具有不同的间隔序列,其具有不同的“循环特异性”序列例如C1,C2,C3,…Cn。优选地,每个珠子上的所述记录标签分享相同的UMI序列。在第一个结合循环循环1中,使多个NTAA结合剂所述大分子接触。循环1中的结合剂具有共同的5’-间隔序列C’1,其与所述记录标签的所述循环1C1间隔序列互补。循环1中的结合剂也具有共同的3'-间隔序列C’2,其与所述循环2间隔子C2互补。在结合循环1期间,第一个NTAA结合剂结合到所述大分子的自由N-末端,并且第一编码标签的信息通过从杂交的C1序列到所述互补的C’1间隔序列的引物延伸传递到同源记录标签。除去NTAA以暴露新的NTAA之后,结合循环2使多个NTAA结合剂与所述单分子接触,所述NTAA结合剂具有与所述循环1的3'-间隔序列相同的循环2的5'-间隔序列C'2和共同的循环3的3'-间隔序列C’3。第2NTAA结合剂结合到所述大分子的N-末端,并且第2编码标签的信息通过互补的C2和C’2间隔序列的引物延伸传递到同源记录标签。这些循环重复到“n”个结合循环,其中最后的延伸记录标签用通用反向引发序列加盖,产生与单个大分子共定位的多个延伸记录标签,其中每个延伸记录标签具有来自一个结合循环的编码标签信息。因为在每个连续结合循环中使用的每组结合剂在所述编码标签中具有循环特异性间隔序列,所以结合循环信息可以与产生的延伸记录标签中的结合剂信息相关联。图10B示出了用于每个连续结合循环的循环特异性NTAA结合剂的不同库,每个库具有循环特异性间隔序列。图10C示出了共定位在所述大分子的位点上的延伸记录标签的集合如何使用循环特异性间隔序列按顺序基于PCR组装的所述延伸记录标签,从而提供有序的所述大分子的序列。在优选模型中,每个延伸记录标签的多个拷贝通过级联之前的扩增产生。图11A-B示出了信息从记录标签传递到编码标签或di-tag构建体。记录结合信息的两种方法在A和B中示出。结合剂可以是此处所述的任何类型的结合剂;仅出于说明的目的显示抗磷酸酪氨酸结合剂。对于延伸的编码标签或di-tag构建体,不是将所述编码标签中的结合信息传递到所述记录标签,而是将信息从所述记录标签传递到所述编码标签以生成延伸的编码标签A,或者将信息从所述记录标签和编码标签传递到第三个di-tag-forming构建体B所述di-tag和延伸编码标签包含所述记录标签包含条形码、可选的UMI序列和可选的隔室标签CT序列未示出和所述编码标签的信息。所述di-tag和延伸编码标签可从所述记录标签上被洗脱、收集,并可选地被扩增并在下一代测序仪上被读出。图12A-D示出了结合事件的PNA组合条形码UMI记录标签和di-tag检测的设计。在图12A中,示出了通过四个基本PNA单词序列A,A'-B,B'-C和C'的化学连接的组合PNA条形码UMI的构建。杂交DNA臂包括其中以产生用于PNA条形码UMI的组合装配的无间隔物组合模板。采用化学连接将退火的PNA“单词”缝合在一起。图12B示出了将所述记录标签的PNA信息传递到DNA中间体的方法。所述DNA中间体能够将信息传递给所述编码标签。即,将互补DNA单词序列与PNA退火并进行化学连接如果发现使用PNA模板的连接酶,则可选酶促连接。在图12C中,所述DNA中间体设计来通过间隔序列,SP与所述编码标签互作。链置换引物延伸步骤取代连接的DNA并将所述记录标签信息从所述DNA中间体传递到所述编码标签以产生延伸的编码标签。终止子核苷酸可以并入所述DNA中间体的末端以防止编码标签信息通过引物延伸传递到所述DNA中间体。图12D:或者,可以将信息从编码标签传递到所述DNA中间体以产生di-tag构建体。终止子核苷酸可以并入所述DNA中间体的末端以防止记录标签信息从所述DNA中间体传递到所述编码标签。图13A-E示了隔室条形码珠子上的蛋白质组分区,随后通过乳化融合PCR进行di-tag组装,以产生代表肽序列组成的元件库。随后可以通过N-末端测序或者通过与编码标签相关的氨基酸特异性化学标记或结合剂的附着共价或非共价来表征所述肽的氨基酸含量。所述编码标签包含通用引发位点、以及用于所述氨基酸识别的条形码、隔室标签、和氨基酸UMI。在信息传递之后,通过记录标签UMI将所述ditags映射回所述原始分子。在图13A中,所述蛋白质组被条形码化的珠子拆分为液滴。具有相关记录标签包括隔室条形码信息的肽附着在所述珠子的表面上。所述液体乳液打破后释放具有分区肽的条形码化珠子。在图13B中,在所述肽上的特异性氨基酸位点采用与共价连接到位点特异性标签基团的DNA编码标签化学标记。所述DNA编码标签包含氨基酸条形码信息和任选的氨基酸UMI。图13C:标记的肽-记录标签复合体从所述珠子上释放。图13D:所述标记的肽-记录标签复合物乳化成纳米或微乳液,使得每个隔室平均有少于一个肽-记录标签复合物。图13E:乳液融合PCR将记录标签信息例如,隔室条形码传递到所有与氨基酸残基连接的所述DNA编码标签上。图14示出了延伸编码标签从乳化肽记录标签-编码标签复合体产生。来自图13C的所述肽复合体与PCR试剂共乳化成为平均每个液滴具有单个肽复合体的液滴。使用三引物融合PCR方法扩增与肽相关的所述记录标签,将所述扩增的记录标签融合到多个结合剂编码标签或共价标记的氨基酸的编码标签上,通过引物延伸延伸所述编码标签从而转移肽UMI和所述记录标签的隔室标签信息到所述编码标签,并放大得到的延伸编码标签。每个液滴有多个延伸编码标签种类,每个氨基酸编码序列-UMI编码标签存在不同延伸编码标签种类。以这种方式,在所述肽中的氨基酸身份和数量都能被测定。所述U1通用引物和Sp引物被设计为比所述U2tr通用引物具有更高的熔化Tm。这使得能够进行两步PCR,其中在较高的退火温度下执行前几个循环以放大所述记录标签,然后进行到较低的Tm使得所述记录标签和编码标签在PCR期间互相引导以产生延伸编码标签,并且所述U1和U2tr通用引物用于引发所得的延伸编码标签产物的扩增。在一些实施方案中,来自所述U2tr引物的合成酶延伸可以采用光标记3’封闭基团来防止Youngetal.,2008,Chem.CommunCamb4:462-464。在第一轮PCR扩增所述记录标签,以及第二轮融合PCR步骤其中所述编码标签Sptr在扩增的所述记录标签的Sp’序列上引发所述编码标签的延伸之后,所述U2tr的3’封闭基团被移除,并且启动更高温度的PCR以采用U1和U2tr引物扩增所述延伸编码标签。图15图示了蛋白质组区和条形码的使用有助于增强蛋白的可映射性和定相。在肽测序中,蛋白通常被消化成肽。在该过程中,源自亲本蛋白分子的各个肽之间的关系的以及它们与亲本蛋白分子的关系的信息被丢失。为了重建该信息,将各个肽序列映射回可能是它们的来源的蛋白序列的集合。采用短和或部分肽序列,并且随着所述集合的大小和复杂性例如,蛋白质组序列复杂性增加,在这样的组中发现特异性匹配的任务变得更加困难。将蛋白质组分区为条形码化例如,隔室标记的隔室或分区,随后将所述蛋白质消化成肽,并所述隔室标签连接到所述肽降低了肽序列需要映射上去的所述“蛋白质”空间,在复杂蛋白质样品的情况下极大地简化了所述任务。在消化成肽之前采用独特分子标识符UMI标记蛋白质有助于肽映射回所述原始蛋白质分子并允许在源自相同蛋白质分子的翻译后修饰PTM变体之间的相信息的注释和单个蛋白质proteoforms形式的标识。图15A示出蛋白质组分区的例子,其包含用含有分区条形码的记录标签标记蛋白质并随后将其片段化成记录标签标记的肽。图15B:对于部分肽序列信息或甚至仅仅是组成信息,该映射是高度简并的。然而,部分肽序列或组成信息与来自相同蛋白质的多个肽的信息配对,允许原始蛋白质分子独特标识。图16图示了隔室标记的珠子序列设计的示例性模式。所述隔室标签包含X5-20的条形码以识别单个隔室和N5-10的独特分子标识符UMI以识别所述隔室标签连接的肽,其中X和N代表简并核酸碱基或核碱基词。隔室标签可以是单链上部描绘或双链下部描绘。任选地,隔室标签可以是嵌合分子,其包含具有用于连接目标肽左图的蛋白质连接酶例如,butelaseI的识别序列的肽序列。或者,化学基团可以包含于用于配对到目标肽例如叠氮化物,如右图所示的所述隔室标签中。图17A-B图示:A代表多个肽的多个延伸记录标签;B通过标准杂交捕获技术进行靶肽富集的示例性方法。例如,杂交捕获富集可以使用一种或多种生物素化的“诱饵”寡核苷酸,其与代表一种或多种感兴趣的肽“靶肽”的延伸记录标签杂交,所述一种或多种感兴趣的肽来源于代表肽文库的延伸记录标签库。所述诱饵寡核苷酸:靶延伸记录标签杂交对在杂交后通过所述生物素标签从溶液中下沉,以产生代表肽或目标肽的延伸记录标签的富集分解物。所述延伸记录标签的分离“下拉”可以,例如,使用链霉亲和素包被的磁珠完成。所述生物素基团与所述磁珠上的链霉亲和素结合,并且通过使用磁体固定所述磁珠完成分离同时除去或更换溶液。与代表不需要的或过度丰裕的肽的延伸记录标签竞争性杂交的非生物素化的竞争物富集寡核苷酸可任选地包括在杂交捕获测定的杂交步骤中,以调节富集的靶肽的量。所述非生物素化的竞争寡核苷酸竞争杂交到所述靶肽,但是由于不存在生物素基团,在捕获步骤期间不捕获杂交双链体。因此,可以通过在大的动态范围内调节竞争寡核苷酸与生物素化的“诱饵”寡核苷酸的比例来调节所述富集的延伸记录标签分级物。该步骤对于解决所述样品中蛋白质丰度的动态范围问题非常重要。图18A-B示出了单细胞和大量蛋白质组分区进单个液滴的示例性方法,每个液滴包含珠子,所述珠子具有附着于其上的多个隔室标签以将肽与其起源蛋白质复合物或源自单个细胞的蛋白质相关联。所述隔室标签包含条形码。液滴形成后液滴成分的操作:A单细胞被分区进单个液滴中,接着细胞裂解以释放细胞蛋白质组,以及蛋白水解以将所述细胞蛋白质组消化成肽,并在充分蛋白水解后失活所述蛋白酶;B大量蛋白质组被分区进入多个液滴中,其中单个液滴包含蛋白复合物,然后进行蛋白质水解以将所述蛋白复合物消化成肽,并在充分蛋白质水解后灭活所述蛋白酶。在光笼状二价阳离子的光释放photo-releaseofphoto-cageddivalentcations后,可用热不稳定的金属蛋白酶将包封的蛋白质消化成肽以激活所述蛋白酶。在充分蛋白水解后可以热灭活所述蛋白酶,或者可以螯合所述二价阳离子。液滴含有杂交的或可释放的隔室标签,其包含能够连接至肽的N-或C-末端氨基酸的核酸条形码分离自记录标签。图19A-B示出了单细胞和大量蛋白质组分区进单个液滴的示例性方法,每个液滴包含珠子,其具有多个双功能记录标签和连接于记录标签上的隔室标签,以将肽与其原始蛋白质或蛋白质复合物相关联,或将蛋白质与起源相关联。所述隔室标签包含条形码。液滴形成后液滴成分的操作:A单细胞被分区成单个液滴中,接着细胞裂解以释放细胞蛋白质组,以及蛋白水解以将所述细胞蛋白质组消化成肽,并在充分蛋白水解后失活所述蛋白酶;B大量蛋白质组被分区进入多个液滴中,其中单个液滴包含蛋白复合物,然后进行蛋白质水解以将所述蛋白复合物消化成肽,并在充分蛋白质水解后失活所述蛋白酶。在光笼状二价阳离子例如,Zn2+的光释放后,可用热不稳定的金属蛋白酶将包封的蛋白质消化成肽。在充分蛋白水解后可以热灭活所述蛋白酶,或者可以螯合所述二价阳离子。液滴含有杂交或可释放的隔室标签,其包含能够连接到肽的N-或C-末端氨基酸的核酸条形码分离自记录标签。图20A-L示出了附着于肽的隔室条形码化记录标签的产生。隔室条形码技术例如,微流体液滴中的条形码化珠子等可用于将隔室特异性条形码传递到封装在特定隔室内的分子内容物。A在一个具体实施方案中,使所述蛋白分子变性,并且使所述赖氨酸残基K的ε-胺基与活化的通用DNA标签分子包含通用引发序列U1化学缀合,在5'端用NHS基团显示。在将通用DNA标签与所述多肽缀合后,除去过量的通用DNA标签。B使所述通用DNA标记多肽与结合在珠子上的核酸分子杂交,其中所述结合在单个珠子上的核酸分子包含独特的隔室标签条形码序列的群组。通过将所述样品分离进入不同的物理隔室,例如液滴由虚线椭圆表示发生区室化。或者,可以通过将标记的多肽固定在所述珠子表面上来直接完成区室化,例如,通过将所述多肽上的通用DNA标签与所述珠子上的所述隔室DNA标签退火,而不需要额外的物理分离。单个多肽分子仅与单个珠子相互作用例如,单个多肽不跨越多个珠子。然而,多种多肽可以与同一个珠子相互作用。除了所述隔室条形码序列BC之外,与珠子结合的核酸分子可以由共同的Sp间隔子序列,独特分子标识符UMI以及与所述多肽DNA标签,U1’互补的序列组成。C在所述通用DNA标记的多肽与结合珠子的隔室标签退火后,通过切割所述附属接头从所述珠子释放所述隔室标签。D使用源自所述珠子的所述隔室标签核酸分子作为模板,通过基于聚合酶的引物延伸延伸所述退火的U1DNA标签引物。如C中所述引物延伸步骤可以在所述隔室标签从所述珠子释放之后进行,或者任选地,在所述隔室标签仍附着在所述珠子未示出时进行。这有效地将所述珠子上的所述隔室标签上的所述条形码序列写到所述多肽上的所述U1DNA标签序列上。这个新序列构成了记录标签。引物延伸后,蛋白酶,例如Lys-C切割赖氨酸残基的C-末端,Glu-C切割谷氨酸残基的C-末端并且在较低程度上切割谷氨酸残基的C-末端,或随机的蛋白酶如蛋白酶K,用于将所述多肽切割成肽片段。E每个肽片段用延伸的DNA标签序列标记,该延伸的DNA标签序列在其C-末端赖氨酸上构成记录标签,用于本公开中下游的肽测序。F所述记录标记的肽通过张紧性炔标记,DBCO与叠氮化珠子偶联。所述叠氮化珠子可选地还含有与所述记录标签互补的捕获序列,以促进DBCO-叠氮化物固定的效率。应该注意的是,所述肽从原始珠子中移除并重新固定到新的固体支持物例如珠子让肽之间形成最佳分子间间隔,有助于本文公开的肽测序方法。除了使用点击化学缀合DNA标签与炔烃预标记多肽如图2B中所述,图20G-L说明了与图20A-F中所示类似的概念。所述叠氮化物和mTet化学是正交的,允许点击缀合到DNA标签并点击iEDDA缀合mTet和TCO到所述测序底物。图21示出了使用用于单细胞的流式聚焦T形结构T-junction和采用珠子的隔室标记例如,条形码区室化的示例性方法。通过两个液流,可以在液滴形成时容易地引发细胞裂解和蛋白酶活化Zn2+混合。图22A-B示出了示例性标记细节。A通过采用ButelaseI的肽连接将隔室标签DNA-肽嵌合体连接到所述肽上。B在开始肽测序之前,将标签标签信息转移到相关的记录标签上。任选地,内肽酶AspN,其选择性地切割N-末端到天冬氨酸残基的肽键,可用于在信息转移至所述记录标签后切割所述隔室标签。图23A-C用于基于空间蛋白质组学的组织切片分析的基于阵列的条形码。A将一组空间编码的DNA条形码由BCij表示的特征条形码阵列与组织切片FFPE或冷冻组合。在一个实施方案中,所述组织切片是固定的并且透化的。在优选的实施方案中,所述阵列特征尺寸小于所述细胞大小对于人细胞为~10μm。B用试剂处理阵列式组织切片以逆转交联例如,通过采用柠康酸酐的抗原修复方案Namimatsu,Ghazizadeh等人,2005,然后其中的所述蛋白质用位点反应性DNA标记,从而用DNA记录标签有效地标记所有蛋白质分子例如,赖氨酸标记,在抗原修复后释放。标记和洗涤后,阵列结合的DNA条形码序列被切割并扩散到所述阵列式组织切片中并与其中的附着在所述蛋白质上的DNA记录标签杂交。C现在对所述阵列式组织进行聚合酶延伸,以将所述杂交的条形码的信息转移到标记所述蛋白质的DNA记录标签上。在转移所述条形码信息后,从所述载玻片上刮下所述阵列式组织,任选地用蛋白酶消化,并将蛋白质或肽提取到溶液中。图24A-B示出两种不同的示例性DNA靶大分子AB和CD,其固定在珠子上并通过与编码标签连接的结合剂进行测定。该模型系统用于演示编码标签从结合试剂转移到近端报告标签的单分子行为。在优选实施例中,所述编码标签通过引物延伸整合到延伸记录标签中。图24A示出了AB大分子与A特异性结合剂“A”,是与AB大分子的“A”组分互补的寡核苷酸序列的相互作用以及相关编码标签的信息通过引物延伸向记录标签的转移,以及B特异性结合剂“B”,是与AB大分子的“B”组分互补的寡核苷酸序列和相关编码标签的信息通过引物延伸向记录标签的转移。编码标签A和B具有不同的序列,并且为了便于在该图示中辨识,它们也具有不同的长度。所述不同的长度有助于通过凝胶电泳分析编码标签转移,而不需要通过下一代测序进行分析。所述A'和B'结合剂的结合被示为单个结合循环的替代可能性。如果增加第二个循环,则所述延伸记录标签将进一步延伸。取决于在第一和第二循环中添加A'或B'结合剂中的哪一种,所述延伸记录标签可以包含AA,AB,BA和BB形式的编码标签信息。因此,所述延伸记录标签包含结合事件次序以及结合子的身份的信息。类似地,图24B演示了CD大分子与C特异性结合剂“C”,是与CD大分子的“C”组分互补的寡核苷酸序列的相互作用以及相关编码标签的信息通过引物延伸转移到记录标签,和D特异性结合剂“D”,是与CD大分子的“D”组分互补的寡核苷酸序列和通过引物延伸将相关编码标签的信息转移到记录标签。编码标签C和D具有不同的序列,并且为了便于识别,在该图示中也具有不同的长度。所述不同长度有助于通过凝胶电泳分析编码标签转移,而不需要通过下一代测序进行分析。C'和D'结合剂的结合被示为单个结合循环的替代可能性。如果添加第二个循环,则所述延伸记录标签将进一步延伸。根据在第一和第二循环中添加C'或D'结合剂中的哪一种,所述延伸记录标签可以包含CC,CD,DC和DD形式的编码标签信息。编码标签可以可选地包含UMI。在编码标签中包含UMI可以记录结合事件的附加信息;并可以在单个结合剂水平上区分结合事件。如果单个结合剂可以参与一个以上的结合事件例如,其结合亲和力使得它可以足够频繁地脱离和重新结合以参与一个以上的事件,则可能很有用。它也可用于纠错。例如,在某些情况下编码标签可能在同一结合周期中将信息传递到所述记录标签两次或更多次。采用UMI可以暴露那些可能都与单个结合事件相关联的重复的信息传递事件。图25示出了示例性DNA靶大分子AB并固定在珠子上,并通过与编码标签连接的结合剂进行测定。A特异性结合剂“A”,与AB大分子的A组分互补的寡核苷酸与AB大分子相互作用,并通过连接将相关编码标签的信息转移至记录标签。B特异性结合剂“B”,与AB大分子的B组分互补的寡核苷酸与AB大分子相互作用,并通过连接将相关编码标签的信息转移至记录标签。编码标签A和B具有不同的序列,并且为了便于识别,在该图示中也具有不同的长度。所述不同长度有助于通过凝胶电泳分析编码标签转移,而不需要通过下一代测序进行分析。图26A-B示出了通过引物延伸的用于结合编码标签转移的示例性DNA-肽大分子。图26A示出了固定在珠子上的示例性寡核苷酸-肽靶大分子“A”寡核苷酸-CMyc肽。cMyc特异性结合剂例如抗体与所述大分子的所述cMyc肽部分相互作用,并且相关编码标签的信息被转移至记录标签。可以通过凝胶电泳分析cMyc编码标签的信息向记录标签的转移。图26B示出了固定在珠子上的示例性寡核苷酸-肽靶大分子“C”寡核苷酸-血凝素HA肽。HA特异性结合剂例如,抗体与所述大分子的所述HA肽部分相互作用,并且相关编码标签的信息被转移至记录标签。可以通过凝胶电泳分析编码标签的信息向记录标签的转移。cMyc抗体-编码标签和HA抗体-编码标签的结合被演示作为单个结合循环的替代可能性。如果执行第二个结合循环,则延伸记录标签将进一步被延伸。依赖于在第一和第二结合周期中添加cMyc抗体-编码标签或HA抗体-编码标签中的是哪一个,所述延伸记录标签可以包含cMyc-HA,HA-cMyc,cMyc-cMyc和HA-HA形式的编码标签信息。尽管未示出,但也可以引入另外的结合剂以能够检测所述大分子的所述A和C寡核苷酸组分。因此,可以通过将信息传递到记录标签并读出所述延伸记录标签来分析包含不同类型骨架的杂合大分子,所述延伸记录标签含有关于结合事件以及结合剂的身份的次序信息。图27A-D.纠错条形码的生成。A采用所述推荐参数[create.dnabarcodesn=15,dist=10]从所述R软件包‘DNABarcodes’https:bioconductor.riken.jppackages3.3biocmanualsDNABarcodesmanDNABarcodes.pdf衍生的77个条形码中选择65个纠错条形码SEQIDNO:1-65的子集。该算法生成15-mer“汉明”条形码,其可以将替换错误纠正到四次替换的距离,并检测到九次替换的错误。通过过滤除那些未显示出各种纳米孔电流水平用于基于纳米孔的测序或与该组的其他成员过于相关的条形码而创建了所述65个条形码的子集。B15-mer条形码通过所述纳米孔的预测纳米孔电流水平的示意图。通过将每个15-mer条形码字分成11个重叠的5-mer字的复合组来计算预测电流,在条形码一次一个碱基通过所述纳米孔时使用5-merR9纳米孔电流水平查找表template_median68pA.5mers.modelhttps:github.comjtsnanopolishtreemasteretcr9-models来预测对应的电流水平。从B可以理解,这组65个条形码为其每个成员展示出独特的电流特征。C作为用于纳米孔测序法的模式延伸记录标签的PCR产物的产生显示采用重叠的DTR组和DTR引物。然后连接PCR扩增子以形成级联的延伸记录标签模型。D示例性的“延伸记录标签”模型纳米孔测序读数读数长度734个碱基的产生如图27C所示。所述MinIonR9.4Read的质量得分为7.2读取质量差。然而,即使读数质量差Qscore=7.2,也可以使用lalign轻松识别条形码序列。15-mer间隔元件加下划线。条形码可以正向或反向排列,用BC或BC'表示。图28A-D.采用记录标签的蛋白质的分析物特异性标记。A靶向天然构象的目的蛋白质分析物的结合剂包含与DNA记录标签上的互补分析物特异性条形码BCA'杂交的分析物特异性条形码BCA。或者,所述DNA记录标签可以通过可切割的接头连接在所述结合剂上,并且所述DNA记录标签直接被“点击”到所述蛋白质上,然后从所述结合剂上被切除通过所述可切割的接头。所述DNA记录标签包含反应性偶联基团例如点击化学试剂如叠氮化物,mTet等,用于偶联所述目标蛋白质和其他功能组分例如,通用引物序列Sp,样品条形码BCS,分析物特异性条形码BCA和间隔序列Sp。样品条形码BCS也可用于标记和区分不同样品的蛋白质。所述DNA记录标签也可以包含正交偶联基团例如mTet,用于随后偶联到基质表面。对于所述记录标签与目标蛋白质的点击化学偶联,所述蛋白质用点击化学偶联基团预标记,该化学偶联基团与所述DNA记录标签例如,蛋白质上的炔基团与DNA记录标签上的叠氮基团同源上的点击化学偶联基团同源。用于用点击化学偶联的偶联基团标记DNA记录标签的试剂的实例包括用于赖氨酸标记的炔-NHS试剂、用于光亲和标记的炔-二苯甲酮试剂等。B在所述结合剂结合近端靶蛋白后,所述记录标签上的反应性偶联基团例如叠氮化物与所述近端蛋白上的同源点击化学偶联基团显示为三线符号共价连接。C在用所述记录标签标记所述目标蛋白质分析物后,通过采用尿嘧啶特异性切除试剂例如USERTM消化尿嘧啶U除去所述连接的结合剂。D采用合适的生物共轭化学反应,例如点击化学炔-叠氮化物结合对,甲基四嗪mTET-反式-环辛烯TCO结合对等将所述DNA记录标签标记的靶蛋白分析物固定到基质表面。在某些实施方案中,使用结合剂库和记录标签库在包含许多不同靶蛋白分析物的单个管中进行整个靶蛋白-记录标签标记测定。在用包含样品条形码BCS的记录标签对样品中的蛋白质分析物靶向标记后,可以在D中的固定步骤之前汇总多个蛋白质分析物样品。因此,在某些实施方案中,数百个样品中多达数千种蛋白质分析物可以在单管下一代蛋白质测定NGPA中标记和固定,极大地节省昂贵的亲和试剂例如抗体。图29A-E.DNA记录标签与多肽的缀合。A变性多肽用双功能点击化学试剂,例如炔-NHS酯乙炔-PEG-NHS酯试剂或炔二苯甲酮标记,以产生炔标记的三线符号多肽。炔烃也可以是张紧炔烃,例如环辛炔,包括二苯并环辛基DBCO等。B显示了化学偶联到所述炔烃标记的多肽的DNA记录标签设计的实例。所述记录标签包括通用引物序列P1、条形码BC和间隔序列Sp。所述记录标签用mTet基团标记以偶联到基质表面和用叠氮基团标记用于与标记多肽的炔基团偶联。C变性的炔烃标记蛋白或多肽通过炔烃和叠氮基团用记录标签标记。任选地,所述记录标签标记的多肽可以进一步用隔室条形码标记,例如通过与连接到隔室珠子和引物延伸也称为聚合酶延伸的互补序列退火,或如图20H-J所示。D蛋白酶消化所述记录标签标记的多肽产生一群记录标签标记的肽。在一些实施方案中,一些肽不会被任何记录标签标记。在其他实施方案中,一些肽可以附着一个或多个记录标签。E使用TCO基团官能化的基质表面和与肽连接的记录标签的mTet基团之间的反转电子Diels-AlderiEDDA点击化学反应,将记录标签标记的肽固定在基质表面上。在某些实施例中,可以在所示的不同阶段之间采用清理步骤。使用正交点击化学例如,叠氮化物-炔烃和mTet-TCO允许用记录标签对多肽进行点击化学标记,以及用点击化学固定所述记录标签标记的肽到基质表面上参见,McKayetal.,2014,Chem.Biol.21:1075-1101,其全部内容通过引用并入本文。图30A-E.在多肽的DNA标签初始标记后将样品条形码写入记录标签。A用双功能点击化学试剂如炔-NHS试剂或炔二苯甲酮标记变性的多肽,以产生炔标记的多肽。B在炔或替代点击化学试剂标记所述多肽之后,包含通用引物序列P1并用叠氮基团和mTet基团标记的DNA标签通过叠氮-炔相互作用与所述多肽偶联。应理解,可以采用其它点击化学相互作用。C包含样品条形码信息BCS'和其它记录标签功能组分例如,通用引物序列P1',间隔序列Sp'的记录标签DNA构建体通过互补的通用引发序列P1-P1'与所述DNA标签标记的多肽退火。通过聚合酶延伸将记录标签信息转移到所述DNA标签。D蛋白酶消化所述记录标签标记的多肽产生一群记录标签标记的肽。E使用TCO基团官能化的基质表面和与肽连接的记录标签的mTet基团之间的反转电子Diels-AlderiEDDA点击化学反应,将记录标签标记的肽固定在基质表面上。在某些实施例中,可以在所示的不同阶段之间采用清理步骤。使用正交点击化学例如,叠氮化物-炔烃和mTet-TCO允许用记录标签对多肽进行点击化学标记,以及用点击化学固定所述记录标签标记的肽到基质表面上参见,McKayetal.,2014,Chem.Biol.21:1075-1101,其全部内容通过引用并入本文。图31A-E.用于条形码多肽的珠子区室化。A使用标准生物共轭或光亲和标记技术的异双功能点击化学试剂在溶液中标记多肽。可能的标记位点包括赖氨酸残基的ε-胺例如,所示的采用NHS-炔烃或所述肽的碳主链例如,采用二苯甲酮-炔烃。B包含通用引物序列P1的叠氮化物标记的DNA标签与所述标记的多肽的所述炔基团偶联。C通过互补DNA序列P1和P1'将所述DNA标签标记的多肽与DNA记录标签标记的珠子退火。所述珠子上的所述DNA记录标签包含间隔序列Sp',区室条形码序列BCP',可选的独特分子标识符UMI和通用序列P1'。所述DNA记录标签信息通过聚合酶延伸或者,可以采用连接转移到所述多肽上的所述DNA标签上。在信息转移后,所得多肽包含多个记录标签,其包含隔室条形码在内的若干功能元件。D蛋白酶消化所述记录标签标记的多肽产生一群记录标签标记的肽。所述记录标签标记的肽与所述珠子解离,并且E重新固定到测序基质上例如,如图所示,使用mTet和TCO基团之间的iEDDA点击化学。图32A-H.下一代蛋白质测定NGPA的工作流程示例。蛋白质样品用由几个功能单元,例如通用引用序列P1、条形码序列BC、可选的UMI序列和间隔序列Sp能够与结合试剂编码标签促使信息传递,组成的DNA记录标签标记。A将所述标记的蛋白被固定被动地或共价地到基质例如珠子、多孔珠子或多孔基质上。B所述基质用蛋白封闭,并任选地加入与所述间隔序列互补的竞争寡核苷酸Sp'以使分析物记录标签序列的非特异性相互作用最小化。C将分析物特异性抗体连有相关编码标签与基质结合蛋白一起孵育。所述编码标签可包含尿嘧啶碱基,用于随后的尿嘧啶特异性切割。D抗体结合后,洗去过量的竞争性寡核苷酸Sp'如果加入的话。所述编码标签通过互补间隔序列瞬时退火到所述记录标签,并且所述编码标签信息在引物延伸反应中转移到所述记录标签以产生延伸记录标签。如果所述固定的蛋白质是变性的,则所述结合的抗体和退火的编码标签可以在碱性条件下,例如用0.1NNaOH,洗涤除去。如果固定的蛋白质处于天然构象,则可能需要较温和的条件来除去结合的抗体和编码标签。在图E-H中概述了较温和的抗体去除条件的实例。E在信息从所述编码标签转移到所述记录标签之后,使用尿嘧啶特异性切除试剂例如USERTM酶混合物在其尿嘧啶位点切割切割所述编码标签。F使用高盐、低高pH洗涤液从蛋白中去除所述结合的抗体。保留在抗体上的所述截短的DNA编码标签很短并且也快速洗脱。较长的DNA编码标签片段可以与所述记录标签保持或不保持退火。G如步骤B-D中,第二结合循环开始并且第二引物延伸步骤通过引物延伸将所述编码标签信息从所述第二抗体转移到所述延伸的记录标签。H两个结合循环的结果是来自于附着在所述记录标签的所述第一抗体的结合信息和所述第二抗体的结合信息的级联。图33A-D:使用多种结合剂和酶促介导的顺序信息传递的单步下一代蛋白测定NGPA。采用同时结合两种同源结合剂例如抗体固定的蛋白质分子的NGPA测定法。在多个同源抗体结合事件后,使用组合的引物延伸和DNA缺口步骤将来自结合抗体的所述编码标签的信息转移至所述记录标签。所述编码标签中的插入符号^代表双链DNA切口核酸内切酶位点。A在所示的实施例中,与蛋白质的表位1Epi#1结合的所述抗体的所述编码标签在互补间隔序列杂交后的引物延伸步骤中将编码标签信息例如,编码器序列转移至所述记录标签。B一旦所述延伸记录标签和编码标签之间形成所述双链DNA双体,缺口内切酶例如Nt.BsmAI,其在37℃时有活性,仅切割双链DNA基质上的单链DNA,用于切割所述编码标签。在所述缺割步骤之后,由所述截短的编码标签结合剂和延伸的记录标签形成的双体是热力学不稳定的且解离的。所述较长的编码标签片段可以与所述记录标签保持或不保持退火。C这让来自与蛋白质的表位#2Epi#2结合的所述抗体的所述编码标签通过互补间隔序列与所述延伸记录标签退火,并且所述延伸记录标签通过经引物延伸从Epi#2抗体的所述编码标签到所述延伸记录标签的信息传递来进一步延伸。D再次,在延伸记录标签和Epi#2抗体的编码标签之间形成双链DNA双体后,所述编码标签被切口核酸内切酶如Nb.BssSI切割。在某些实施方案中,优选在引物延伸期间使用非链置换聚合酶也称为聚合酶延伸。非链置换聚合酶防止所述切割的编码标签短柱延伸,其通过一个以上单碱基与所述记录标签保持退火。A-D的过程可以自己重复,直到近端结合的结合剂的所有所述编码标签被所述杂交、信息转移到所述延伸记录标签,和切割步骤“消耗”。所述编码标签可以包括与对给定分析物例如,同源蛋白特异的所有结合剂例如,抗体相同的编码序列,可以包含表位特异性编码序列,或者可以包含独特分子标识符UMI以区分不同的分子事件。图34A-C:记录标签的受控密度-使用滴定基板表面上的反应性基团来固定肽。A可以通过控制基质表面上的功能性偶联基团的密度来滴定所述基质的表面上的肽密度。这可以通过活性偶联分子和“虚拟”偶联分子的适当比例对所述基质表面进行衍生来实现。在所示的实例中,NHS-PEG-TCO试剂活性偶联分子与NHS-mPEG虚拟分子以确定的比例组合和TCO来衍生胺表面。功能化的PEG具有300至超过40,000的各种分子量。B使用琥珀酰亚胺基4-N-马来酰亚胺甲基环己烷-1SMCC双功能交联剂将双功能5'胺DNA记录标签mTet是其它功能基团偶联到肽的N-末端Cys残基。所述记录标签上的内部mTet-dT基团是使用mTetrazine-Azide从叠氮化物-dT基团产生的。C采用用mTet和TCO的iTDA点击化学反应,将标记肽的所述记录标签固定在A的所述活化基质表面上。所述mTet-TCOiEDDA偶联反应非常快速,高效且稳定mTet-TCO比Tet-TCO更稳定。图35A-C.下一代蛋白质测序NGPS结合周期特异性编码标签。A采用循环特异性N-末端氨基酸NTAA结合剂编码标签的NGPS测定的设计。NTAA结合剂例如,对N-末端DNP标记酪氨酸特异的抗体与肽的DNP标记的NTAA结合,所述肽与包含通用引物序列P1、条形码BC和间隔序列SP的记录标签相关。当所述结合剂结合所述肽的同源NTAA时,与所述NTAA结合剂相关的所述编码标签接近所述记录标签并通过互补间隔序列与所述记录标签退火。编码标签信息通过引物延伸转移到所述记录标签。为了跟踪编码标签代表哪一个结合循环,所述编码标签可以包括循环特异性条形码。在某些实施方案中,结合到分析物的结合剂的编码标签具有独立于循环数的相同的编码器条形码,其与独特的结合循环特异性条形码组合。在其它实施方案中,用于分析物的结合剂的编码标签包含用于组合的分析物结合循环信息的独特编码器条形码。在任一种方法中,共同的间隔序列可用于每个结合循环中的结合剂的编码标签。B在该例子中,来自每个结合循环的结合剂具有短的结合循环特异性条形码以识别所述结合循环,其与识别所述结合剂的所述编码器条形码一起提供独特的组合条形码,其识别特别的结合剂-结合循环组合。C在所述结合循环完成后,使用加帽循环步骤可将所述延伸记录标签转化为可扩增的文库,其中例如,包含连接到通用引物序列P2的通用引物序列P1和间隔序列Sp'的帽最初通过互补的P1和P1'序列与延伸记录标签退火,使所述帽子接近所述延伸记录标签。所述延伸记录标签中的互补Sp和Sp'序列和帽退火及引物延伸将所述第二通用引物序列P2添加到所述延伸记录标签。图36A-E.用于演示从编码标签到记录标签的信息传递的基于DNA的模型系统。通过寡核苷酸模型系统演示了示例性结合和分子内写入。编码标签中的靶向剂A'和B'设计来与记录标签中的靶结合区A和B杂交。通过汇集两个相同浓度的重新编码标签saRT_Abc_v2A靶标和saRT_Bbc_V2B靶标来制备记录标签RT混合物。记录标签在其5'末端生物素化,并含有独特靶结合区、通用正向引物序列、独特的DNA条形码,和8碱基共同间隔序列Sp。所述编码标签包含独特的编码器条形码碱基,其侧翼为8个碱基共同间隔序列Sp',其中一个通过聚乙二醇接头共价连接到A或B靶试剂。A将生物素化的记录标签寡核苷酸saRT_Abc_v2和saRT_Bbc_V2和生物素化的Dummy-T10寡核苷酸一起固定在链霉亲和素标记的珠子。所述记录标签设计有A或B捕获序列分别被同源结合剂-A'和B'识别和相应的条形码rtA_BC和rtB_BC以鉴定所述结合靶标。该模型系统中的所有条形码选自所述65个15-mer条形码组SEQIDNO:1-65。在某些情况下,15-mer条形码被组合以构成更长的条形码,以便于凝胶分析。特别是,rtA_BC=BC_1+BC_2;rtB_BC=BC_3。还合成了与所述记录标签的所述A和B序列同源的结合剂的两个编码标签,即CT_A'-bc编码器条形码=BC_5和CT_B'-bc编码器条形码=BC_5+BC_6。对所述编码标签序列的一部分留下单链Sp'序列的互补封闭寡核苷酸DupCT_A'BC和DupCT_AB'BC任选地在编码标签在退火至所述珠子固定的记录标签之前预先退火至所述编码标签。链置换聚合酶在聚合酶延伸期间去除所述阻断寡核苷酸。条形码图例插图表明对所述记录标签和编码标签中的所述功能条形码的15-mer条形码分配。B所述记录标签条形码设计和编码标签编码器条形码设计提供了对记录标签和编码标签之间的“分子内”对“分子间”相互作用的简单凝胶分析。在这种设计中,不期望的“分子间”相互作用A记录标签与B'编码标签;以及B记录标签与A'编码标签产生的凝胶产物比期望的“分子内”A记录标签与A'编码标签;B记录标签与B'编码标签反应产物更长或更短15个碱基。所述引物延伸步骤将A'和B'编码标签条形码ctA'_BC,ctB'_BC改变为反向补体条形码ctA_BC和ctB_BC。C引物延伸测定演示了从编码标签到记录标签的信息转移,以及用于PCR分析的通过退火的EndCap寡核苷酸上的引物延伸添加衔接头序列。D通过使用Dummy-T20寡核苷酸滴定记录标签的表面密度来优化“分子内”信息传递。将生物素化的记录标签寡核苷酸与生物素化的Dummy-T20寡核苷酸以1:0、1:10的各种比例混合,一直到1:10000。在降低的记录标签密度1:103和1:104下,“分子内”相互作用相对于“分子间”相互作用占主导地位。F作为所述DNA模型系统的简单扩展,虽然图示了含有Nano-Tag15肽-链霉亲和素结合对的简单蛋白质结合系统KD~4nMPerbandt等人,2007,Proteins67:1147-1153,但是可以使用任何数量的肽结合剂模型系统。Nano-Tag15肽序列是fMDVEAWLGARVPLVETSEQIDNO:131fM=甲酰基-Met。Nano-Tag15肽还包含短的、柔性的接头肽GGGGS和用于偶联所述DNA记录标签的半胱氨酸残基。其它实例肽标签-同源结合剂对包括:钙调蛋白结合肽CBP-钙调蛋白KD~2pMMukherjee等,2015,J.Mol.Biol.427:2707-2725、淀粉样蛋白-βAβ16–27肽-US7Lcn2anticalin0.2nMRauth等,2016,Biochem.J.473:1563-1578、PA标签NZ-1抗体KD~400pM、FLAG-M2Ab28nM、HA-4B2Ab1.6nM和Myc-9E10Ab2.2nMFujii等,2014,ProteinExpr.Purif.95:240-247。E作为通过引物延伸对分子内信息从所述结合剂编码标签向所述记录标签转移的测试,结合互补DNA序列“A”的寡核苷酸“结合剂”可用于测试和开发。该杂交事件基本上强于fM亲和力。链霉亲和素可以用作Nano-tag15肽表位的测试结合剂。虽然所述肽标签-结合剂互作是高度亲和的,但是很容易采用酸性和或高盐洗涤破坏Perbandt等,同上。图37A-B.使用纳米或微乳化PCR将信息从UMI标记的N或C末端转移至DNA标签标记多肽体。A多肽在其N-或C-末端用包含独特分子标识符UMI的核酸分子标记。所述UMI可以侧接用于引发后续PCR的序列。然后所述多肽用单独的DNA标签在其内部位点进行“身体标记”,所述单独的DNA标签包含与所述UMI侧翼的引发序列互补的序列。B将得到的标记多肽乳化并进行乳化PCRePCR或者,可以进行乳化体外转录-RT-PCRIVT-RT-PCR反应或其它合适的扩增反应以扩增N-或C-端UMI。形成微乳液或纳米乳液,使得平均液滴直径为50-1000nm,并且平均每个液滴少于一个多肽。PCR前后的液滴内容快照分别显示在左侧面板和右侧面板中。所述UMI扩增子通过互补引发序列与所述内部多肽体DNA标签杂交,并且所述UMI信息通过引物延伸从所述扩增子转移至所述内部多肽体DNA标签。图38.单细胞蛋白质组学。在含有聚合物形成亚单元例如丙烯酰胺的液滴中包封并裂解将细胞。聚合所述聚合物形成亚单元例如,聚丙烯酰胺,且将蛋白质交联到所述聚合物矩阵。破坏所述乳液液滴并释放含有附着于所述可渗透聚合物矩阵的单细胞蛋白裂解物的聚合凝胶粒。通过在裂解和包封缓冲液中包含变性剂如尿素,将所述蛋白质以其天然构象或变性状态交联到所述聚合物矩阵。使用本领域已知的或本文公开的许多方法包括采用条形码珠粒的乳化或组合索引,将包含隔室条形码和其它记录标签组分例如,通用引发序列P1,间隔序列Sp,任选的独特分子标识符UMI的记录标签附着到所述蛋白质上。含有所述单细胞蛋白质的所述聚合凝胶珠粒也可在加入记录标签后进行蛋白酶消化,以产生适合肽测序的记录标签标记的肽。在某些实施方案中,所述聚合物矩阵可以设计成溶解在适合的添加剂中,例如二硫化物交联聚合物,其在暴露于还原剂如三2-羧乙基膦TCEP或二硫苏糖醇DTT时破裂。图39A-E.使用双功能N-末端氨基酸NTAA修饰剂和嵌合裂解试剂增强氨基酸切割反应。A和B连接到固相基质上的肽用双功能NTAA修饰剂修饰,例如生物素-苯基异硫氰酸酯PITC。C使用链霉亲和素-Edmanase嵌合蛋白将低亲和力的EdmanaseμMKd募集到生物素-PITC标记的NTAA中。D由于生物素-链霉亲和素相互作用导致局部有效浓度增加,因此所述Edmanase切割的效率大大提高。E所述切割的生物素-PITC标记的NTAA和相关的链霉亲和素-Edmanase嵌合蛋白在切割后扩散开。也可以采用其它许多生物共轭招募策略。叠氮化物修饰的PITC是可商购的4-叠氮基苯基异硫氰酸酯,Sigma,可以将叠氮化物-PITC简单转化为PITC的其它生物缀合物,例如生物素-PITC通过点击化学与炔烃-生物素反应。图40A-I:从蛋白质裂解物产生C-末端记录标签-标记的肽可以包封在凝胶珠中。A使变性多肽与酸酐反应以标记赖氨酸残基。在一个实施方案中,使用炔mTet-取代的柠康酐+丙酸酐的混合物与mTet标记所述赖氨酸。显示为条纹状矩形B结果是炔mTet标记的多肽,其中一部分赖氨酸被具有丙酸基团在所述多肽链上显示为正方形封闭。所述炔烃mTet基团可用于基于DNA标记的点击化学。C用于炔烃或mTet基团的DNA标签显示为实心矩形分别通过使用叠氮化物或反式环辛烯TCO标签连接。D如图31中所示,使用引物延伸步骤将条形码和功能元件如间隔区Sp序列和通用引发序列附加到DNA标签上以产生记录标签标记的多肽。所述条形码可以是样品条形码、分区条形码、隔室条形码、空间位置条形码等,或其任何组合。E将得到的所述记录标签标记的多肽用蛋白酶或化学方法片段化成记录标签标记的肽。F为了图示,显示了用两个记录标签标记的肽片段。G将包含与所述记录标签中的所述通用引物序列互补的通用引物序列的DNA标签连接到肽的C末端。所述C末端DNA标签还包含用于将所述肽缀合至表面的基团。H所述C末端DNA标签中的互补通用引物序列和随机选择的记录标签退火。分子内引物延伸反应用于将信息从所述记录标签转移至所述C-末端DNA标签。I通过马来酸酐将所述肽上的所述内部记录标签偶联到赖氨酸残基上,该偶联在酸性pH下是可逆的。所述内部记录标签在酸性pH下从肽的赖氨酸残基上切割下来,留下所述C端记录标签。新暴露的赖氨酸残基可任选地用不可水解的酸酐如丙酸酐封闭。图41.NGPS测定的优选实施方案的工作流程。图42A-D.NGPS测序分析的示例性步骤。记录标签标记的表面结合肽上的N-末端氨基酸NTAA乙酰化或酰胺化步骤可以在NTAA结合剂结合之前或之后发生,其取决于NTAA结合剂是否已经被工程化以结合乙酰化NTAA或本地NTAAs。在第一种情况下,A所述肽最初在所述NTAA处通过采用乙酸酐的化学手段或采用N-末端乙酰转移酶NAT的酶促乙酰化。B所述NTAA被NTAA结合剂例如工程化的anticalin、氨酰基tRNA合成酶aaRS、ClpS等识别。DNA编码标签附着于所述结合剂并包含识别所述特定的NTAA接合剂的条形码编码序列。C在通过所述NTAA结合剂结合所述乙酰化NTAA后,所述DNA编码标签通过互补序列与所述记录标签瞬时退火,并且所述编码标签信息通过聚合酶延伸转移至所述记录标签。在另一个替代实施方案中,所述记录标签信息通过聚合酶延伸转移到所述编码标签。D通过工程化的酰基肽水解酶APH从所述肽上切割所述乙酰化的NTAA,所述工程化的酰基肽水解酶催化末端乙酰化氨基酸从乙酰化肽的水解。在所述乙酰化的NTAA裂解后,所述循环从所述新暴露的NTAA的乙酰化开始重复它自己。虽然N-末端乙酰化用作为NTAA修饰切割的示例性模式,但是其他N-末端基团,例如脒基基团,可以被切割化学中的伴随变化取代。如果使用胍基化,可以使用0.5-2%NaOH溶液在温和条件下裂解所述鸟苷酸化的NTAA参见Hamada,2016,其全部内容通过引用并入。APH是丝氨酸肽酶,其能够催化从封闭的肽中去除Nα-乙酰化氨基酸,并且它属于所述脯氨酰寡肽酶POP家族氏族SC,家族S9。它是真核细胞、细菌和古细胞中N末端乙酰化蛋白的关键调节因子。图43A-B:示例性记录标签-编码标签设计特征。A示例性记录标签相关蛋白或肽和与相关编码标签绑定的结合剂例如,anticalin的结构。将胸苷T碱基插入所述编码标签上的间隔区Sp'和条形码BC'序列之间,以在引物延伸反应中容纳随机的非模板化3'末端的腺苷A加成。BDNA编码标签通过SpyCatcher-SpyTag蛋白-肽相互作用与结合剂例如,anticalin连接。图44A-E.使用裂解剂与记录标签A和B的杂交增强NTAA裂解反应。附着于固相基质例如珠子的记录标签标记的肽在所述NTAAMod上被修饰或标记,例如,用PITC、DNP、SNP、乙酰基修饰剂、胍基化等。CA裂解酶例如,酰基肽水解酶APH、氨基肽酶AP、Edmanase等附着于DNA标签,该DNA标签包含与记录标签上的通用引物序列互补的通用引物序列。通过所述裂解酶的DNA标签和所述记录标签上的互补通用引物序列的杂交,将所述裂解酶募集到所述修饰的NTAA中。D该杂交步骤极大地提高了所述裂解酶对所述NTAA的有效亲和力。E所述切割的NTAA扩散开,并且可以通过剥离所述杂交的DNA标签除去相关的切割酶。图45.使用肽连接酶+蛋白酶+二氨基肽酶的循环降解肽测序。ButelaseI将所述TEV-ButelaseI肽底物TENLYFQNHV,SEQIDNO:132连接至待测肽的所述NTAA。Butelase需要肽底物C末端的NHV基序。连接后,使用烟草蚀纹病毒TEV蛋白酶在谷氨酰胺Q残基后切割所述嵌合的肽底物,留下具有连接到待测肽的N-末端的天冬酰胺N残基的嵌合肽。二氨基肽酶DAP或二肽基肽酶,其从所述N-末端切割两个氨基酸残基,通过两个氨基酸有效去除待测肽上的天冬酰胺残基N和原始NTAA以缩短N端添加的待测肽。使用本文提供的结合剂读取所述新暴露的NTAA,然后对测序的“n”个氨基酸重复整个循环“n”次。链霉亲和素-DAP金属酶嵌合蛋白的应用以及将生物素基团束缚在N-末端天冬酰胺残基上可以控制DAP合成能力。详细说明本文未具体定义的术语应由本领域技术人员根据本公开和上下文给出含义。然而,如说明书中所使用的,除非有相反的说明,否则这些术语具有指示的含义。I.介绍本公开内容部分地提供了高度平行的、高通量数字表征和定量大分子的方法,其直接应用于蛋白和肽的表征和测序参见图1B、图2A。本文所述的方法使用包含编码标签的结合剂,所述编码标签具有核酸分子或可测序聚合物形式的识别信息,其中所述结合剂与感兴趣的大分子相互作用。进行多个连续的结合循环,每个循环包含将固定在固体支持物上的多个大分子,优选代表汇集样品,暴露于多种结合剂。在每个结合循环期间,通过将来自结合剂编码标签的信息传递至与大分子共定位的记录标签,来记录结合大分子的每种结合剂的身份,也可选记录结合循环数。在一个替代实施方案中,来自包含相关大分子的识别信息的记录标签的信息可以传递到所结合的结合剂的编码标签例如,形成延伸编码标签或第三“di-tag”构建体。多个循环的结合事件在与大分子共定位的记录标签上构建历史结合信息,从而产生包含多个编码标签的延伸记录标签,所述多个编码标签以共线性顺序代表给定大分子的临时结合历史。另外,可以采用循环特定编码标签来跟踪来自每个循环的信息,这样如果一个循环由于某种原因被跳过,所述延伸记录标签可以继续在后续循环中收集信息,并识别信息缺失的循环。或者,可以将信息从包含相关大分子的识别信息的记录标签传递到形成延伸编码标签或第三个di-tag构建体的编码标签,以替代将信息从所述编码标签写入或传递到所述记录标签。可以在每个结合循环后收集形成的延伸编码标签或di-tags,便于随后的序列分析。在包含条形码例如,分区标签、隔室标签、样本标签、分级物标签、UMI或其任何组合的所述记录标签上的所述识别信息可用于将所述延伸编码标签或di-tag序列读数映射回原始大分子。以这种方式,产生了代表大分子结合历史的核酸编码文库。可以扩增该核酸编码文库,并使用高通量的下一代数字测序方法进行分析,使每次运行能够分析数百万至数十亿分子。创建核酸的结合信息编码库在另一方面也有用,因为它能够通过利用杂交的基于DNA的技术进行富集、扣减和标准化。这些基于DNA的方法易于快速扩展和定制,并且比直接操作其它类型的大分子文库如蛋白质库的方法更具成本效益,因此,可以在测序之前通过一种或多种技术处理核酸编码的结合信息文库,以富集和或扣减和或标准化所述序列的代表。这使得可以更有效、更快速、更经济高效地从非常大的文库提取最需要的信息,这些文库中的个体成员最初可能会在丰度上呈现多个数量级的变化。重要的是,这些用于操作文库代表的基于核酸的技术与更常规的方法正交,并且可以与它们组合使用。例如,可以使用基于蛋白质的方法扣减常见的高丰度蛋白,例如白蛋白,可以去除大部分但不是所有不需要的蛋白质。随后,还可以扣减延伸记录标签文库的白蛋白特异性成员,从而实现更完整的整体扣减。一个方面,本公开内容提供了使用Edman样降解方法进行肽测序的高度并行化的方法,允许从大量DNA记录标签标记的肽例如,数百万至数十亿进行测序。这些记录标签标记的肽衍生自蛋白样品的蛋白水解消化或有限水解,并且所述记录标签标记的肽以适当的分子间间隔随机固定在测序基质例如,多孔珠上。具有小化学基团的肽的N-末端氨基酸NTAA残基的修饰,例如苯基硫代氨基甲酰基PTC,二硝基苯酚DNP,磺酰基硝基苯酚SNP,丹酰基,7-甲氧基香豆素,乙酰基或胍基,催化或募集NTAA裂解反应允许循环控制所述Edman样降解过程。所述修饰的化学基团还可以为同源NTAA结合剂提供增强的结合亲和力。通过结合包含编码标签的同源NTAA结合剂,并将编码标签信息例如,提供结合剂的识别信息的编码器序列从所述编码标签传递到所述记录标签例如,引物延伸或连接,来鉴定每种固定化肽的修饰的NTAA。随后,通过化学方法或酶促方法去除所述修饰的NTAA。在某些实施方案中,酶例如,Edmanase被工程化以催化去除所述修饰的NTAA。在其他实施方案中,可以改造天然存在的外肽酶,例如氨肽酶或酰基肽水解酶,从而仅在存在合适的化学修饰条件下切割末端氨基酸。II.定义在以下描述中,阐述了某些具体细节以便提供对各种实施例的透彻理解。然而,本领域技术人员将理解,可以在没有这些细节的情况下制备和使用本发明化合物。在其他情况下,未详细示出或描述公知的结构以避免不必要地模糊对实施方案的描述。除非上下文另有要求,否则在整个说明书和随后的权利要求中,词语“包括”及其变体,例如“包括”和“包含”,应以开放的,包含性的意义解释,即“包括但不仅限于”。另外,术语“包括”和诸如“包含”或“包含”或“具有”或“包括”的相关术语并不旨在排除在其他某些实施方式中,例如,任何组合物的实施方式。本文所述的物质,组合物,方法或过程等可以由所描述的特征“组成”或“基本上由......组成”。本文提供的标题仅为了方便,并不解释所要求保护的实施方案的范围或含义。贯穿本说明书对“一个实施方案”或“实施方案”的引用意味着结合该实施方案描述的特定特征,结构或特性包括在至少一个实施方案中。因此,贯穿本说明书在各个地方出现的短语“在一个实施方案中”或“在实施方案中”不一定都指的是同一实施方案。此外,特定特征,结构或特性可以在一个或多个实施方案中以任何合适的方式组合。正如这里所使用的,单数形式“一个a”、“一个an”及“所述”包含提及物的复数形式,除非另有说明。因此,例如,提及“肽”,包括一种或多种肽或肽的混合物。此外,除非特别说明或从上下文中显而易见,否则如本文所用,术语“或”应理解为包括在内并涵盖“或”和“和”两者。如本文所用,术语“大分子”包括由较小亚单元组成的大的分子。大分子的实例包括但不限于肽、多肽、蛋白、核酸、碳水化合物、脂质、大环化合物。大分子还包括嵌合大分子,其由两种或多种类型的大分子共价连接在一起例如,肽连接到核酸的组合组成。大分子还可包括“大分子组装体”,其由两种或更多种大分子的非共价复合物组成。大分子组装体可以由相同类型的大分子例如蛋白-蛋白或两种不同类型的大分子例如蛋白-DNA组成。如本文所用,术语“肽”包括肽、多肽和蛋白,并且是指包含通过肽键连接的两个或更多个氨基酸的链的分子。一般而言,具有超过20-30个氨基酸的肽通常被称为多肽,而具有超过50个氨基酸的肽通常被称为蛋白。所述肽的氨基酸最典型地是L-氨基酸,但也可以是D-氨基酸、修饰的氨基酸、氨基酸类似物、氨基酸模拟物、或其任何组合。肽可以是天然发生的、合成产生的、或重组表达的。肽还可以包含修饰所述氨基酸链的其他基团,例如,通过翻译后修饰添加的官能团。如本文所用,术语“氨基酸”是指包含胺基、羧酸基、和对每个氨基酸特异的侧链的有机化合物,其用作肽的单体亚单元。氨基酸包括20种标准的,天然存在的或典型的氨基酸以及非标准氨基酸。标准的天然氨基酸包括丙氨酸A或Ala,半胱氨酸C或Cys,天冬氨酸D或Asp,谷氨酸E或Glu,苯丙氨酸F或Phe,甘氨酸G或Gly,组氨酸H或His,异亮氨酸I或Ile,赖氨酸K或Lys,亮氨酸L或Leu,蛋氨酸M或Met,天冬酰胺N或Asn,脯氨酸P或Pro,谷氨酰胺Q或Gln,精氨酸R或Arg,丝氨酸S或Ser,苏氨酸T或Thr,缬氨酸V或Val,色氨酸W或Trp和酪氨酸Y或Tyr。氨基酸可以是L-氨基酸或D-氨基酸。非标准氨基酸可以是修饰氨基酸、氨基酸类似物、氨基酸模拟物、非标准蛋白原氨基酸或天然存在或化学合成的非蛋白原氨基酸。非标准氨基酸的实例,包括但不限于,硒代半胱氨酸、吡咯赖氨酸和N-甲酰基甲硫氨酸、β-氨基酸、同源氨基酸、脯氨酸和丙酮酸衍生物、3-取代丙氨酸衍生物、甘氨酸衍生物、环-取代的苯丙氨酸和酪氨酸衍生物、线性核心氨基酸、N-甲基氨基酸。如本文所用,术语“翻译后修饰”是指在肽被核糖体翻译完成后在肽上发生的修饰。翻译后修饰可以是共价修饰或酶修饰。翻译后修饰的实例,包括但不限于,酰化、乙酰化、烷基化包括甲基化、生物素化、丁酰化、氨基甲酰化、羰基化、脱酰胺、deiminiation、二萘胺形成、二硫桥形成、消除eliminylation、黄素附着、甲酰化、γ-羧化、谷氨酰化、甘氨酰化、糖基化、glypiation、血红素C附着、羟基化、hypusine形成、碘化、异戊二烯化、脂化lipidation、脂质化lipoylation、丙酰化、甲基化、肉豆蔻酰化、氧化、棕榈酰化、聚乙二醇化、磷酸酯化、磷酸化、异戊烯化、丙酰化、视黄基希夫碱基形成retinylideneSchiffbaseformation、S-谷胱甘肽化、S-亚硝基化,S-亚磺酰化、硒化、琥珀酰化、硫化、泛素化和C-末端酰胺化。翻译后修饰包括肽的氨基末端和或羧基末端的修饰。所述末端氨基的修饰包括但不限于脱氨基,N-低级烷基、N-二低级烷基N-di-loweralkyl、和N-酰基修饰。所述末端羧基的修饰包括但不限于酰胺、低级烷基酰胺、二烷基酰胺和低级烷基酯修饰例如,其中低级烷基是C1-C4烷基。翻译后修饰还包括,例如但不限于上述的落在氨基和羧基末端之间的氨基酸的修饰。术语翻译后修饰还可以包括包含一种或多种可检测标记的肽修饰。如本文所用,术语“结合剂”是指与大分子或大分子的组分或特征结合、关联、联合、识别或与其组合的核酸分子、肽、多肽、蛋白、碳水化合物或小分子。结合剂可以与大分子或大分子的组分或特征形成共价关联或非共价关联。结合剂也可以是嵌合结合剂,由两种或多种类型的分子组成,例如核酸分子-肽嵌合结合剂或碳水化合物-肽嵌合结合剂。结合剂可以是天然发生的,合成产生的或重组表达的分子。结合剂可以结合大分子的单个单体或亚单元例如,肽的单个氨基酸或结合大分子的多个连接的亚单元例如,二肽、三肽、长肽的更高级肽、多肽或蛋白分子。结合剂可以结合线性分子或具有三维结构也称为构象的分子。例如,抗体结合剂可以与线性肽、多肽或蛋白结合,或与构象肽、多肽或蛋白结合。结合剂可以结合N-末端肽,C-末端肽、或肽、多肽或蛋白质分子的的干预肽。结合剂可以结合肽分子的N-末端氨基酸,C-末端氨基酸或干预氨基酸。相比于未修饰或未标记的氨基酸,结合剂可以优先结合化学修饰的或标记的氨基酸。例如,结合剂可以优选地与用乙酰基团、脒基基团、丹酰基基团、PTC基团、DNP基团、SNP部分等修饰的氨基酸结合而不是与不具有这些基团的氨基酸结合。结合剂可以结合肽分子的翻译后修饰。结合剂可以表现出与大分子的组分或特征的选择性结合例如,结合剂可以选择性地结合20种可能的天然氨基酸残基中的一种并且与其它19种天然氨基酸残基以具有非常低的亲和力结合或者根本不结合。结合剂可以表现出较低的选择性结合,其中结合剂能够结合大分子的多种组分或特征例如,结合剂可以以相似的亲和力与两种或更多种不同氨基酸残基结合。结合剂包含编码标签,其通过接头与所述结合剂连接。如本文所用,术语“接头”是指用于连接两个分子的核苷酸、核苷酸类似物、氨基酸、肽、多肽或非核苷酸化学基团中的一种或多种。接头可用于结合结合剂和码标签、结合记录标签和大分子例如肽、结合大分子和固体支持物等、结合记录标签和固体支持物。在某些实施方案中,接头通过酶促反应或化学反应例如,点击化学连接两个分子。如本文所用,术语“蛋白质组学”是指定量分析指细胞、组织和体液内的所述蛋白质组,以及分析所述蛋白质组在所述细胞内和组织内的相应空间分布。此外,蛋白质组学研究包括所述蛋白质组的所述动态状态,作为生物学的以及定义的生物或化学刺激的功能在时间内的持续变化。如本文所用,术语“非同源结合剂”是指其在特定结合循环反应中,不能以低亲和力结合大分子特征、组分、或被测亚单元,“同源结合剂”,而“同源结合剂”,其以高亲和力结合相应的大分子特征、组分、或亚单元。例如,如果肽分子的酪氨酸残基在结合反应中被测,则非同源结合剂是指以低亲和力结合或根本不结合所述酪氨酸残基的那些结合剂,使得在适合来自于同源结合剂的编码标签信息转移到所述记录标签的条件下,所述非同源结合剂不能将编码标签信息转移到所述记录标签。或者,如果在结合反应中肽分子的酪氨酸残基被测,则非同源结合剂是以低亲和力结合或根本不结合所述酪氨酸残基的那些试剂,使得在适合于涉及延伸编码标签而不是延伸记录标签的实施方案的条件下,记录标签信息不能有效地转移至所述编码标签。具有自由氨基的肽链一端的末端氨基酸在本文中称为“N-末端氨基酸”NTAA。具有自由羧基的链另一端的末端氨基酸在本文中称为“C-末端氨基酸”CTAA。构成肽的氨基酸可以按顺序号,其中所述肽的长度为“n”个氨基酸。如本文所用,NTAA被认为是第n个氨基酸在本文中也称为“nNTAA”。使用这种命名法,下一个氨基酸是第n-1个氨基酸,然后是第n-2个氨基酸,依此类推从N末端到C末端的肽长度。在某些实施方案中,NTAA、CTAA或两者可以用所述化学基团修饰或标记。如本文所用,术语“条形码”是指约2至约30个碱基的核酸分子例如,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29或30碱基,其为大分子例如,蛋白质,多肽,肽、结合剂、来自结合循环的结合剂组、样品大分子、样品组、隔室内例如,液滴、珠子或隔离的位置的大分子、隔室内的大分子集、大分子分级物、大分子的分级物集、空间区域或空间区域集、大分子库或结合剂库提供独特标识符标签或起源信息。条形码可以是人工序列或天然发生的序列。在某些实施例中,条形码群体内的每个条形码是不同的。在其他实施方案中,条形码群体中的一部分条形码是不同的,例如,条形码群体中至少约10%,15%,20%,25%,30%,35%,40%,45%,50%,55%60%,65%,70%,75%,80%,85%,90%,95%,97%或99%的条形码是不同的。条形码群可以随机生成或非随机生成。在某些实施例中,条形码群是纠错条形码。条形码可用于计算地解卷积多路复用测序数据并识别源自单个大分子、样品、文库等的序列读数。条形码还可以用于对大分子集合进行去卷积,所述大分子集合已经分布到小隔室中以增强映射。例如,不是将肽映射回所述蛋白质组,而是将所述肽映射回其起源蛋白分子或蛋白复合物。“样品条形码”,也称为“样品标签”,识别大分子来自哪个样品。“空间条形码”,其是大分子衍生的2-D或3-D组织切片的区域。空间条形码可用于组织切片上的分子病理学。空间条形码允许来自组织切片的多个样品或文库的多路复用测序。如本文所用,术语“编码标签”是指约2个碱基至约100个碱基,包括任何包括2和100且在其间的整数的核酸分子,其包含它的相关结合剂的识别信息。“编码标签”也可以由“可序列聚合物”制成参见,例如,Niu等人,2013,Nat.Chem.5:282-292;Roy等人,2015,Nat.Commun.6:7237;Lutz,2015,Macromolecules48:4759-4767;其中每一篇均通过引用整体并入。编码标签包含编码器序列,其可选地在一侧侧接一个间隔子或在每侧侧接间隔子。编码标签还可以包含可选的UMI和或可选的结合循环特异性条形码。编码标签可以是单链或双链的。双链编码标签可包含平末端、突出末端或两者。编码标签可以指直接连接到结合剂的编码标签、与直接连接到结合剂的编码标签杂交的互补序列例如,用于双链编码标签、或延伸记录标签中的编码标签信息。在某些实施方案中,编码标签可以进一步包含结合循环特异性间隔子或条形码,独特分子标识符、通用引发位点或其任何组合。如本文所用,术语“编码器序列”或“编码器条形码”是指约2个碱基至约30个碱基的例如,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29或30个碱基长度的核酸分子,提供其相关的结合剂的识别信息。所述编码器序列可以唯一地标识其关联的结合试剂。在某些实施方案中,编码器序列提供其相关结合剂以及使用该结合剂的结合循环的识别信息。在其它实施例中,编码器序列与编码标签内的单独的结合循环特异性条形码组合。或者,所述编码器序列可以将其关联的结合试剂识别为属于包含两个或更多个不同结合剂的组的成员。在一些实施方案中,这种水平的识别足以用于分析目的。例如,在涉及结合氨基酸的结合剂的一些实施方案中,知道肽在特定位置包含两种可能的氨基酸之一可能就足够了,而不用明确地鉴定该位置的氨基酸残基。在另一个实例中,共同的编码序列用于多克隆抗体,其包含识别蛋白质靶标的一个以上表位的抗体的混合物,并且具有不同的特异性。在其它实施方案中,在编码器序列识别一组可能的结合剂的情况下,可以使用次序解码方法来产生每个结合剂的独特识别。这是通过在重复的结合循环中改变给定结合剂的编码序列来实现的参见Gunderson等,2004,GenomeRes.14:870-7。当与来自其他循环的编码信息组合时,来自每个结合循环的所述部分识别编码标签信息为所述结合试剂产生的独特标识符,例如,编码标签而不是单独的编码标签或编码器序列的特定组合提供为所述结合试剂产生所述独特标识信息。优选地,结合剂库内的所述编码序列具有相同或相似数量的碱基。如本文所用,术语“结合循环特异性标签”,“结合循环特异性条形码”或“结合循环特异性序列”是指用于鉴定在特定结合循环内使用的结合剂文库的独特序列。结合循环特异性标签可包含约2个碱基至约8个碱基例如,2,3,4,5,6,7,或8个碱基的长度。结合循环特异性标签可以并入结合剂的编码标签内,作为间隔序列的一部分、编码器序列的一部分、UMI的一部分、或作为所述编码标签内的单独组件。如本文所用,术语“间隔子”Sp是指长度约1碱基至约20个碱基例如,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,或20碱基的核酸分子,存在于记录标签或编码标签的末端。在某些实施方案中,间隔序列在一端或两端侧接编码标签的编码序列。在结合剂与大分子结合后,在相关的编码标签上和记录标签上的互补间隔序列之间的分别退火,让结合信息通过引物延伸反应或连接转移到所述记录标签、编码标签或di-互补间隔序列构建体。Sp'是指与Sp互补的间隔序列。优选地,结合剂库内的间隔序列具有相同数量的碱基。可以在结合剂库中使用共同的共有的或相同的间隔区。间隔序列可具有“循环特异性”序列,以跟踪特定结合循环中使用的结合剂。所述间隔序列Sp在所有结合循环中可以是恒定的,对特定类别的大分子是特异性的,或者是结合循环数特异性的。大分子类别特异性间隔子允许将来自于完成的结合延伸循环中的延伸记录标签中存在的同源结合剂的编码标签信息退火到另一个结合剂的所编码标签,该另一结合剂在随后的结合循环中通过所述类别特异性间隔子识别相同类别的大分子。只有正确的同源对的所述顺序结合才能产生相互作用的间隔元件和有效的引物延伸。间隔子序列可包含足够数量的碱基以与记录标签中的互补间隔区序列退火以引发引物延伸也称为聚合酶延伸反应,或提供用于连接反应的“夹板”,或介导“粘性末端”连接反应。间隔序列可包含比编码标签内的所述编码器序列更少数量的碱基。如本文所用,术语“记录标签”是指核酸分子或可测序聚合物分子参见,例如,Niu等人,2013,Nat.Chem.5:282-292;Roy等人,2015,Nat。公报6:7237;Lutz,2015,Macromolecules48:4759-4767;其中每一篇均通过引用整体并入本文,其包含相关大分子的识别信息。在某些实施方案中,在结合剂结合大分子后,来自与结合剂连接的编码标签的信息能转移到与所述大分子相关的所述记录标签,同时所述结合剂结合到所述大分子上。在其他实施方案中,在结合剂结合大分子后,来自与大分子相关的记录标签的信息可以转移到与所述结合剂连接的所述编码标签,同时结合剂结合到大分子上。重新编码标签可以直接与大分子连接、通过多功能接头与大分子连接、或者借助于其在固体支持物上的相近或共定位而与大分子结合。记录标签可以通过其5'端或3'端或内部位点连接,只要该链接与用于将编码标签信息转移到所述记录标签的方法兼容,反之亦然。记录标签还可以包括其它功能组件,例如通用引发位点、独特分子标识符、条形码例如,样品条形码、分级物条形码、空间条形码、隔室标签等、与编码标签的间隔序列互补的间隔序列、或其任何组合。在使用聚合酶延伸将编码标签信息转移到所述记录标签的实施方案中,记录标签的所述间隔序列优选位于所述记录标签的3'末端。如本文所用,术语“引物延伸”,也称为“聚合酶延伸”,是指由核酸聚合酶例如,DNA聚合酶催化的反应,其中与互补链退火的核酸分子例如,寡核苷酸引物、间隔序列使用所述互补链作为模板通过聚合酶延伸。如本文所用,术语“独特的分子标识符”或“UMI”是指约3至约40个碱基的核酸分子如本文所用,术语“独特的分子标识符”或“UMI”是指约3至约40个碱基3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,或40碱基长度的核酸分子,为每个与UMI连接的大分子例如肽或结合剂提供独特标识符标签。大分子UMI可用于从多个延伸记录标签计算去卷积测序数据,以识别源自单个大分子的延伸记录标签。结合剂UMI可用于鉴定结合特定大分子的每种个体结合剂。例如,UMI可用于鉴定对特定肽分子发生的单个氨基酸特异性的结合剂的个体结合事件的数量。应当理解,当UMI和条形码都在结合剂或大分子的背景下被引用时,所述条形码指的个体结合剂或大分子的除UMI之外的识别信息例如,样品条形码、隔室条形码、结合循环条形码。如本文所用,术语“通用引发位点”或“通用引物”或“通用引发序列”是指核酸分子,其可用于文库扩增和或测序反应。通用引发位点可以包括,但不限于用于PCR扩增的引发位点引物序列、与流通槽表面上的互补寡核苷酸退火的流通槽适配序列其促使在一些下一代测序平台中进行桥扩增、测序引发位点、或其组合。通用引发位点可用于其他类型的扩增,包括通常与下一代数字测序结合使用的扩增。例如,延伸记录标签分子可以环化,并且通用引发位点用于滚环扩增以形成可以用作测序模板的DNA纳米球Drmanac等,2009,Science327:78-81。或者,记录标签分子可以通过来自通用引发位点的聚合酶延伸直接环化和测序Korlach等,2008,Proc.Natl.Acad.Sci.105:1176-1181。当在“通用引发位点”或“通用引物”的上下文中使用时,术语“正向”也可称为“5'”或“有义”。当在“通用引发位点”或“通用引物”的上下文中使用时,术语“反向”也可称为“3'”或“反义”。如本文所用,术语“延伸记录标签”是指记录标签,至少一种结合剂的编码标签或其互补序列的信息在所述结合剂与大分子结合后已转移到所述记录标签。所述编码标签的信息可以直接例如,连接或间接例如引物延伸转移到所述记录标签。编码标签的信息可以酶促或化学地转移到所述记录标签。延伸记录标签可以包含编码标签的信息可以酶促或化学地转移到记录标签。延伸记录标签可以包含1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,45,50,55,60,65,70,75,80,85,90,95,100,125,150,175,200或或更多个编码标签的结合剂信息。所述延伸记录标签的碱基序列可以反映由其编码标签鉴定的结合剂的结合时间和顺序。可以反映由所述编码标签鉴定的结合剂的部分结合顺序,或者可以不反映任何由所述编码标签鉴定的结合剂的结合顺序。在某些实施例中,所述延伸记录标签中存在的所述编码标签信息至少25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%。,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%同一性代表所分析的大分子序列。在延伸记录标签不以100%同一性代表分析的大分子序列的某些实施方案中,错误可能是由于结合剂的脱靶结合,或由于“错过的”结合循环例如,因为结合剂在结合循环期间不能与大分子结合,因为引物延伸反应失败,或两者兼而有之。如本文所用,术语“延伸编码标签”是指在结合编码标签的结合剂与大分子结合后,至少一个记录标签或其互补序列的信息被转移到其的编码标签,所述记录标签与所述大分子相关。记录标签的信息可以直接例如,连接或间接例如引物延伸转移到所述编码标签。记录标签的信息可以酶促或化学方式转移。在某些实施例中,延伸编码标签包含记录标签的信息,反映一个结合事件。如本文所用,术语“di-tag”或“di-tag构建体”是指核酸分子,至少一个记录标签或其互补序列和至少一个编码标签或其互补序列的信息在与所述编码标签连接的结合剂结合后转移到该核酸分子,所述记录标签与所述大分子相关见,图11B。记录标签和编码标签的信息可以间接地例如,引物延伸转移到所述di-tag。记录标签的信息可以酶促或化学方式转移。在某些实施方案中,di-tag包含记录标签的UMI、记录标签的隔室标签、记录标签的通用引发位点、编码标签的UMI、编码标签的编码序列、结合循环特异性条形码、编码标签的通用引发位点、或其任何组合。如本文所用,术语“固体支持物”、“固体表面”、或“固体基质”或“基质”是指任何固体材料,包括多孔和非多孔材料,大分子例如,肽可以是通过本领域已知的手段,包括共价和非共价相互作用,或其任何组合,直接或间接结合上去。固体支持物可以是二维的例如平面表面或三维的例如凝胶矩阵或珠粒。固体支持物可以是任何支持表面,包括但不限于,珠子、微珠、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶芯片、流控芯片、流通槽、包括信号转导电子器件的生物芯片、通道、微量滴定孔、ELISA板、旋转干涉测量盘、硝酸纤维素膜、基于硝酸纤维素的聚合物表面、聚合物矩阵、纳米颗粒、或微球。用于固体载体的材料包括但不限于丙烯酰胺、琼脂糖、纤维素、硝化纤维素、玻璃、金、石英、聚苯乙烯、聚乙烯乙酸乙烯酯、聚丙烯、聚甲基丙烯酸酯、聚乙烯、聚环氧乙烷、聚硅酸盐、聚碳酸酯、特氟隆、碳氟化合物、尼龙、硅橡胶、聚酸酐、聚乙醇酸、聚乳酸、聚原酸酯、官能化硅烷、聚丙基延胡索酸酯、胶原、糖胺聚糖、聚氨基酸、葡聚糖、或其任何组合。固体支持物还包括薄膜、膜、瓶、盘、纤维、编织纤维、成形聚合物,例如管、颗粒、珠子、微球、微粒、或其任何组合。例如,当固体表面是珠子时,所述珠子可以包括但不限于陶瓷珠子、聚苯乙烯珠子、聚合物珠子,甲基苯乙烯珠子、琼脂糖珠子、丙烯酰胺珠子、实心核心珠子、多孔珠、顺磁珠,玻璃珠或可控孔珠。珠子可以是球形或不规则形状。珠粒的尺寸可以为纳米,例如100纳米、毫米,例如1毫米。在某些实施方案中,珠子的尺寸范围为约0.2微米至约200微米,或约0.5微米至约5微米。在一些实施方案中,珠子可以直径约为1,1.5,2,2.5,2.8,3,3.5,4,4.5,5,5.5,6,6.5,7,7.5,8,8.5,9,9.5,10,10.5,15,或20μm。在某些实施方案中,“珠粒”固体支持物可以指个体珠子或多个珠子。如本文所用,术语“核酸分子”或“多核苷酸”是指含有通过3'-5'磷酸二酯键连接的脱氧核糖核苷酸或核糖核苷酸的单链或双链多核苷酸,以及多核苷酸类似物。核酸分子包括,但不限于DNA,RNA和cDNA。多核苷酸类似物可以具有除天然多核苷酸中发现的标准磷酸二酯键以外的骨架,并且任选地具有核糖或脱氧核糖以外的修饰的糖基。多核苷酸类似物含有能够通过Watson-Crick碱基配对与标准多核苷酸碱基形成氢键的碱基,其中所述类似物骨架以允许寡核苷酸类似物分子与标准多核苷酸中的碱基之间的序列特异性方式的氢键的方式呈现所述碱基。多核苷酸类似物的实例包括,但不限于异种核酸XNA、桥接核酸BNA、乙二醇核酸GNA、肽核酸PNAs、γPNA、吗啉代多核苷酸、锁核酸LNAs、苏糖核酸TNA,2'-O-甲基多核苷酸、2'-O-烷基核糖基取代的多核苷酸、硫代磷酸酯多核苷酸、和硼磷酸盐多核苷酸。多核苷酸类似物可具有嘌呤或嘧啶类似物,包括例如7-脱氮嘌呤类似物、8-卤嘌呤类似物、5-卤代嘧啶类似物、或可与任何碱基配对的通用碱类似物,包括次黄嘌呤、硝基唑、异喹诺酮类似物、唑类羧酰胺和芳族三唑类似物、或具有额外功能的碱基类似物,例如用于亲和结合的生物素基团。如本文所用,“核酸测序”指确定核酸分子或核酸分子样品中核苷酸的顺序。如本文所用,“下一代测序”是指高通量测序方法,其允许并行测序数百万至数十亿的分子。下一代测序方法的实例包括通过合成法测序,连接测序、杂交测序,Polony测序、离子半导体测序和焦磷酸测序。通过将引物连接到固体基质和与核酸分子的互补序列,核酸分子可以通过所述引物与固体基质杂交,然后通过使用聚合酶在固体基质上的离散区域中产生多个拷贝来扩增这些分组有时被称为聚合酶克隆polymerasecolonies或polonies。因此,在测序过程中,特定位置的核苷酸可以被多次测序例如,数百次或数千次-这种覆盖深度被称为“深度测序”。高通量核酸测序技术的实例包括Illumina、BGI、Qiagen、Thermo-Fisher和Roche提供的平台,包括如如ServiceScience311:1544-1546,2006所综述的平行珠子阵列、合成测序、连接测序、毛细管电泳、电子微芯片、“生物芯片”、“微阵列、平行微芯片和单分子阵列格式。如本文所用,“单分子测序”或“第三代测序”是指新一代测序方法,其中来自单分子测序仪器的读数通过对单个DNA分子的测序产生。与依赖于扩增以平行克隆许多DNA分子以便以分阶段方法进行测序的下一代测序方法不同,单分子测序审查单个DNA分子并且不需要扩增或同步。单分子测序包括需要在每次碱基并入入“洗涤和扫描”循环后暂停测序反应的方法和不需要在读取步骤之间停止的方法。单分子测序方法的实例包括单分子实时测序PacificBiosciences、基于纳米孔的测序OxfordNanopore、双链中断纳米孔测序,以及用高级显微镜的直接成像DNA。如本文所用,“分析”所述大分子意指大分子的全部或部分组分进行量化、表征、区分或其它们的组合。例如,分析肽、多肽或蛋白质包括测定所述肽的全部或部分氨基酸序列连续或非连续。分析大分子还包括对所述大分子的组分的部分鉴定。例如,部分鉴定所述大分子蛋白质序列中的氨基酸可以将蛋白质中的氨基酸鉴定为属于可能的氨基酸子集。分析通常从分析第n个NTAA开始,然后进行到所述肽的下一个氨基酸即,n-1,n-2,n-3等等。这通过切割所述第nNTAA,从而将肽的第n-1氨基酸转化为N-末端氨基酸本文称为“n-1NTAA”来实现。分析所述肽还可以包括确定肽上翻译后修饰的存在和频率,其可以包括或不包括关于肽上翻译后修饰的先后顺序的信息。分析肽还可以包括确定肽中表位的存在和频率,其可以包括或不包括关于在所肽内的所述表位的顺序或位置的信息。分析所述肽可以包括组合不同类型的分析,例如获得表位信息、氨基酸序列信息、翻译后修饰信息、或其任何组合。如本文所用,术语“隔室”是指将大分子子集与大分子样品分离或分隔的物理区域或体积。例如,隔室可以将单个细胞与其他细胞分离,或者将样品蛋白质组的一部分与样品的蛋白质组的其余部分分开。隔室可以是含水隔室例如,微流体液滴、固体隔室例如,板上的Picotiter孔或微量滴定孔、管、小瓶、凝胶珠,或表面上的分离区域。隔室可包含一个或多个可固定大分子的珠子。如本文所用,术语“隔室标签”或“隔室条形码”是指包含在一个或多个隔室内例如,微流体液滴的组分例如,单个细胞的蛋白质组的识别信息的约4个碱基至约100个碱基包括4个碱基,100个碱基和其间的任何整数的单链或双链核酸分子。隔室条形码识别样品中的大分子子集,例如蛋白样品的子集,其已经从多个例如,数百万到数十亿隔室分离进入相同的物理隔室或隔室组。因此,即使在将组分汇集在一起之后,隔室标签也可用于区分来自具有相同隔室标签的一个或多个隔室的成分与具有不同隔室标签的另一隔室中的成分。通过用独特的隔室标签标记每个区室内或两个或更多个区室的组内的所述蛋白和或肽,可以鉴定衍生自相同蛋白、蛋白复合物或单个区室或区室组内的细胞的肽。隔室标签包含条形码和任选的通用引物,所述条形码任选地在一侧或两侧侧接间隔序列。所述间隔序列可以与记录标签的所述间隔序列互补,使得能够将隔室标签信息转移到所述记录标签。隔室标签还可以包含通用引发位点、独特分子标识符用于提供与其连接的肽的识别信息或两者,特别是对于隔室标签中包含用于下述肽分析方法的记录标签的实施方案。隔室标签可包含用于偶联肽的功能基团例如,醛、NHS、mTet、炔等。或者,隔室标签可包含肽,所述肽包含对蛋白连接酶的识别序列,以允许将所述隔室标签连接至目标肽。隔室可以包括单个隔室标签、为可选的UMI序列预留的多个相同的隔室标签、或者两个或更多个不同的隔室标签。在某些实施例中,每个隔室包含独特隔室标签一对一映射。在其它实施例中,来自较大隔室群的多个隔室包含相同的隔室标签多对一映射。隔室标签可以连接到隔室例如,珠子内的固体支持物上或者连接到隔室自身的表面例如,Picotiter孔的表面。或者,隔室标签在隔室内的溶液中可以是游离。如本文所用,术语“分区”是指将独特条形码随机分配给来自样品内的大分子群的大分子亚群。在某些实施方案中,可以通过将大分子分配到隔室中来实现分区。隔板可以由单个隔室内的大分子或来自一组隔室中的多个隔室的大分子组成。如本文所用,“分区标签”或“分区条形码”是指包含约4个碱基至约100个碱基包括4个碱基,100个碱基和其间的任何整数的单链或双链核酸分子,其包含分区的识别信息。在某些实施方案中,用于大分子的分区标签是指由将大分子分隔成用相同条形码标记的隔室产生的相同隔室标签。如本文所用,术语“分级物”是指样品中的大分子例如,蛋白的子集,该样品已经采用物理或化学分离方法从其余样品或细胞器挑选出来,例如按大小、疏水性、等电点、亲和力等分级。分离方法包括HPLC分离、凝胶分离、亲和分离、细胞分馏、细胞器分馏、组织分馏等。流体流动性、磁性、电流、质量、密度及其类似物理性质也可用于分离。如本文所用,术语“分级物条形码”是指包含约4个碱基至约100个碱基包括4个碱基,100个碱基,和其间的任何整数的单链或双链核酸分子,其包含对分级物中所述大分子的识别信息。III.分析大分子的方法此处描述的所述方法提供了用于大分子分析的高度平行化的方法。高度多路复用化的大分析结合检测被转换成通过下一代测序方法读取的核酸分子文库。在此提供的所述方法对于蛋白和肽测序尤其有用。在优选的实施方案中,蛋白质样品在单分子水平上用至少一种核酸记录标签标记,所述核酸记录标签包括条形码例如,样品条形码、隔室条形码和任选的独特分子标识符。所述蛋白质样品经历蛋白水解消化以产生一群记录标签标记的肽例如,数百万至数十亿。这些记录标签标记的肽随机地汇集和固定在固体支持物上。所述汇集的、固定的记录标签标记的肽经历多个连续的结合循环,每个结合循环包括暴露于用包含识别相关结合剂的编码器序列的编码标签标记的多种结合剂例如,所有20种天然存在的氨基酸的结合剂。在每个结合循环期间,通过将结合剂的编码标签信息传递到所述记录标签或将记录标签信息传递到编码标签或将记录标签信息和编码标签信息传递到单独的di-tag构建体来捕获关于结合剂与所述肽的结合的信息。完成结合循环后,生成代表所测定的肽的结合历史的延伸记录标签或延伸编码标签或di-tag构建体的文库,其可使用非常高通量的下一代数字测序方法进行分析。在所述记录标签中使用核酸条形码允许大量肽测序数据的解卷积,例如,以鉴定肽序列源自哪个样品、细胞、蛋白质组的子集或蛋白质。在一个方面,提供分析大分子的方法,包括以下步骤:a提供大分子和与固体支持物连接的相关或共定位的记录标签;b使所述大分子与能够结合所述大分子的第一结合剂接触,其中所述第一结合剂包含具有关于所述第一结合剂的识别信息的第一编码标签;c将所述第一编码标签的信息传送到所述记录标签,以产生第一次序延伸记录标签;d使所述大分子与能够结合所述大分子的第二结合剂接触,其中所述第二结合剂包含第二编码标签,其具有关于所述第二结合剂的识别信息;e将所述第二编码标签的信息传送到所述第一次序延伸记录标签,以产生第二次序延伸记录标签;以及f分析所述第二次序延伸标签参见例如图2A-D在一些实施方案中,所述接触步骤b和d按顺序进行,例如,所述第一次结合剂和所述第二结合剂在分开的结合循环反应中与所述大分子接触。在另一些实施方案中,所述接触步骤b和d同时进行,例如,在单个结合循环反应中包含所述第一次结合剂、所述第二结合剂,以及可选地额外的结合剂。在优选实施方案中,所述接触步骤b和d包含是所述大分子与多个结合剂接触。在一些实施方案中,所述的方法还包括在步骤e和f之间的以下步骤:x通过用能够结合所述大分子的第三或更高级结合剂替换所述第二结合剂重复步骤d和e一次或多次,其中所述第三或更高次序结合剂包含第三或更高次序编码标签,其具有关于第三或更高次序结合剂的识别信息;y将所述第三或更高次序编码标签的信息传送到所述第二或更高次序延伸记录标签,以产生第三或更高次序延伸记录标签;以及z分析所述第三或更高次序延伸记录标签。所述第三或更高级结合剂可以在与所述第一结合剂和所述第二结合剂分开的结合循环反应中与所述大分子接触。或者,所述第三或更高级结合剂可以和所述第一结合剂,所述第二结合剂一起在单个结合循环反应中与所述大分子接触。在第二方面,提供的分析大分子的方法包括以下步骤:a提供大分子,相关的第一记录标签和与固体支持物连接的相关第二记录标签;b使所述大分子与能够结合所述大分子的第一结合剂接触,其中所述第一结合剂包含具有关于所述第一结合剂的识别信息的第一编码标签;c将所述第一编码标签的信息传送到所述记录标签以产生第一次序延伸记录标签;d使所述大分子与能够结合所述大分子的第二结合剂接触,其中所述第二结合剂包含第二编码标签,其具有关于所述第二结合剂的识别信息;e将所述第二编码标签的信息传递到所述第二记录标签以产生第二次序延伸记录标签;以及f分析所述第一和第二延伸记录标签。在一些实施方案中,接触步骤b和d按顺序进行,例如,所述第一次结合剂和所述第二结合剂在分开的结合循环反应中与所述大分子接触。在另一些实施方案中,所述接触步骤b和d同时进行,例如,在单个结合循环反应中包含所述第一次结合剂、所述第二结合剂,以及可选地额外的结合剂。在一些实施方案中,步骤a还包括提供与所述固体支持物连接的相关的第三或更高次序记录标签。在进一步实施方案中,所述的方法还包括,在步骤e和f之间的以下步骤:x通过用能够结合所述大分子的第三或更高级结合剂替换所述第二结合剂重复步骤d和e一次或多次,其中所述第三或更高级结合剂包含第三或更高次序编码标签,其具有关于第三或更高次序结合剂的识别信息;y将所述第三或更高次序编码标签的信息传送到所述第二或更高次序延伸记录标签,以产生第三或更高次序延伸记录标签;以及z分析所述第三或更高次序延伸记录标签。所述第三或更高级结合剂可以与所述第一结合剂和所述第二结合剂在分开的结合循环反应中与所述大分子接触。或者,所述第三或更高级结合剂可以和所述第一结合剂,所述第二结合剂一起在单个结合循环反应中与所述大分子接触。在一些实施方案中,所述第一编码标签、第二编码标签和任何更高次序编码标签包含结合循环特异性间隔序列。在第三方面,提供的分析大分子的方法包括以下步骤:a提供肽,和与固体支持物连接的相关记录标签;b用化学基团修饰所述肽的N-末端氨基酸NTAA以产生修饰的NTAA;c使所述肽与能够结合修饰的NTAA的第一结合剂接触,其中所述第一结合剂包含具有所述第一结合剂的识别信息的第一编码标签;d将所述第一编码标签的信息传送到所述记录标签以产生延伸记录标签;e分析所述延伸记录标签参考例如图3。在一些实施方案在,其中步骤c还包含使所述肽与包含第二或更高次序编码标签的第二或更高次序结合剂接触,所述第二或更高次序编码标签具有所述第二或更高次序结合剂的识别信息,其中所述第二或更高次序结合剂能够结合步骤b的修饰的NTAA之外的修饰的NTAA。在进一步的实施方案中,在所述肽与所述第一结合剂接触后,按次序使肽与所述第二或更高级结合剂接触,例如,第一结合剂和第二或更高级结合剂接触与所述肽在分开的结合循环反应中接触。在其它实施方案中,使所述肽与所述第二或更高级结合剂接触和所述肽与所述第一结合剂接触同时发生,例如,在单个结合循环反应中包含第一结合剂和第二或更高级结合剂。在某些实施方案中,所述化学基团通过化学反应或酶促反应添加到NTAA。在一些实施方案中,用于修饰所述NTAA的化学基团是苯基硫代氨基甲酰基PTC、二硝基苯基DNP、磺酰基硝基苯基SNP、丹酰基;7-甲氧基香豆素;硫代酰基;硫代乙酰基;乙酰基;胍基;或硫代苄基。通过化学试剂可向所述NTAA添加化学基团。在某些实施方案中,用于修饰具有PTC基团的NTAA的化学试剂是异硫氰酸苯酯或其衍生物;用于修饰具有DNP基团的NTAA的化学试剂是2,4-二硝基苯磺酸DNBS或芳基卤化物如1-氟-2,4-二硝基苯DNFB;用于修饰具有磺酰氧基硝基苯SNP基团的NTAA的化学试剂是4-磺酰基-2-硝基氟苯SNFB;用于修饰具有丹磺酰基的NTAA的化学试剂是磺酰氯,如丹磺酰氯;用于修饰具有7-甲氧基香豆素基团的NTAA的化学试剂是7-甲氧基香豆素乙酸MCA;用于修饰具有硫代酰基的NTAA的化学试剂是硫代酰化试剂;用于修饰具有硫代乙酰基的NTAA的化学试剂是硫代乙酰化试剂;用于修饰具有乙酰基NTAA的化学试剂是乙酰化试剂如乙酸酐;用于修饰具有胍基脒基NTAA的化学试剂是胍基化试剂,或用于修饰具有硫代苄基的NTAA的化学试剂是硫代苄基化试剂。本公开提供的第四方面,是提供了分析肽的方法,包括以下步骤:a提供与固体支持物连接的肽和相关的记录标签;b用化学基团修饰所肽的N-末端氨基酸NTAA以产生修饰的NTAA;c使所述肽与能够结合所述修饰的NTAA的第一结合剂接触,其中所述第一结合剂包含具有关于第一结合剂的识别信息的第一编码标签;d将所述第一编码标签的信息传送到所述记录标签,以产生第一延伸记录标签;e移除修饰的NTAA以暴露新的NTAA;f用化学基团修饰所述肽的新NTAA以产生新修饰的NTAA;g使所述肽与能够结合所述新修饰的NTAA的第二结合剂接触,其中所述第二结合剂包含第二编码标签,其具有关于第二结合剂的识别信息;h将所述第二编码标签的信息传送到所述第一延伸记录标签,以产生第二延伸记录标签;i分析第二延伸记录标签。在一些实施方案中,所述接触步骤c和g按次序进行,例如,所述第一次结合剂和所述第二结合剂在分开的结合循环反应中与所述肽接触。在一些实施方案中,所述的方法还包括在步骤h和i之间的以下步骤:x通过用能够结合所述修饰的NTAA的第三或更高级结合剂替换所述第二结合剂重复步骤e、f和g一次或多次,其中所述第三或更高级结合剂包含第三或更高次序编码标签,其具有关于第三或更高次序结合剂的识别信息;y将所述第三或更高次序编码标签的信息传送到所述第二或更高次序延伸记录标签,以产生第三或更高次序延伸记录标签;以及z分析所述第三或更高次序延伸记录标签。在某些实施方案中,所述化学基团通过化学反应或酶促反应添加到所述NTAA。在一些实施方案中,用于修饰所述NTAA的化学基团是苯基硫代氨基甲酰基PTC、二硝基苯基DNP、磺酰基硝基苯基SNP、丹酰基;7-甲氧基香豆素;硫代酰基;硫代乙酰基;乙酰基;胍基;或硫代苄基。通过化学试剂可向所述NTAA添加化学基团。在某些实施方案中,用于修饰具有PTC基团的NTAA的化学试剂是异硫氰酸苯酯或其衍生物;用于修饰具有DNP基团的NTAA的化学试剂是2,4-二硝基苯磺酸DNBS或芳基卤化物如1-氟-2,4-二硝基苯DNFB;用于修饰具有磺酰氧基硝基苯SNP基团的NTAA的化学试剂是4-磺酰基-2-硝基氟苯SNFB;用于修饰具有丹磺酰基的NTAA的化学试剂是磺酰氯,如丹磺酰氯;用于修饰具有7-甲氧基香豆素基团的NTAA的化学试剂是7-甲氧基香豆素乙酸MCA;用于修饰具有硫代酰基的NTAA的化学试剂是硫代酰化试剂;用于修饰具有硫代乙酰基的NTAA的化学试剂是硫代乙酰化试剂;用于修饰具有乙酰基NTAA的化学试剂是乙酰化试剂如乙酸酐;用于修饰具有胍基脒基NTAA的化学试剂是胍基化试剂,或用于修饰具有硫代苄基的NTAA的化学试剂是硫代苄基化试剂。在第五方面,提供的分析肽的方法包括以下步骤:a提供肽和连接在固体支持物上的相关的记录标签;b使所述肽与能够结合所述肽的N-末端氨基酸NTAA的第一结合试剂接触,其中所述第一结合试剂包含具有所述第一结合试剂的识别信息的第一编码标签;c将所述第一编码标签的信息传送到所述记录标签以产生延伸记录标签;以及d分析所述延伸记录标签。在一些实施方案在,其中步骤b还包含使所述肽与包含第二或更高次序编码标签的第二或更高次序结合剂接触,所述第二或更高次序编码标签具有所述第二或更高次序结合剂的识别信息,其中所述第二或更高次序结合剂能够结合所述肽的所述NTAA之外的NTAA。在进一步的实施方案中,在所述肽与所述第一结合剂接触后,按次序使肽与所述第二或更高级结合剂接触,例如,第一结合剂和第二或更高级结合剂接触与所述肽在分开的结合循环反应中接触。在其它实施方案中,使所述肽与所述第二或更高级结合剂接触和所述肽与所述第一结合剂接触同时发生,例如,在单个结合循环反应中包含第一结合剂和第二或更高级结合剂。在第六方面,提供的分析肽的方法包括以下步骤:a提供肽和连接在固体支持物上的相关的记录标签;b使所述肽与能够结合所述肽的所述N末端氨基酸NTAA的第一结合剂接触,其中所述第一结合剂包含具有关于第一结合剂的识别信息的第一编码标签;c将所述第一编码标签的信息传送到所述记录标签,以产生第一延伸记录标签;d移除修饰的NTAA以暴露新的NTAA;e使所述肽与能够结合所述新修饰的NTAA的第二结合剂接触,其中所述第二结合剂包含第二编码标签,其具有关于第二结合剂的识别信息;f将所述第二编码标签的信息传送到所述第一延伸记录标签,以产生第二延伸记录标签;以及g分析第二延伸记录标签。在一些实施方案中,所述的方法还包括在步骤f和g之间的以下步骤:x通过用能够结合所述修饰的大分子的第三或更高级结合剂替换所述第二结合剂重复步骤d、e和f一次或多次,其中所述第三或更高级结合剂包含第三或更高次序编码标签,其具有关于第三或更高次序结合剂的识别信息;以及y将所述第三或更高次序编码标签的信息传送到所述第二或更高次序延伸记录标签以产生第三或更高次序延伸记录标签;以及在步骤g中分析所述第三或更高次序延伸记录标签。在一些实施方案中,所述接触步骤b和e按次序进行,例如,所述第一次结合剂和所述第二结合剂在分开的结合循环反应中与所述肽接触。在提供的任何实施方案中,所述方法包含平行分析多个大分子。在优选实施方案中,所述方法包含平行分析多个肽。在本文提供的任何实施方案中,大分子或肽与结合剂接触的步骤包括使大分子或肽与多种结合剂接触。在提供的任何实施方案中,所述大分子可以是蛋白,多肽或肽。在进一步实施方案中,其中所述肽是通过片段化分离自生物样品的蛋白获得。在提供的任何实施方案中,所述大分子可以是或包含碳水化合物、脂质、核酸或大环。提供的任一实施方案中,其中所述记录标签是DNA分子、具有修饰碱基的DNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子Dragulescu-Andrasietal.,2006,J.Am.Chem.Soc.128:10258-10267,GNA分子或其任意组合。在此提供的任一实施方案中,其中所述的记录标签包含通用引发位点。在进一步实施方案中,其中所述通用引发位点包含用于扩增、测序或二者结合的引物位点。在此提供的任一实施方案中,所述记录标签包含独特分子标识符、隔室标签、分区条形码,样品条形码、分级物条形码、间隔序列或它们的任意组合。在此提供的任一实施方案中,所述记录标签包含独特分子标识符UMI、编码器序列、结合循环特异性序列、间隔序列、或它们的任意组合。在此提供的任一实施方案中,所述编码标签中的所述结合循环特异性序列可以是结合循环特异性间隔序列。在某些实施方案中,结合循环特异性序列被编码为与所述编码器序列分开的条形码。在其它实施方案中,所述编码器序列和结合循环特异性序列在单个条形码中列出,该条形码对于所述结合剂和每个结合循环是唯一的。在一些实施方案中,所述间隔序列包含共同的结合循环序列,其在来自多个结合循环的结合剂之间共享。在其它实施方案中,所述间隔序列包含独特的结合循环序列,其在来自相同结合循环的结合剂之间共享。在此提供的任一实施方案中,其中所述的记录标签可以包含条形码。在此提供的任一实施方案中,所述大分子和相关的记录标签可以共价结合到所述固体支持物上。在此提供的任一实施方案中,其中所述固体支持物是珠子、多孔珠子、多孔基质、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶芯片、流通芯片、包括信号转导电子器件的生物芯片、微量滴定孔、ELISA板、旋转干涉测量盘、硝酸纤维素膜、硝化纤维素基聚合物表面、纳米颗粒或微球。在此提供的任一实施方案中,其中所述固体支持物是聚苯乙烯珠子、聚合物珠子、琼脂糖珠子、丙烯酰胺珠子、固体核心珠子、多孔珠子、顺磁珠子、玻璃珠子或可控孔珠子。在此提供的任一实施方案中,多个大分子和相关的记录标签可以结合到所述固体支持物上。在进一步实施方案中所述多个大分子在所述固体支持物上以50nm,100nm,或200nm的平均距离间隔开。在此提供的任一实施方案中,所述结合剂可以是多肽或蛋白。在进一步实施方案中,其中所述结合剂是修饰的或变体的氨肽酶、修饰的或变体的氨酰tRNA合成酶、修饰的或变体的anticalin,或者修饰的或变体的ClpS。在此提供的任一实施方案中,所述结合剂可以选择性地结合所述大分子。在此提供的任一实施方案中,所述记编码标签可以是DNA分子、具有修饰碱基的DNA分子、RNA分子、BNA分子、XNA分子、LNA分子、GNA分子、PNA分子、γPNA分子或其组合。在此提供的任一实施方案中,所述结合剂和所述编码标签可以通过接头连接。在此提供的任一实施方案中,其中所述的结合剂和所述编码标签通过SpyTagSpyCatcher或SnoopTagSnoopCatcher肽-蛋白质对连接Zakeri,etal.,2012,ProcNatlAcadSciUSA10912:E690-697;Veggianietal.,2016,Proc.Natl.Acad.Sci.USA113:1202-1207,每一篇都通过整体引用并入本文。在此提供的任一实施方案中,其中所述记录标签到编码标签的信息传递通过DNA连接酶介导。或者,其中所述记录标签到编码标签的信息传递通过DNA合成酶或化学连接介导。在此提供的任一实施方案中,分析所述延伸记录标签可以包含核酸测序。在进一步实施方案中,核酸测序方法是合成测序、连接测序、杂交测序、polony测序、离子半导体测序或焦磷酸测序。在其它实施方案中,核酸测序方法是单分子实时测序、基于纳米孔测序、或使用高级显微镜的DNA直接成像。在此提供的任一实施方案中,所述延伸记录标签在分析前被扩增。在此提供的任一实施方案中,其中包含于所述延伸记录标签中的所述编码标签信息的顺序可以通过所述结合剂到大分子提供关于结合顺序的信息以及被所述结合剂检测到的分析物的所述序列信息。在此提供的任一实施方案中,其中包含于所述延伸记录标签中的特定编码标签信息的频率例如编码器序列可以通过特定结合剂到所述大分子提供关于结合频率的信息以及被所述结合剂检测到的所述大分子中的所述分析物的频率的信息。在此公开的任何实施方案中,多个大分子例如,蛋白质样品可以汇集,其中每个样品中的大分子群体用包含样品特异性条形码的记录标签标记。这样汇集的大分子样品可以在单个反应管中进行结合循环。在此公开的任何实施方案中,其中代表多个大分子的多个延伸记录标签可以平行分析。在此公开的任何实施方案中,其中代表多个大分子的多个延伸记录标签可以在多路复用检测中分析。在此提供的任一实施方案中,所述多个延伸记录标签在分析之前进行靶标丰度检测。在此提供的任一实施方案中,所述多个延伸记录标签在分析之前进行扣减检测。在此提供的任一实施方案中,所述多个延伸记录标签在分析之前进行标准化检测以降低高丰度种类。在此提供的任一实施方案中,所述NTAA采用修饰的氨肽酶、修饰的氨基酸tRNA合成酶、温和型埃德曼降解、埃德曼酶或无水TFA来移除。在此提供的任一实施方案中,其中至少一种结合剂结合到末端氨基酸残基。在一些实施方案中,所述末端氨基酸残基是N-末端氨基酸或C-末端氨基酸。在此提供的任一实施方案中,其中至少一种结合剂结合到翻译后修饰的氨基酸。前述实施方案的特征在以下部分提供进一步细节。IV大分子在一个方面,提供分析大分子的方法,包括以下步骤:大分子是由较小的亚基组成的大分子。在某些实施方案中,大分子是蛋白质、蛋白质复合物、多肽、肽、核酸分子、碳水化合物、脂质、大环或嵌合大分子。根据本文公开的方法分析的大分子例如,蛋白质,多肽,肽可以从合适的来源或样品获得,包括但不限于:生物样品,如细胞原代细胞和培养细胞系,细胞裂解物或提取物,细胞器或囊泡,包括外泌体,组织和组织提取物;活检;粪便;体液如血液,全血,血清,血浆,尿液,淋巴液,胆汁,脑脊液,间质液,水溶液或玻璃体液,初乳,痰液,羊水,唾液,肛门和阴道分泌物,汗液和精液,渗出物,渗出物例如,从脓肿或任何其他感染或炎症部位获得的液体或从关节正常关节或受类风湿性关节炎,骨关节炎,痛风或化脓性关节炎等疾病影响的关节获得的液体任何生物体,含有哺乳动物的样品,包括含有微生物组的样品,是优选的和人源样品,特别优选地包括含微生物组的样品;环境样品如空气,农业,水和土壤样品;微生物样品包括来自微生物生物膜和或群落的样品,以及微生物孢子;研究样品,包括细胞外液、来自于细胞培养物的细胞外上清液、细菌中的包涵体、包括线粒体区室的细胞区室和细胞周质。在某些实施方案中,大分子是蛋白质、蛋白质复合物、多肽或肽。将肽、多肽或蛋白质的氨基酸序列信息和翻译后修饰转导到核酸编码的文库中,该文库可以通过下一代测序方法进行分析。肽可包含L-氨基酸、D-氨基酸或两者。肽、多肽、蛋白质或蛋白质复合物可包含标准的天然存在的氨基酸、修饰的氨基酸例如,翻译后修饰、氨基酸类似物、氨基酸模拟物或其任何组合。在一些实施方案中,肽、多肽或蛋白质是天然存在的、合成产生的或重组表达的。在任何上述肽实施方案中,肽、多肽、蛋白质或蛋白质复合物可进一步包含翻译后修饰。标准的天然氨基酸包括:丙氨酸A或Ala、半胱氨酸C或Cys、天冬氨酸D或Asp、谷氨酸E或Glu、苯丙氨酸F或Phe、甘氨酸G或Gly、组氨酸H或His、异亮氨酸I或Ile、赖氨酸K或Lys、亮氨酸L或Leu、蛋氨酸M或Met、天冬酰胺N或Asn、脯氨酸P或Pro、谷氨酰胺Q或Gln、精氨酸R或Arg、丝氨酸S或Ser、苏氨酸T或Thr、缬氨酸V或Val、色氨酸W或Trp和酪氨酸Y或Tyr。非标准氨基酸包括硒代半胱氨酸、吡咯赖氨酸和N-甲酰基甲硫氨酸、β-氨基酸、同源氨基酸、脯氨酸和丙酮酸衍生物、3-取代丙氨酸衍生物、甘氨酸衍生物、环取代苯丙氨酸和酪氨酸衍生物、线性核心氨基酸和N-甲基氨基酸。肽、多肽或蛋白质的翻译后修饰PTM可以是共价修饰或酶促修饰。翻译后修饰的实例包括,但不限于酰化、乙酰化、烷基化包括甲基化、生物素化、丁酰化、氨基甲酰化、羰基化、脱酰胺、脱酰胺、二萘胺形成、二硫桥形成、消除、黄素附着、甲酰化、γ-羧化、谷氨酰化、甘氨酰化、糖基化例如,N-连接、O-连接、C-连接、磷酸糖基化、glypiation、血红素C连接、羟基化、hypusine形成、碘化、异戊二烯化、脂化、脂质化、丙酰化、甲基化、肉豆蔻酰化、氧化、棕榈酰化、聚乙二醇化、磷酸酯化、磷酸化、异戊烯化、丙酰化、亚视黄基席夫碱形成、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、硒化、琥珀酰化、硫化、泛素化和C-末端酰胺化。翻译后修饰包括肽、多肽或蛋白质的氨基末端和或羧基末端的修饰。末端氨基的修饰包括但不限于脱氨基、N-低级烷基、N-二低级烷基和N-酰基修饰。末端羧基的修饰包括但不限于酰胺、低级烷基酰胺、二烷基酰胺和低级烷基酯改性例如,其中低级烷基是C1-C4烷基。翻译后修饰还包括落在肽、多肽或蛋白质的氨基和羧基末端之间的氨基酸的修饰,例如但不限于上述修饰。翻译后修饰可以调节细胞内蛋白质的“生物学”,例如其活性、结构、稳定性或定位。磷酸化是最常见的翻译后修饰,并且在蛋白质的调节中起重要作用,特别是在细胞信号传导中Prabakaranetal.,2012,WileyInterdiscipRevSystBiolMed4:565-583。向蛋白质中添加糖,例如糖基化,已经显示出促进蛋白质折叠、改善稳定性和改变调节功能。脂质与蛋白质的附着使得能够靶向细胞膜。翻译后修饰还可以包括肽、多肽或蛋白质修饰以包括一种或多种可检测标记。在某些实施方案中,肽、多肽或蛋白质可以是片段化的。例如,可以通过从样品例如生物样品中分离蛋白质来获得片段化的肽。肽、多肽或蛋白质可以通过本领域已知的任何方法片段化,包括通过蛋白酶或内肽酶的片段化。在一些实施方案中,通过使用特异性蛋白酶或内肽酶靶向肽,多肽或蛋白质的片段化。特定的蛋白酶或内肽酶在特定的共有序列例如,对ENLYFQ\S共有序列特异的TEV蛋白酶结合并切割。在其他实施方案中,肽、多肽或蛋白质的片段化是非靶向的或随机的,通过使用非特异性蛋白酶或内肽酶。非特异性蛋白酶可以在特定氨基酸残基而不是共有序列处结合和切割例如,蛋白酶K是非特异性丝氨酸蛋白酶。蛋白酶和内肽酶是本领域熟知的,并且可用于将蛋白质或多肽切割成较小肽片段的实例包括蛋白酶K、胰蛋白酶、胰凝乳蛋白酶、胃蛋白酶、嗜热菌蛋白酶、凝血酶、因子Xa、弗林蛋白酶、内肽酶、木瓜蛋白酶、胃蛋白酶、枯草杆菌蛋白酶、弹性蛋白酶、肠激酶、GenenaseTMI、内蛋白酶LysC、内切蛋白酶AspN、内蛋白酶GluC等。Granvogletal.,2007,AnalBioanalChem389:991-1002。在某些实施方案中,肽、多肽或蛋白质被蛋白酶K或任选的不耐热形式的蛋白酶K片段化,以使得能够快速失活。蛋白酶K在变性试剂例如尿素和SDS中非常稳定,能够消化完全变性的蛋白质。可以在附着DNA标签或DNA记录标签之前或之后进行蛋白质和多肽片段化成肽。化学试剂也可用于将蛋白消化成肽片段。化学试剂可以在特定的氨基酸残基处裂解例如,溴化氰水解甲硫氨酸残基的C-末端的肽键。用于将多肽或蛋白质片段化成较小肽的化学试剂包括溴化氰CNBr、羟胺、肼、甲酸、BNPS-粪臭素[2-2-硝基苯基亚磺酰基-3-甲基吲哚]、碘代苯甲酸、NTCB+Ni2-硝基-5-硫氰基苯甲酸等。在某些实施方案中,在酶促或化学切割后,所得肽片段具有大致相同的所需长度,例如,约10个氨基酸至约70个氨基酸,约10个氨基酸至约60个氨基酸,约10个氨基酸。约50个氨基酸,约10至约40个氨基酸,约10至约30个氨基酸,约20个氨基酸至约70个氨基酸,约20个氨基酸至约60个氨基酸,约20个氨基酸约50个氨基酸,约20至约40个氨基酸,约20至约30个氨基酸,约30个氨基酸至约70个氨基酸,约30个氨基酸至约60个氨基酸,约30个氨基酸约50个氨基酸,或约30个氨基酸至约40个氨基酸。通过用包含含有蛋白酶或内肽酶切割位点的肽序列的短测试FRET荧光共振能量转移肽掺加蛋白质或多肽样品,可以优选实时监测切割反应。在完整的FRET肽中,荧光基团和猝灭剂基团连接到含有切割位点的肽序列的任一端,并且猝灭剂和荧光团之间的荧光共振能量转移导致低荧光。在用蛋白酶或内肽酶切割测试肽后,分离猝灭剂和荧光团,使荧光大大增加。当达到某种荧光强度时,可以停止裂解反应,从而实现可重现的解理终点。大分子样品例如,肽、多肽或蛋白质可以在附着到固体支持物之前经历蛋白质分级方法,其中蛋白质或肽通过一种或多种性质分离,例如细胞定位、分子量、疏水性或等电位点或蛋白质富集方法。或者另外,蛋白质富集方法可用于选择特定蛋白质或肽请参见,例如Whiteakeretal.,2007,Anal.Biochem.362:44-54,通过引用整体并入或选择特定的翻译后修改请参考,例如Huangetal.,2014.J.Chromatogr.A1372:1-17,通过引用整体并入。或者,可以富集或选择特定类别或类别的蛋白质如免疫球蛋白或免疫球蛋白Ig同种型如IgG,用于分析。在免疫球蛋白分子的情况下,涉及亲和结合的高变序列的序列和丰度或频率的分析是特别令人感兴趣,特别是因为它们的变化随着疾病进展而变化或与健康、免疫和或疾病表型相关。使用标准免疫亲和方法也可以从样品中减去丰度过高蛋白。丰度蛋白的消减可用于血浆样品,其中超过80%的蛋白成分是白蛋白和免疫球蛋白。有几种商业产品可用于过丰蛋白的血浆样品的削减,例如PROTIA和PROT20Sigma-Aldrich。在某些实施方案中,所述大分子由蛋白或多肽组成。在一个实施方案中,所述蛋白或多肽通过标准胺偶联化学方法用DNA记录标签标记参见例如图2B,2C,28,29,31,40。所述-氨基-氨基例如赖氨酸残基和N-末端氨基特别易于用胺反应性偶联剂标记,取决于所述反应的pHMendozaandVachet2009。在特定实施方案中参见,例如,图2B和图29,所述记录标签包含反应性基团例如,用于缀合至固体表面、多功能接头、或大分子、接头、通用引物序列、条形码例如,隔室标签、分区条形码、样品条形码、分级物条形码或其任何组合、可选的UMI、和间隔Sp序列,用于促进向从编码标签的信息转移。在另一个实施方案中,可以首先用通用DNA标签标记所述蛋白,并且所述条形码-Sp序列代表样品、区室、载玻片上的物理位置等随后通过酶促或化学偶联步骤附着于所述蛋白。参见,例如图20,30,31,40。通用DNA标签包含用于标记蛋白质或多肽大分子的短核苷酸序列,其并且可用作条形码的附着点例如,隔室标签、记录标签等。例如,记录标签可在其末端包含与所述通用DNA标签互补的序列。在某些实施方案中,通用DNA标签是通用引物序列。在所述标记蛋白上的所述通用DNA标签与记录标签中的互补序列例如,与珠子结合杂交后,所述退火的通用DNA标签可以通过引物延伸扩增,将所述记录标签信息转移到所述DNA标记的蛋白。在一个具体实施方案中,在蛋白酶消化所述蛋白质成肽之前,用通用DNA标签标记。然后可以将来自消化物的所述标记肽上的所述通用DNA标签转换成信息丰富和有效的记录标签。在某些实施方案中,蛋白质大分子可以通过亲和捕获试剂并且任选地共价交联固定到固体支持物上,其中所述记录标签直接与所述亲和捕获试剂结合,或者,所述蛋白可以直接固定到具有记录标签的所述固体支持物上参见例如图2C。V.固体支持物本公开的大分子连接到固体支持物的表面也称为“基质表面”。所述固体载体可以是任何多孔或无孔载体表面,包括但不限于珠子、微珠、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶芯片、流通槽、流控芯片、包括信号转导电子器件的生物芯片、微量滴定孔、ELISA板,旋转干涉测量盘、硝酸纤维素膜、基于硝酸纤维素的聚合物表面、纳米颗粒或微球。用于固体载体的材料包括但不限于丙烯酰胺、琼脂糖、纤维素、硝化纤维素、玻璃、金、石英、聚苯乙烯、聚乙烯乙酸乙烯酯、聚丙烯、聚甲基丙烯酸酯、聚乙烯、聚环氧乙烷、聚硅酸盐、聚碳酸酯、特氟隆、碳氟化合物、尼龙、硅橡胶、聚酸酐、聚乙醇酸、聚乳酸、聚原酸酯、官能化硅烷、聚丙基延胡索酸酯、胶原、糖胺聚糖、聚氨基酸、葡聚糖、或其任何组合。固体支持物还包括薄膜、膜、瓶、盘、纤维、编织纤维、成形聚合物,例如管、颗粒、珠子、微球、微粒、或其任何组合。例如,当固体表面是珠子时,所述珠子可以包括但不限于陶瓷珠子、聚苯乙烯珠子、聚合物珠子,甲基苯乙烯珠子、琼脂糖珠子、丙烯酰胺珠子、实心珠子、多孔珠、顺磁珠,玻璃珠或可控孔珠。在某些实施方案中,固体支持物是流通槽。流通槽配置可以在不同的下一代测序平台之间变化。例如,所述Illumina流通槽是类似于显微镜载玻片的平面光学透明表面,其包含在其表面结合的寡核苷酸锚草坪。模板DNA包含与末端连接的衔接子,所述衔接子与流通槽表面上的寡核苷酸互补。适配的单链DNA与所述流通槽结合,并在测序前通过“桥”式样固相PCR扩增。所述454流通池54LifeSciences支持“picotiter”板,光纤载玻片具有~160万75Picotiter孔。剪切的模板DNA的每单个分子被捕获到分离的珠子上,并且每个珠子在油乳液内的水性PCR反应混合物的专用液滴中区室化。通过PCR在所述珠子表面上克隆扩增模板,然后将载有所述模板的珠子分配到Picotiter滴定板的孔中用于测序反应,理想的是每孔含有一个或更少的珠子。来自AppliedBiosystems的SOLiD支持寡核苷酸连接和检测仪器,如454系统,通过乳液PCR扩增模板分子。在剔除不含扩增模板的珠子的步骤之后,将结合在珠子的存放在所述流通槽。流通槽也可以是简单的过滤器玻璃料,例如TWISTTMDNA合成柱GlenResearch。在某些实施方案中,固体支持物是珠子,其可以指单个珠子或多个珠子。在一些实施方案中,所述珠子与选来用于下游分析例如,SOLiD或454的下一代测序平台相互兼容。在一些实施方案中,固体支持物是琼脂糖珠子、顺磁珠子、聚苯乙烯珠子、聚合物珠子、丙烯酰胺珠子、实心珠子、多孔珠子、顺磁珠子、玻璃珠子或可控孔珠子。在进一步的实施方案中,珠子可以包被结合官能团例如,胺基团、用于结合生物素标记的大分子的链霉亲和素、抗体以促进与大分子的结合。蛋白、多肽或肽可以通过本领域已知的任何方式,包括共价和非共价相互作用,或其任何组合见,例如Chanetal.,2007,PLoSOne2:e1164;Cazalisetal.,Bioconj.Chem.15:1005-1009;Soellneretal.,2003,J.Am.Chem.Soc.125:11790-11791;Sunetal.,2006,Bioconjug.Chem.17-52-57;Decreauetal.,2007,J.Org.Chem.72:2794-2802;Camareroetal.,2004,J.Am.Chem.Soc.126:14730-14731;Girishetal.,2005,Bioorg.Med.Chem.Lett.15:2447-2451;Kaliaetal.,2007,Bioconjug.Chem.18:1064-1069;Watzkeetal.,2006,AngewChem.Int.Ed.Engl.45:1408-1412;Parthasarathyetal.,2007,BioconjugateChem.18:469-476;和BioconjugateTechniques,G.T.Hermanson,AcademicPress2013,并且每个都通过引用整体并入本文直接或间接地连接到所述固体支持物。例如,所述肽可以通过连接反应与所述固体支持物连接。或者,固体支持物可包括试剂或涂层以促进所述肽直接或间接连接到所述固体支持物上。为此目的可以使用任何合适的分子或材料,包括蛋白质、核酸、碳水化合物和小分子。例如,在一个实施方案中,所述试剂是亲和分子。在另一个实例中,所述试剂是叠氮基团,可以与另一分子中的炔基反应以促进所述固体载体和其它分子之间的联合或结合。蛋白质,多肽或肽可以通过称为“点击化学”的方法连接到固体支持物上。为此目的,任何快速且基本上不可逆的反应可用于将蛋白、多肽或肽连接到所述固体支持物上。示例性反应包括叠氮化物和炔烃的铜催化反应以形成三唑Huisgen1,3-偶极环加成,应变促进的叠氮化物炔烃环加成SPAAC,二烯和亲二烯体Diels-Alder的反应,应变-促进的炔烃-硝酮环加成反应,应变烯烃与叠氮化物、四嗪或四唑的反应,烯烃和叠氮化物[3+2]环加成反应,烯烃和四嗪反转电子要求的Diels-AlderIEDDA反应如m-四嗪mTet和反式环辛烯TCO、烯烃和四唑光反应,叠氮化物和膦的Staudinger连接,以及各种置换反应:例如通过对亲电子原子的亲核攻击的离去基团置换Horisawa2014,Knall,Hollaufetal.2014。示例性置换反应包括胺与:活化酯;N-羟基琥珀酰亚胺酯;异氰酸酯;异硫氰酸酯等的反应。在一些实施方案中,所述大分子和固体支持物通过能够通过两个互补反应基团的反应形成的官能团连接,例如一种前述“点击”反应的产物、官能团。在各种实施方案中,官能团可以通过醛、肟、腙、酰肼、炔烃、胺、叠氮化物、酰基叠氮化物、酰基卤化物、腈、硝酮、巯基、二硫化物、磺酰卤、异硫氰酸酯、酰亚胺酯、活化酯例如N-羟基琥珀酰亚胺酯、戊炔酸STP酯、酮、.-不饱和羰基、烯烃、马来酰亚胺、-卤代酰亚胺、环氧化物、氮丙啶、四嗪、四唑、膦、生物素或环硫官能团与互补反应性基团的反应形成。示例性反应是胺例如伯胺与N-羟基琥珀酰亚胺酯或异硫氰酸酯的反应。在其他实施方案中,所述官能团包含烯烃、酯、酰胺、硫酯、二硫化物、碳环、杂环或杂芳基。在进一步的实施方案中,所述官能团包含烯烃、酯、酰胺、硫酯、二硫化物、碳环、杂环或杂芳基。在其它实施方案中,所述官能团包含酰胺或硫脲。在一些更具体的实施方案中,官能团是三唑基官能团、酰胺、或硫脲官能团。在一个优选实施方案中,iEDDA点击化学用于将大分子例如,蛋白、多肽、肽固定到固体支持物上,因为它是快速的并且在低输入浓度下高产率的。在另一个优选的实施方案中,在iEDDA点击化学反应用m-四嗪而不是四嗪,因为m-四嗪具有更好的键稳定性。在一个优选的实施方案中,用TCO官能化基质表面,并通过连接的间-四嗪部分将记录标签标记的蛋白质,多肽,肽固定在TCO涂覆的基质表面上图34。蛋白、多肽或肽可通过其C-末端,N-末端或内部氨基酸例如,通过胺,羧基或巯基固定到固体支持物的表面。用于偶联胺基的标准活化载体包括CNBr活化的、NHS活化的、醛活化的、吖内酯活化的、和CDI活化的载体。用于羧基偶联的标准活化载体包括与胺载体偶联的碳二亚胺活化的羧基基团。半胱氨酸偶联可以使用马来酰亚胺、异乙酰基和吡啶基二硫化物活化的载体。肽羧基末端固定的另一种方式使用脱水胰蛋白酶,胰蛋白酶的催化惰性衍生物,其在C-末端结合含有赖氨酸或精氨酸残基的肽而不切割它们。在某些实施方案中,蛋白质,多肽或肽通过固体表面连接的接头与所述蛋白、多肽或肽的赖氨酸基团的共价连接固定到固体支持物上。记录标签可以在固定到所述固体支持物之前或之后附着到蛋白、多肽或肽上。例如,蛋白、多肽或肽可首先用记录标签标记,然后通过包含两个用于偶联的功能基团的记录标签固定在固体表面上参见图28。所述记录标签的一个功能基团与蛋白质偶联,而另一个功能基团将所述记录标签标记的蛋白固定在固体支持物上。或者,在用记录标签标记所述蛋白、多肽或肽之前,将蛋白、多肽或肽固定到固体支持物上。例如,蛋白可以首先用反应基团例如点击化学基团派生化。然后所述活化的蛋白分子可以连接到合适的固体支持物上,然后通过采用互补点击化学基团标记上记录标签。作为例子,用炔和mTet基团衍生的蛋白可以固定在用叠氮化物和TCO衍生的珠子上,并附着在用叠氮化物和TCO标记的记录标签上。应当理解,本文提供的用于将大分子例如,蛋白、多肽、或肽连接至所述固体支持物的方法也可用于将记录标签附着至所述固体支持物或将记录标签附着至大分子例如,蛋白、多肽、或肽。在某些实施方案中,所述固体支持物的表面被钝化封闭以最小化对结合剂的非特异性吸收。“钝化的”表面是指已经用外层材料处理以最小化结合剂的非特异性结合的表面。钝化表面的方法包括来自荧光单分子分析文献的标准方法,包括用聚合物如聚乙二醇PEG钝化表面Panetal.,2015,Phys.Biol.12:045006、聚硅氧烷例如,PluronicF-127、星形聚合物例如,星形PEGGrolletal.,2010,MethodsEnzymol.472:1-18,疏水性二氯二甲基硅烷DDS+自组装吐温-20Huaetal.,2014,Nat.Methods11:1233-1236和类金刚石碳DLC,DLC+PEGStavisetal.,2011,Proc.Natl.Acad.Sci.USA108:983-988。除了共价表面修饰之外,还可以使用许多钝化剂,包括表面活性剂如Tween-20、溶液状聚硅氧烷Pluronic系列、聚乙烯醇PVA、和BSA和酪蛋白等蛋白质。或者,当将所述蛋白、多肽、或肽固定到所述固体基质上时,可以通过掺入竞争分子或“虚拟”反应性分子,在所述固体基质的表面上或体积内滴定蛋白、多肽或肽的密度见图36A。在多个大分子固定在相同固体支持物上的某些实施方案中,所述大分子可以适当间隔以减少或防止交叉结合或分子间事件的发生,例如,当结合剂结合第一大分子,且其编码标签信息被传送到与相邻大分子相连的记录标签,而不是与第一大分子相连的记录标签。为了控制固体支持物上的大分子例如,蛋白质、多肽或肽间距间距,可以在所述基质表面上滴定功能性偶联基团例如TCO的密度参见图34。在一些实施方案中,多个大分子在所述固体载体的表面上或体积例如,多孔载体内间隔开约50nm至约500nm、或约50nm至约400nm,或约50nm至约300nm,或约50nm至约200nm,或约50nm至约100nm的距离。在一些实施方案中,多个大分子在固体支持物的表面上间隔开,平均距离为至少50nm,至少60nm,至少70nm,至少80nm,至少90nm,至少100nm,至少150nm,至少200nm,至少250nm,至少300nm,至少350nm,至少400nm,至少450nm,或至少500nm。在一些实施方案中,多个大分子在固体支持物的所述表面上间隔开,平均距离为至少50nm。在一些实施方案中,大分子在所述固体支持物的表面上或体积内间隔开,根据经验,使得分子间与分子内事件的相对频率10X、100X或1000X的浓度加入到所述大分子中,以使其结合至完成。Chang等人描述了抗体与单个蛋白质分子的结合动力学的详细讨论Chang,Rissinetal.2012。为了增加结合剂对肽的小N-末端氨基酸NTAA的亲和力,可以用“免疫原性”半抗原,例如二硝基苯酚DNP修饰所述NTAA。可以使用Sanger试剂,二硝基氟苯DNFB以循环测序方法实施,该试剂将DNP基团连接到所述NTAA的胺基上。商购的抗DNP抗体在低nM范围内~8nM,LO-DNP-2具有亲和力Bilgicer,Thomas等人2009;因此,有理由认为可以将高亲和力NTAA结合剂制成许多用DNP修饰通过DNFB的NTAA,同时对特定NTAA实现良好的结合选择性。在另一个实例中,可以通过4-磺酰基-2-硝基氟苯SNFB用磺酰基硝基苯酚SNP修饰NTAA。用替代的NTAA改性剂例如乙酰基或脒基胍基也可以实现类似的亲和力增强。在某些实施方案中,结合剂可以结合NTAA、CTAA、干预氨基酸、二肽两个氨基酸的序列、三肽三个氨基酸的序列、或肽分子的更高次序肽。在一些实施方案中,结合剂文库中的每种结合剂选择性结合特定氨基酸,例如二十种标准天然存在的氨基酸之一。标准的天然氨基酸包括丙氨酸A或Ala、半胱氨酸C或Cys、天冬氨酸D或Asp、谷氨酸E或Glu、苯丙氨酸F或Phe、甘氨酸G或Gly、组氨酸H或His、异亮氨酸I或Ile、赖氨酸K或Lys、亮氨酸L或Leu、蛋氨酸M或Met、天冬酰胺N或Asn、脯氨酸P或Pro、谷氨酰胺Q或Gln、精氨酸R或Arg、丝氨酸S或Ser、苏氨酸T或Thr、缬氨酸V或Val、色氨酸W或Trp、和酪氨酸Y或Tyr。在某些实施方案中,结合剂可以结合氨基酸的翻译后修饰。在一些实施方案中,肽包含一个或多个相同的或不同的翻译后修饰。所述NTAA、CTAA、干预氨基酸、或其组合可以是翻译后修饰的。氨基酸的翻译后修饰包括酰化、乙酰化、烷基化包括甲基化、生物素化、丁酰化、氨基甲酰化、羰基化、脱酰胺、脱酰胺、二萘胺形成,二硫键形成、消除、黄素附着、甲酰化、γ-羧化、谷氨酰化、甘氨酰化、糖基化、glypiation、血红素C附着、羟基化、羟丁赖氨酸hypusine形成、碘化、异戊二烯化、脂化、脂酰化、丙二酰化、甲基化、肉豆蔻酰化、氧化、棕榈酰化,聚乙二醇化、磷酸酯化、磷酸化、异戊烯化、丙酰化、retinylideneSchiff碱形成、S-谷胱甘肽化、S-亚硝基化、S-亚磺酰化、硒化、琥珀酰化、硫化、泛素化ubiquitination和C-末端酰胺化也可参阅,Seo和Lee,2004,J.Biochem.Mol.Biol.37:35-44。在某些实施方案中,凝集素用作结合剂,用于检测蛋白、多肽或肽的糖基化状态。凝集素是碳水化合物结合蛋白,其可以选择性地识别游离碳水化合物或糖蛋白的聚糖表位。识别各种糖基化状态例如,核心-岩藻糖、唾液酸、N-乙酰基-D-乳糖胺、甘露糖、N-乙酰基-葡糖胺的凝集素名单包括:A,AAA,AAL,ABA,ACA,ACG,ACL,AOL,ASA,BanLec,BC2L-A,BC2LCN,BPA,BPL,Calsepa,CGL2,CNL,Con,ConA,DBA,Discoidin,DSA,ECA,EEL,F17AG,Gal1,Gal1-S,Gal2,Gal3,Gal3C-S,Gal7-S,Gal9,GNA,GRFT,GS-1,GS-II,GSL-1,GSL-II,HHL,HIHA,HPA,I,II,Jacalin,LBA,LCA,LEA,LEL,扁豆,Lotus,LSL-N,LTL,MAA,MAH,MAL_I,Malectin,MOA,MPA,MPL,NPA,Orysata,PA-IIL,PA-IL,PALa,PHA-E,PHA-L,PHA-P,PHAE,PHAL,PNA,PPL,PSA,PSL1a,PTL,PTL-1,PWM,RCA120,RS-Fuc,SAMB,SBA,SJA,SNA,SNA-1,SNA-II,SSA,STL,TJA-I,TJA-II,TxLCI,UDA,UEA-1,UEA-II,VFA,VVA,WFA,WGAsee,Zhangetal.,2016,MABS8:524-535。在某些实施方案中,结合剂可以与修饰的或标记的NTAA结合。修饰或标记的NTAA可以是用PITC、1-氟-2,4-二硝基苯Sanger试剂,DNFB、丹磺酰氯DNS-Cl,或1-二甲基氨基萘-5-磺酰氯、4-磺酰基-2-硝基氟苯SNFB、乙酰化试剂、胍基化试剂、硫代酰化试剂、硫代乙酰化试剂、或硫代苄基化试剂之一标记的NTAA。在某些实施方案中,结合剂可以是适配体例如,肽适体、DNA适体、或RNA适体、抗体、anticalin、ATP依赖性Clp蛋白酶衔接蛋白ClpS、抗体结合片段、抗体模拟物、肽、肽模拟物、蛋白质、或多核苷酸例如,DNA、RN、肽核酸PNA、γPNA、桥接核酸BNA、异种核酸XNA、甘油核酸GNA、或苏糖核酸TNA、或其变体。如本文所用,术语抗体和抗体以广义使用,不仅包括完整的抗体分子,例如但不限于免疫球蛋白A、免疫球蛋白G、免疫球蛋白、免疫球蛋白E、和免疫球蛋白M,还包括特异性结合至少一个表位的抗体分子的免疫活性组分。抗体可以是天然存在的、合成产生的或重组表达的。抗体可以是融合蛋白。抗体可以是抗体模拟物。抗体的例子包括但不限于Fab片段、Fab'片段、Fab'2片段、单链抗体片段scFv、小抗体、双抗体、交联抗体片段、AffibodyTM、纳米抗体、单结构域抗体、DVD-Ig分子,α体、affimers、affitins、cyclotides,分子、和其类似物。使用抗体工程或蛋白质工程技术衍生的免疫反应产物也明确地在术语抗体的含义内。抗体和或蛋白质工程的详细描述,包括相关的方案,可以在J.Maynard和G.Georgiou,2000,Ann.Rev.Biomed.Eng.2:339-76;AntibodyEngineering,R.Kontermann和S.Dubel,eds.,SpringerLabManual,SpringerVerlag2001;U.S.PatentNo.5,831,012;和S.Paul,AntibodyEngineeringProtocols,HumanaPress1995,等其它地方找到,。与抗体一样,可以使用已知方法产生特异性识别肽的核酸和肽适体。适体虽然通常以高度亲和性高度特异、构象依赖方地结合靶分子,但可以选择具有较低结合亲和力的适体。已显示适体基于非常小的结构差异,例如甲基或羟基的存在或不存在,来区分靶标,并且某些适体可区分D-和L-对映体。已经获得了结合小分子靶标,包括药物、金属离子和有机染料、肽、生物素和蛋白质的适体,包括但不限于链霉亲和素、VEGF和病毒蛋白。已显示适体在生物素化、荧光素标记后以及当附着于玻璃表面和微球时保留功能活性参阅,Jayasena,1999,ClinChem45:1628-50;Kusser2000,J.Biotechnol.74:27-39;Colas,2000,CurrOpinChemBiol4:54-9。特异性结合精氨酸和AMP的适体已经被描述参阅,Patel和Suri,2000,J.Biotech.74:39-60。Gold等人已经公开了与特定氨基酸结合的寡核苷酸适体1995,Ann.Rev.Biochem.64:763-97。结合氨基酸的RNA适体也已经被描述Ames和Breaker,2011,RNABiol.8;82-89;Mannironietal.,2000,RNA6:520-27;Famulok,1994,J.Am.Chem.Soc.116:1698-1706。可以通过基因工程修饰天然存在的或合成产生的蛋白质来制备结合剂,以在氨基酸序列中引入一个或多个突变以产生结合大分子的特定组分或特征的工程化蛋白质例如,NTAA、CTAA、或翻译后修饰的氨基酸或肽。例如,可以修饰外肽酶例如,氨肽酶、羧肽酶、外切蛋白酶、突变的外切蛋白酶、突变的anticalin、突变的ClpS、抗体或tRNA合成酶,以产生选择性结合特定NTAA的结合剂。在另一个实例中,可以修饰羧肽酶以产生选择性结合特定CTAA的结合剂。结合剂也可以通过设计、或修饰、以及应用,以特异性结合修饰的NTAA或修饰的CTAA,例如具有翻译后修饰的CTAA例如,磷酸化的NTAA或磷酸化的CTAA、或经标签例如,PTC、1-氟-2,4-二硝基苯使用Sanger试剂,DNFB、丹磺酰氯使用DNS-Cl,或1-二甲基氨基萘-5-磺酰氯,或使用硫代酰化试剂、硫代乙酰化试剂、乙酰化试剂、酰胺化胍基化试剂或硫代苄基化试剂修饰的CTAA。蛋白质定向进化的策略是本领域已知的例如:reviewedbyYuanetal.,2005,Microbiol.Mol.Biol.Rev.69:373-392,包括噬菌体展示、核糖体展示、mRNA展示、CIS显示、CAD显示、乳化、细胞表面展示、,酵母表面展示、细菌表面展示等。在一些实施方案中,可以使用选择性结合修饰的NTAA的结合剂。例如,所述NTAA可以与异硫氰酸苯酯PITC反应形成苯基硫代氨基甲酰基-NTAA衍生物。以这种方式,所述结合剂可以被制成选择性地结合苯基硫代氨基甲酰基基团的苯团和所述NTAA的α-碳R基团二者。如下所述,以这种方式使用PITC允许随后通过Edman降解裂解所述NTAA。在另一个实施方案中,所述NTAA可以与Sanger试剂DNFB反应,以产生DNP标记的NTAA参见图3。任选地,DNFB与离子液体,例如1-[乙基-3-甲基咪唑双[三氟甲基磺酰基]酰亚胺[emim][Tf2N]一起使用,其中DNFB是高度可溶的。以这种方式,所述结合剂可以改造以选择性地结合所述NTAA上的所述DNP和所R基团的组合。DNP基团的添加为所述结合剂与所述NTAA的相互作用提供了更大的“手柄”,并且应该产生更高的亲和作用。在另一个实施方案中,结合剂可以是氨肽酶,其已被工程化以识别所述DNP标记的NTAA,从而提供所述肽的氨肽酶降解的循环对照。一旦所述DNP标记的NTAA被切割,就进行另一轮DNFB衍生化以结合并切割新暴露的NTAA。在优选的实施方案中,所述氨肽酶是单体金属蛋白酶,例如由锌活化的氨肽酶Calcagno和Klein2016。在另一个实例中,结合剂可以选择性地结合用磺酰基硝基苯酚SNP修饰的NTAA,例如通过使用4-磺酰基-2-硝基氟苯SNFB。在另一个实施方案中,结合剂可以选择性地结合乙酰化或酰胺化的NTAA。可用于修饰所述NTAA的其它试剂包括异硫氰酸三氟乙酯、异硫氰酸烯丙酯、和异硫氰酸二甲氨基偶氮苯。为了修饰的NTAA具有高亲和力、修饰的NTAA具有高度特异性,或两者兼而有之,可以工程化改造结合剂。在一些实施方案中,可以通过使用噬菌体展示定向进化有表现好的亲和支架来开发结合剂。结合并切割单个或小组标记生物素化的NTAA的工程化氨肽酶突变体已经被描述过参见PCT公开号WO2010065322,其通过引用整体并入。氨肽酶是从蛋白或肽的N-末端切割氨基酸的酶。天然氨肽酶具有非常有限的特异性,并且以渐进方式一个接一个地切割N-末端氨基酸Kishoretal.,2015,Anal.Biochem.488:6-8。然而,残基特异性氨肽酶已经被鉴定出Eriquezetal.,J.Clin.Microbiol.1980,12:667-71;Wilceetal.,1998,Proc.Natl.Acad.Sci.USA95:3472-3477;Liaoetal.,2004,Prot.Sci.13:1802-10。可以将氨肽酶工程化以特异性结合20种不同的NTAA,其代表特定基团例如,PTC,DNP,SNP等标记的标准氨基酸。通过使用仅在标记存在时具有活性例如结合活性或催化活性的工程化氨肽酶来控制肽的N-末端的逐步降解。在另一个例子中,Havranak等人美国专利公开20140273004描述了工程化氨酰基tRNA合成酶aaRS作为特异性NTAA结合物。所述aaRS的氨基酸结合口袋能够天然地结合同源氨基酸,但通常表现出弱的结合亲和力和特异性。而且,这些天然氨基酸结合剂不识别N-末端标记。aaRS支架的定向进化可用于产生更高亲和力、更高特异性的结合剂,其在N-末端标签的环境下识别所述N-末端氨基酸。在另一个实例中,高选择性工程ClpS也已在文献中描述。Emili等描述了通过菌体展示的大肠杆菌ClpS蛋白的定向进化,产生具有对天冬氨酸、精氨酸、色氨酸和亮氨酸残基的NTAA选择性结合的能力的四种不同的变体美国专利9,566,335,其全部内容通过引用并入。在一个具体实施方案中,将anticalin工程化以对标记的NTAA例如DNP,SNP、乙酰化等具有高亲和力和高特异性。某些品种的anticalin支架凭借其β桶结构的优点具有合适于结合单个氨基酸的形状。N末端氨基酸有或没有修饰可能适合并在这个“β桶”桶中被识别。具有工程化新结合活性的高亲和力anticalin已经被描述Skerra,2008,FEBSJ.275:2677-2683综述。例如,已经设计了具有高亲和力的anticalin结合低nM到荧光素和地高辛digoxygeninGebauer和Skerra2012。Banta等人也综述了用于新结合功能的替代支架的工程。2013,Annu.Rev.Biomed.Eng.15:93-113。通过使用单价结合剂的二价或更高次序多聚体,可以使给定单价结合剂的功能亲和力亲合力增加至少一个数量级Vauquelin和Charlton2013。亲和力是指多种同时非共价结合相互作用的累积强度。个体结合相互作用可以容易地解离。然而,当同时存在多个结合相互作用时,单个结合相互作用的瞬时解离不允许结合蛋白扩散并且结合相互作用可能恢复。增加结合剂亲合力的另一种方法是在与所述结合剂连接的所述编码标签和与所述大分子相关的所述记录标签中包括互补序列。在一些实施方案中,可以采用选择性结合修饰的C-末端氨基酸CTAA的结合剂。羧肽酶是切割含有游离羧基的末端氨基酸的蛋白酶。许多羧肽酶表现出氨基酸偏好,例如,羧肽酶B优先在碱性氨基酸如精氨酸和赖氨酸上切割。可以修饰羧肽酶以产生选择性结合特定氨基酸的结合剂。在一些实施方案中,可以改造羧肽酶以选择性结合修饰部分以及CTAA的-碳R基团。因此,工程化的羧肽酶可以特异性识别代表C-末端标记背景中的标准氨基酸的20种不同的CTAA。通过使用仅在标记存在下具有活性例如结合活性或催化活性的工程化羧肽酶来控制从肽的C-末端逐步降解。在一个实例中,CTAA可以被对硝基苯胺或7-氨基-4-甲基香豆酰基修饰。可以设计来用于产生本文所述方法的粘合剂的其他潜在支架包括:anticalin,氨基酸tRNA合成酶aaRS,ClpS,AdnectinTM,T细胞受体,锌指蛋白,硫氧还蛋白,GSTA1-1,DARPin,affimer,affitin,alphabody,avimer,Kunitz结构域肽,单体,单结构域抗体,EETI-II,HPSTI,胞内抗体,脂质运载蛋白,PHD指,VNARLDTI,evibody,IgNAR,knottin,maxibody,neocarzinostatin,pVIII,tendamistat,VLR,蛋白A支架,MTI-II,ecotin,GCN4,Im9,kunitz结构域,微体,PBP,反式体,tetranectin,WW结构域,CBM4-2,DX-88,GFP,iMab,Ldl受体结构域A,Min-23,PDZ结构域,禽胰腺多肽,charybdotoxin10Fn3,结构域抗体Dab,a2p8锚蛋白重复,昆虫防御A肽,设计的AR蛋白,C型凝集素结构域,葡萄球菌核酸酶,Src同源结构域3SH3,或Src同源结构域2SH2。结合剂可以设计以承受更高的温度和温和变性条件例如,存在尿素、硫氰酸胍、离子溶液等。采用变性剂有助于减少表面结合肽中的二级结构,例如-螺旋结构,~发夹,-链,和其他此类结构,其可能干扰结合剂与线性肽表位的结合。在一个实施方案中,离子液体如乙酸1-乙基-3-甲基咪唑乙酸盐[EMIM]+[ACE]用于在结合循环期间减少肽二级结构Lesch,Heueretal.2015。所描述的任何结合剂还包含含有关于所述结合剂的识别信息的编码标签。编码标签是约3碱基至约100个碱基的核酸分子,其为其相关结合剂提供独特的识别信息。编码标签可包含约3至约90个碱基,约3至约80个碱基,约3至约70个碱基,约3至约60个碱基,约3个碱基至约50个碱基,约3个碱基至约40个碱基,约3个碱基至约30个碱基,约3个碱基至约20个碱基,约3个碱基至约10个碱基,或约3个碱基至约8个碱基。在一些实施方案中,编码标签是约3个碱基,4个碱基,5个碱基,6个碱基,7个碱基,8个碱基,9个碱基,10个碱基,11个碱基,12个碱基,13个碱基,14个碱基,15个碱基,16个碱基,17个碱基,18个碱基,19个碱基,20个碱基,25个碱基,30个碱基,35个碱基,40个碱基,55个碱基,60个碱基,65个碱基,70个碱基,75个碱基,80个碱基,85个碱基,90个碱基,95个碱基,或100个碱基。编码标签可以由DNA、RNA、多核苷酸类似物、或其组合组成。多核苷酸类似物包括PNA、γPNA、BNA、GNA、TNA、LNA,吗啉代多核苷酸、2'-O-甲基多核苷酸、烷基核糖基取代的多核苷酸、硫代磷酸酯多核苷酸和7-脱氮嘌呤类似物。编码标签包含编码器序列,其提供关于所述相关结合剂的识别信息。编码序列为约3个碱基至约30个碱基,约3个碱基至约20个碱基,约3个碱基至约10个碱基,或约3个碱基至约8个碱基。在一些实施方案中,编码序列为约3个碱基,4个碱基,5个碱基,6个碱基,7个碱基,8个碱基,9个碱基,10个碱基,11个碱基,12个碱基,13个碱基,14个碱基,15个碱基,20个碱基,25个碱基或30个碱基的长度。所述编码器序列的长度决定了可以生成的独特编码器序列的数量。较短的编码序列产生较少数量的独特编码序列,这在使用少量结合剂时可能是有用的。当分析一群大分子时,可能需要更长的编码器序列。例如,5个碱基的编码序列具有5'-NNNNN-3'的公式SEQIDNO:135,其中N可以是任何天然存在的核苷酸或类似物。使用四种天然存在的核苷酸A,T,C和G,具有5个碱基长度的独特编码序列的总数是1,024。在一些实施例中,可以通过排除,例如其中所有碱基相同、至少三个连续碱基相同或两种情况的,编码器序列来减少独特编码序列的总数。在特定实施例中,一组≥50个独特编码器序列用于结合剂库。在一些实施例中,识别编码标签或记录标签的组件,例如编码器序列、条形码、UMI、隔室标签、分区条形码、样本条形码、空间区域条形码、循环特定序列或其任何组合,受限于汉明距离、Lee距离、不对称Lee距离、Reed-Solomon、Levenshtein-Tenengolts、或类似的纠错方法。汉明距离是指两个相等长度的字符串之间不同的位置的个数。它测量将一个字符串更改为另一个字符串时所需的最小替换次数。汉明距离可以用于通过选择合理距离的编码器序列来纠正错误。因此,在编码器序列是5碱基的示例中,编码器序列的数量减少到256个独特编码器序列汉明距离1→44个编码器序列=256个编码器序列。在另一个实施例中,所述编码器序列、条形码、UMI、隔室标签、循环特定序列、或其任何组合被设计为易于通过循环解码过程读出Gunderson,2004,GenomeRes.14:870-7。在另一个实施方案中,所述编码器序列、条形码、UMI、隔室标签、分区条形码、空间条形码、样品条形码,循环特异性序列或其任何组合被设计为通过低精度纳米孔测序读出,因为不需要单个碱基分辨率,而是需要读取复合碱基长度约5-20个碱基的词。可以在本公开的方法中使用的15-mer,错误校正汉明条形码的子集如SEQIDNO:1-65所示,并且它们相应的反向互补序列如SEQIDNO:66-130所示。在一些实施方案中,结合剂库内的每种独特结合剂具有独特编码序列。例如,20种独特的编码序列可用于结合20种标准氨基酸的20种结合剂的文库。额外的编码标签序列可用于识别修饰的氨基酸例如,翻译后修饰的氨基酸。在另一个实例中,30种独特编码序列可用于结合所述20种标准氨基酸和10种翻译后修饰氨基酸例如磷酸化氨基酸、乙酰化氨基酸、甲基化氨基酸的30种结合剂的文库。在其它实施例中,两个或更多个不同的结合剂可以共享相同的编码器序列。例如,各自结合不同的标准氨基酸的两种结合剂可以共享相同的编码序列。在某些实施方案中,编码标签还在一端或两端包含间隔序列。间隔序列为约1个碱基至约20个碱基,约1个碱基至约10个碱基,约5个碱基至约9个碱基,或约4个碱基至约8个碱基。在一些实施方案中,间隔子的长度约1个碱基,2个碱基,3个碱基,4个碱基,5个碱基,6个碱基,7个碱基,8个碱基,9个碱基,10个碱基,11个碱基,12个碱基,13个碱基,14个碱基,15个碱基、或20个碱基。在一些实施方案中,编码标签内的间隔子比编码序列短,例如,至少1个碱基,2个碱基,3个碱基,4个碱基,5个碱基,6个碱基,7个碱基,8个碱基,9个碱基,10个碱基,11个碱基,12个碱基,13个碱基,14个碱基,15个碱基,20个碱基或25个碱基。在其它实施例中,编码标签内的间隔子与所述编码器序列的长度相同。在某些实施方案中,间隔子是结合剂特异性的,使得来自先前结合循环的间隔子仅与来自当前结合循环中的适合结合剂的间隔子相互作用。一个例子是含有间隔序列的同源抗体对,仅当两种抗体顺序结合所述大分子时,允许信息转移。间隔序列可用作引物延伸反应的引物退火位点,或连接反应中的夹板或粘端。编码标签上的5'间隔区参见图5A,“*Sp'”可任选地包含与记录标签上的3'间隔区的伪互补碱基以增加TmLehoudetal.,2008,NucleicAcidsRes.36:3409-3419。在一些实施方案中,结合剂集合内的所述编码标签共享测定中使用的共同间隔序列例如,在多路复用结合循环方法中使用的整个结合剂文库在其编码标签中具有共同的间隔子。在另一个实施方案中,所述编码标签包含结合循环标签,识别特定的结合循环。在其它实施方案中,所述结合剂文库内的编码标签具有结合循环特异性间隔序列。在一些实施方案中,编码标签包含一个结合循环特异性间隔序列。例如,用于第一结合循环中的结合剂的编码标签包含“循环1”特异性间隔序列,用于第二结合循环的结合剂的编码标签包含“循环2”特异性间隔序列,等等达到“n”个结合循环。在进一步的实施方案中,用于第一结合循环的结合剂的编码标签包含“循环1”特异性间隔序列和“循环2”特异性间隔序列,用于第二结合循环的结合剂的编码标签包括“循环2”特异性间隔序列和“循环3“特异性间隔序列,等等至“n”结合循环。该实施方案可用于在结合循环完成后的非级联延伸记录标签的后续PCR组装参见图10。在一些实施方案中,间隔序列包含足够数量的碱基以与记录标签或延伸记录标签中的互补间隔序列退火以引发引物延伸反应或粘性末端连接反应。当一群记录标签与大分子相关联时,循环特异性间隔序列也可用于将编码标签的信息级联到单个记录标签上。第一个结合循环将信息从所述编码标签转移到随机选择的记录标签,随后的结合循环可以通过循环依赖的间隔序列仅引发所述延伸记录标签。更具体地,在第一结合循环中使用的结合剂的编码标签包括“循环1”特异性间隔序列和“循环2”特异性间隔序列,在第二结合循环中使用的结合剂的编码标签包括“循环2”特异性间隔序列和“循环3”特异性间隔序列,等等至“n”结合循环。来自第一结合循环的结合剂的编码标签能够通过互补循环1特异性间隔序列与记录标签退火。在将所述编码标签信息传送到所述记录标签时,所述循环2特异性间隔所述1结束时位于所述延伸记录标签的3'末端。来自第二结合循环的结合剂的编码标签能够通过互补的循环2特异性间隔序列与所述延伸记录标签退火。在将编码标签信息转移到延伸记录标签时,循环3特异性间隔序列在结合周期2结束时位于所述延伸记录标签的3'末端,依此类推走完“n”个结合循环。该实施方案规定,多个结合循环间的某个特定结合循环中的结合信息的转移将仅发生在已经经历先前结合循环的延伸的记录标签上。然而,有时结合剂将不能与同源大分子结合。在每个结合循环后包含结合循环特异性间隔子的寡核苷酸作为“追踪”步骤可用于保持所述结合循环同步,即使结合循环事件失败也是如此。例如,如果同源结合剂在结合循环1期间不能结合大分子,则在结合循环1之后用包含循环1特异性间隔子、循环2特异性间隔子和“无效”编码序列的寡核苷酸增加追踪步骤。所述“无效”编码器序列可以缺编码器序列,或者优选地,是肯定地识别“无效”结合循环的特异性条形码。所述“无效”寡核苷酸能够通过所述循环1特异性间隔子与所述记录标签退火,并且所述循环2特异性间隔子被转移至所述记录标签。因此,尽管结合循环1事件失败,来自结合循环2的结合剂仍然能够通过所述循环2特异性间隔子与所述延伸记录标签退火。所述“无效”寡核苷酸将结合循环1标记为延伸记录标签内的失败结合事件。在优选实施例中,结合循环特异性编码器序列用于编码标签。结合循环特定的编码器序列可以通过使用完全独特的分析物结合循环编码器条形码例如,NTAA或组合使用连接到循环特异性条形码见图35的分析物例如,NTAA编码器序列来实现。使用组合方法的优点是需要设计的总条形码更少。对于用于10个循环的一组20种分析物结合剂,仅需要设计20个分析物编码器序列条形码和10个结合循环特异性条形码。相反,如果所述结合循环直接嵌入所述结合剂编码器序列中,则可能需要设计总共200个独立的编码器条形码。将结合循环信息直接嵌入所述编码器序列中的优点在于,当在纳米孔读出上采用纠错条形码时,所述编码标签的总长度可以最小化。使用容错条形码允许使用更容易出错的测序平台和方法进行高度准确的条形码识别,但具有其他优点,例如快速分析、更低成本、和或更便携的仪器。一个这样的例子是基于纳米孔的测序读数。在一些实施方案中,在所述结合剂附近的第二3'间隔序列内编码标签包含可切割或可缺刻的DNA链参见图32。例如,所述3'间隔子可具有一个或多个尿嘧啶碱基,其可被尿嘧啶特异性切除试剂USER切刻。USER在所述尿嘧啶的位置产生单核苷酸间隙。在另一个实例中,所述3'间隔子可包含对切刻核酸内切酶的识别序列,其仅水解双链体的一条链。优选地,用于切割或切刻所述3'间隔序列的酶仅作用于一条DNA链所述编码标签的3'间隔子,使得属于所述延伸的记录标签的双链体内的另一条链保持完整。这些实施方案在对天然构象蛋白质的分析中特别有用,因为它允许在引物延伸发生后从所延伸的记录标签中非变性去除所述结合剂,并在可用于后续结合循环的所述延伸记录标签上留下单链DNA间隔序列。所述编码标签也可以设计成包含回文序列。将回文序列包含在编码标签中允许新生的、生长的、延伸的记录标签在编码标签信息转移时折叠自己。所述延伸记录标签折叠成更紧凑的结构,有效地减少了不希望的分子间结合和引物延伸事件。在一些实施方案中,编码标签包含分析物特异性间隔子,其能够仅在用先前识别相同分析物的结合剂延伸的记录标签上引发延伸。可以使用包括分析物特异性间隔子和编码器序列的编码标签从一系列结合事件建立延伸记录标签。在一个实施方案中,第一结合事件使用具有编码标签的结合剂,所述编码标签包含用于下一个结合循环的通用3’间隔引物序列和5’末端的分析物特异性间隔序列;随后的结合循环接着使用具有编码的分析物特异性3’间隔序列的结合剂。该设计导致仅从正确的一系列同源结合事件创建可扩增的文库元件。脱靶和交叉反应的结合相互作用将导致不可扩增的延伸记录标签。在一个实例中,在两个结合循环中使用特定大分子分析物的一对同源结合剂以鉴定所述分析物。第一种所述同源结合剂含有编码标签,该编码标签包含用于在所述记录标签的通用间隔序列上引发延伸的通用间隔子3’序列,以及在5'末端的编码的分析物特异性间隔子,他们将用在下一结合循环中。对于匹配的同源结合剂对,所述第二结合剂的3’分析物特异性间隔子与所述第一结合剂的5’分析物特异性间隔子匹配。以这种方式,只有所述结合剂的同源对的正确结合才会产生可扩增的延伸记录标签。交叉反应性结合剂将不能在所述记录标签上引发延伸,并且不产生可扩增的延伸记录标签产物。该方法极大地增强了本文所公开的方法的特异性。相同的原理可以应用于三联体结合剂组,其中使用3个循环的结合。在第一个结合循环中,所述记录标签上的通用3’Sp序列与结合剂编码标签上的通用间隔子相互作用。引物延伸将编码标签信息,包括分析物特异性5'间隔子,转移至所述记录标签。随后的结合循环采用结合剂编码标签上的分析物特异性间隔子。在某些实施方案中,编码标签可以进一步包含连接在编码标签的所述结合剂的独特分子标识符。所述结合剂的UMI可用于采用延伸编码标签或用于测序读数的di-tag分子实施方案中,其与编码器序列组合提供关于所述结合剂的身份和大分子的独特结合事件的数量的信息。在另一实施例中,编码标签包括随机化序列一组N',其中N=来自A,C,G,T的随机选项,或来自一组单词的随机选项。经过一系列“n”结合循环并将编码标签信息转移到所述延伸记录标签后,最终的延伸记录标签产品将由一系列这些随机序列组成,这些序列共同形成用于所述最终延伸记录标签的“复合”独特分子标识符UMI。例如,如果每个编码标签包含NN序列4*4=16个可能的序列,则在10个测序循环后,形成10个分布式2-mer的组合组,产生用于延伸记录标签产品的总共1610~1012个多样性可能的复合UMI序列。鉴于肽测序实验使用~109个分子,这种多样性足以为测序实验创建一组有效的UMI。通过简单地在所述编码标签内使用较长的随机区域NNN,NNNN等,可以实现更多多样性。编码标签可包括在3’间隔序列的3'末端并入的终止子核苷酸。在结合剂与大分子结合并且其相应的编码标签和记录标签通过互补的间隔序列退火后,引物延伸可以将信息从所述编码标签转移到所述记录标签,或者将信息从所述记录标签转移到所述编码标签。在编码标签的3’末端添加终止子核苷酸可防止记录标签信息传递所述编码标签。应当理解,对于本文所述涉及生成延伸编码标签的实施方案,优选在所述记录标签的3'末端包括终止子核苷酸,以防止编码标签信息转移到所述记录标签。编码标签可以是单链分子,双链分子或部分双链。编码标签可包括平末端、悬挂末端或一样一个。在一些实施方案中,编码标签是部分双链的,其防止所述编码标签与延长的延伸记录标签中的内部编码器和间隔序列退火。编码标签通过本领域已知的任何方式,包括共价和非共价相互作用,直接或间接地与结合剂连接。在一些实施方案中,编码标签可以酶促或化学方式与结合剂连接。在一些实施方案中,编码标签可以通过连接与结合剂结合。在其他实施方案中,编码标签通过亲和结合对例如,生物素和链霉亲和素与结合剂连接。在一些实施方案中,通过SpyCatcher-SpyTag相互作用将结合剂连接至编码标签参见图43B。所述SpyTag肽通过自发的异肽连接与SpyCatcher蛋白形成不可逆的共价键,从而提供遗传编码方式以产生抵抗力和苛刻条件的肽相互作用Zakerietal.,2012,Proc.Natl.Acad.Sci.109:E690-697;Lietal.,2014,J.Mol.Biol.426:309-317。结合剂可以表达为包含所述SpyCatcher蛋白的融合蛋白。在一些实施方案中,所述SpyCatcher蛋白附加在所述结合剂的N-末端或C-末端。可以使用标准缀合化学法BioconjugateTechniques,G.T.Hermanson,AcademicPress2013将所述SpyTag肽偶联至所述编码标签。在其他实施方案中,通过SnoopTag-SnoopCatcher肽-蛋白质相互作用将结合剂连接至编码标签。所述SnoopTag肽与SnoopCatcher蛋白形成异肽键Veggianietal.,Proc.Natl.Acad.Sci.USA,2016,113:1202-1207。结合剂可以表达为包含SnoopCatcher蛋白的融合蛋白。在一些实施方案中,所述SnoopCatcher蛋白附加在所述结合剂的N-末端或C-末端。可以使用标准缀合化学将所述SnoopTag肽偶联至所述编码标签。在其它实施方案中,结合剂通过所述蛋白质融合标签及其化学配体结合到编码标签。HaloTag是改性的卤代烷脱卤素酶,其被设计来与合成配体HaloTag配体共价结合Losetal.,2008,ACSChem.Biol.3:373-382。所述合成配体包含附着到各种有用分子的氯代烷烃接头。在HaloTag和高度特异性的所述氯代烷烃接头之间形成共价键,是在生理条件下快速发生,并且基本上是不可逆的。在某些实施方案中,还使大分子与非同源结合剂接触。如本文所用,非同源结合剂是指对不同的大分子特征或组分,而不是对所考虑的特定大分子具有选择性的结合剂。例如,如果所述nNTAA是苯丙氨酸,并且所述肽与分别对苯丙氨酸、酪氨酸和天冬酰胺具有选择性的三种结合剂接触,则对苯丙氨酸具有选择性的结合剂将是能够选择性结合第nNTAA即,苯丙氨酸的第一结合剂,而另外两种结合剂是所述肽的非同源结合剂因为它们对苯丙氨酸以外的NTAA具有选择性。然而,酪氨酸和天冬酰胺结合剂可以是样品中其它肽的同源结合剂。然后如果所述nNTAA苯丙氨酸从所述肽上裂解,从而将肽的n-1氨基酸转化为n-1NTAA例如酪氨酸,然后使所述肽与相同的三种结合剂接触,对酪氨酸具有选择性的结合剂是能够选择性结合所述n-1NTAA即酪氨酸的第二种结合剂,而另外两种结合剂是非同源结合剂因为它们对酪氨酸以外的NTAAs具有选择性。因此,应该理解,试剂是结合剂还是非同源结合剂取决于目前用于结合的特定大分子特征或组分的性质。并且,如果在多路复用反应中分析多个大分子,则一种大分子的结合剂可以是另一种大分子的非同源结合剂,反之亦然。因此,应该理解,以下关于结合剂的描述适用于本文所述的任何类型的结合剂即,同源和非同源结合剂。VIII.编码标签信息到记录标签的循环传递在本文所述的方法中,在结合剂与大分子结合时,其连接的编码标签的识别信息被传递到与所述大分子相关的记录标签,从而产生“延伸记录标签”。所述延伸记录标签可以包含来自结合剂的编码标签的信息,该编码标签代表执行的每个结合循环。然而,延伸记录标签也可能“错过”结合循环,例如,因为结合剂不能与大分子结合,因为所述编码标签缺失、损坏或有缺陷,因为引物延伸反应失败。即使发生结合事件,信息从编码标签到记录标签的传递也可能不完整或不是100%准确,例如,因为编码标签损坏或有缺陷,因为在所述引物延伸反应中引入了错误。因此,延伸记录标签可以代表其相关的大分子上发生的100%,或高达95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%的结合事件。此外,所述延伸记录标签中存在的所述编码标签信息可以与相应的编码标签至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%一致性。在某些实施方案中,延伸记录标签可以包含来自表示多个连续结合事件的多个编码标签的信息。在这些实施方案中,单个级联的延伸记录标签可以代表单个大分子参见图2A。如本文所提到的,将编码标签信息传递到记录标签,还包括传递到延伸记录标签,如在涉及多个连续结合事件的方法中所发生的那样。在某些实施方案中,结合事件信息以循环方式从编码标签传递到记录标签参见图2A和2C。通过要求至少两个不同的编码标签识别两个或更多独立结合事件映射到相同类别的结合剂与特定蛋白同源,可以在测序后根据信息滤除交叉反应性结合事件。所述记录标签中可以包含可选的样品或隔室条形码以及可选的UMI序列。所述编码标签还可以包含可选的UMI序列以及所述编码器和间隔子序列。延伸记录标签中也可以包含通用引物序列U1和U2,用于扩增和NGS测序参见图2A。可以使用各种方法将与特定结合剂相关的编码标签信息传递到记录标签。在某些实施方案中,编码标签的信息通过引物延伸传递到记录标签Chan,McGregoretal.2015。记录标签或延伸记录标签的3'-末端上的间隔子序列,与编码标签的3'末端上的互补间隔子序列退火,并且聚合酶例如,链置换聚合酶使用所述退火的编码标签作为模板延伸所述记录标签序列参见图5-7。在一些实施方案中,可以将与编码标签编码器序列和5'间隔子互补的寡核苷酸预先退火至所述编码标签,以防止所述编码标签与延伸记录标签中存在的内部编码器和间隔子序列杂交。所述编码标签上的3'末端间隔子保持单链,优选与所述记录标签上的3'末端间隔子结合。在其他实施方案中,新生的记录标签可以用单链结合蛋白包被,以防止所述编码标签退火到内部位点。或者,新生的记录标签也可以用RecA或相关的同源物,例如uvsX包被,以促进所述3'末端侵入到完全双链编码标签Belletal.,2012,Nature491:274-278。这种配置防止所述双链编码标签与内部记录标签元件相互作用,然而易受所述延伸记录标签被RecA包裹的3'尾部的链侵入Bell,etal.,2015,Elife4:e08646。单链结合蛋白的存在可促进链置换反应。在一个优选的实施方案中,用于引物延伸的DNA聚合酶具有链置换活性并且具有有限的或没有3'-5核酸外切酶活性。这些聚合酶的许多实例中,有几个包含Klenowexo-DNAPol1的Klenow片段、T4DNA聚合酶exo-、T7DNA聚合酶exoSequenase2.0、Pfuexo-、Ventexo-、DeepVentexo-、BstDNA聚合酶大片段exo-、BcaPol、9°NPol和Phi29Polexo-。在优选的实施方案中,所述DNA聚合酶在室温至45℃有活性。在另一个实施方案中,采用嗜热聚合酶的“热启动”形式,使得聚合酶被活化并在大约40℃-50℃之间使用。示例性的热启动聚合酶是Bst2.0WarmStartDNA聚合酶NewEnglandBiolabs。用于链置换复制的添加剂包括细菌、病毒或真核来源的许多单链DNA结合蛋白SSB蛋白中的任何一种:例如,大肠杆菌的SSB蛋白、噬菌体T4基因32产物、噬菌体T7基因2.5蛋白、噬菌体Pf3SSB、复制蛋白ARPA32和RPA14亚基Wold,1997;其他DNA结合蛋白,如腺病毒DNA结合蛋白、单纯疱疹蛋白ICP8、BMRF1聚合酶辅助亚基、疱疹病毒UL29SSB样蛋白;已知参与DNA复制的许多复合蛋白中的任何一种,如噬菌体T7解旋酶引物、噬菌体T4基因41解旋酶、大肠杆菌Rep解旋酶、大肠杆菌recBCD解旋酶、recA、大肠杆菌和真核拓扑异构酶.Champoux,2001。通过在引物延伸反应中包含单链结合蛋白T4基因32,大肠杆菌SSB等,DMSO1-10%,甲酰胺1-10%,BSA10-100μgml,TMAC11-5mM,硫酸铵10-50mM,甜菜碱1-3M,甘油5-40%,或乙二醇5-40%,错误引发或自引发事件例如当重新编码标签的末端间隔序列引发延伸自我延伸可以最小化。大多数A型聚合酶缺乏3'核酸外切酶活性内源性或工程化去除,例如Klenowexo-、T7DNA聚合酶exo-Sequenase2.0和Taq聚合酶催化非模板化添加核苷酸、优选腺苷碱基在较小程度上,G碱基,取决于序列背景至双链扩增产物的3'平端。对于Taq聚合酶,3’嘧啶CT使非模板化的腺苷添加最小化,而3’嘌呤核苷酸GA有利于非模板化的腺苷添加。在使用Taq聚合酶进行引物延伸的实施方案中,将胸苷碱基设置在编码标签中位于远离结合剂的间隔序列和相邻条形码序列例如,编码序列或循环特异性序列之间,以协调容纳在所述记录标签的间隔序列的3'末端上的偶发性非模板化腺苷酸图43A。以这种方式,延伸的记录标签具有或不具有非模板化的腺苷碱基可以与编码标签退火并进行引物延伸。或者,通过使用突变聚合酶嗜温或嗜热可以减少非模板碱基的添加,其中非模板化的末端转移酶活性已经被一个或多个点突变大大降低,尤其是在O-螺旋区域参见美国专利7,501,237Yang,Astatke等2002。Pfuexo-,其具有3'核酸外切酶缺陷并具有链置换能力,也不具有非模板化的末端转移酶活性。在另一个实施方案中,最佳聚合酶延伸缓冲液包含40-120mM缓冲剂,例如Tris-乙酸盐、Tris-HCl、HEPES等,pH为6-9。通过在记录延伸记录标签中包括伪互补碱基,可以最小化通过延伸记录标签的末端间隔序列与延伸记录标签的内部区域的自退火引发的自引发误引发事件Lahoud,Timoshchuk等.2008,Hoshika,Chen等.2010。由于存在化学修饰,假互补碱基显示出显著降低的彼此形成双链体的杂交亲和力。然而,许多假互补修饰碱基可以与天然DNA或RNA序列形成强碱基对。在某些实施方案中,编码标签间隔子序列包含多个A和T碱基,可以使用亚磷酰胺寡核苷酸合成将市售的假互补碱基2-氨基腺嘌呤和2-硫代胸腺嘧啶掺入记录标签中。通过向反应中添加假互补核苷酸,可以在引物延伸期间将额外的假互补碱基掺入延伸的记录标签中Gamper,Arar等.2006。为了使溶液中所述编码标签标记的结合剂与固定的蛋白的所述记录标签的非特异性相互作用最小化,将与记录标签间隔子序列互补的竞争性也称为阻断寡核苷酸添加至结合反应以最小化非特异性相互作用图32A-D。封闭寡核苷酸相对较短。在引物延伸之前从结合反应中洗去过量的竞争性寡核苷酸,这有效地使退火的竞争性寡核苷酸从所述记录标签解离,特别是当暴露于稍高的温度例如,30-50℃时。封闭寡核苷酸可在其3'末端包含终止子核苷酸以防止引物延伸。在某些实施方案中,所述记录标签上的间隔子序列与编码标签上的互补间隔子序列的退火,在引物延伸反应条件下是亚稳定的即,退火Tm类似于反应温度。这允许编码标签的间隔子序列置换退火至记录标签的间隔子序列的任何阻断寡核苷酸。与特定结合剂相关的编码标签信息也可以通过连接传递到记录标签参见如图6和7。连接可以是平末端连接或粘末端连接。连接可以是酶促连接反应。连接酶的实例包括但不限于T4DNA连接酶、T7DNA连接酶、T3DNA连接酶、TaqDNA连接酶、大肠杆菌DNA连接酶、9°NDNA连接酶、或者,连接可以是化学连接反应参见图7。在图示中,通过使用“记录助手”序列与所述编码标签上的臂的杂交来实现无间隔连接。使用标准化学连接或“点击化学”化学连接退火的补体序列Gunderson,Huangetal.1998,Peng,Lietal.2010,El-Sagheer,Cheongetal.2011,El-Sagheer,Sanzoneetal.2011,Sharma,Kentetal.2012,RoloffandSeitz2013,Litovchick,Clarketal.2014,Roloff,Fichtetal.2014。在另一个实施方案中,PNA的传递可以使用公开的技术通过化学连接完成。PNA的结构是具有5’N-末端胺基和非反应性3'-C-末端酰胺。PNA的化学连接需要将末端修饰为具有化学活性。这通常通过用半胱氨酰基部分衍生5'N-末端和用硫酯部分衍生3'-C-末端来完成。这种修饰的PNA容易使用标准的天然化学连接条件偶联Roloffetal.,2013,Bioorgan.Med.Chem.21:3458-3464。在一些实施方案中,可以使用拓扑异构酶传递编码标签信息。拓扑异构酶可用于将记录标签上的带顶部的3'磷酸连接到编码标签的5'末端或其互补物上Shumanetal.,1994,J.Biol.Chem.269:32678-32684。如本文所述,结合剂可以与翻译后修饰的氨基酸结合。因此,在涉及肽大分子的某些实施方案中,延伸的记录标签包含与氨基酸序列和翻译后修饰有关的编码标签信息。在一些实施方案中,在检测和切割末端氨基酸例如,NTAA或CTAA之前,完成对内部翻译后修饰例如,磷酸化、糖基化、琥珀酰化、泛素化、S-亚硝基化、甲基化、N-乙酰化、脂化等的氨基酸的检测。在一个实例中,使肽与用于PTM修饰的结合剂接触,并且如上所述将相关的编码标签信息传递至记录标签参见图8A。一旦完成了与氨基酸修饰相关的编码标签信息的检测和传递,就可以在使用N-末端或C-末端降解方法检测和传递所述初始氨基酸序列的编码标签信息之前去除PTM修饰基团。因此,产生的的延伸记录标签指示肽序列中存在翻译后修饰的存在以及初始氨基酸序列信息,虽然不是连续顺序参见图8B。在一些实施方案中,内部翻译后修饰的氨基酸的检测可以与初始氨基酸序列的检测同时发生。在一个实例中,NTAA或CTAA与翻译后修饰的氨基酸特异性结合剂接触,单独或作为结合剂文库的一部分例如,由20种标准氨基酸的结合剂组成的文库和选定的翻译后修饰氨基酸。随后是末端氨基酸切割和与结合剂或结合剂文库的接触的连续循环。因此,得到的延伸记录标签指示在初始氨基酸序列中的翻译后修饰的存在和顺序。在某些实施方案中,每个大分子可以采用一组记录标签,以提高编码标签信息传递的整体稳健性和效率参见如图9。使用与给定大分子相关的一组记录标签而不是单个记录标签,提高了文库构建效率,因为编码标签与记录标签的潜在偶联产量更高,文库总产量也更高。单个级联延伸记录标签的产量直接取决于级联的逐步产量,而使用能够接受编码标签信息的多个记录标签不会遭受别联的指数损失。在图9和10中示出了这种实施方案的一个实例。在图9A和10A中,多个记录标签与固体支持物上的单个大分子通过空间共定位到或单个大分子限制到在单个珠子相关联。结合剂以循环方式暴露于固体支持物,并且它们相应的编码标签在每个循环中将信息传递给共定位的多个记录标签中的一个记录标签。在图9A所示的例子中,结合周期信息被编码到编码标签上存在的间隔子中。对于每个结合循环,用指定的循环特异性间隔子序列标记该组结合剂图9A和9B。例如,在NTAA结合剂的情况下,相同氨基酸残基的结合剂用不同的编码标签标记,或在间隔子序列中包含循环特异性信息以表示结合剂特性和循环数。如图9A所示,在第一个结合循环循环1中,使多个NTAA结合剂与大分子接触。循环1中使用的结合剂,具有与记录标签的间隔子序列互补的共同间隔子序列。循环1中使用的结合剂还具有包含循环1特异性序列的3'-间隔子序列。在结合循环1期间,第一个NTAA结合剂结合大分子的游离末端,第一个编码标签中的共同间隔子序列的互补序列跟记录标签退火,第一个编码标签的信息通过来自共同间隔序列的引物延伸被传递到同源记录标签。在除去NTAA以暴露新的NTAA后,结合循环2接触多个NTAA结合剂具有与记录标签的间隔子序列互补的共同间隔子序列。循环2中使用的结合剂还具有包含循环2特异性序列的3'-间隔子序列。第二个NTAA结合剂与大分子的NTAA结合,第二个编码标签的信息通过引物延伸传递至记录标签。这些循环重复直至“n”个结合循环,产生多个与单个大分子共定位的延伸记录标签,其中每个延伸记录标签具有来自一个结合循环的编码标签信息。因为在每个连续结合循环中使用的每组结合剂在所述编码标签中具有循环特异性间隔子序列,所以结合循环信息可以与产生的延伸记录标签中的结合剂信息相关联。在一个替代实施方案中,多个记录标签与固体支持物例如,珠子上的单个大分子相关联,如图9A中所示,但是在这种情况下,在特定结合周期中使用的结合剂具有编码标签,其侧接一个用于当前的结合循环的循环特异性间隔子和一个用于下一结合循环的循环特异性间隔子。这种设计的原因是支持最终组装PCR步骤图10C以将延伸记录标签群转换成单个共线延伸记录标签。在测序之前,可以对单个共线延伸记录标签的文库进行富集、扣减和或标准化方法。在第一个结合循环循环1中,在第一个结合剂结合后,包含循环1特异性间隔子C’1的编码标签的信息被传递到包含互补的循环1特异性间隔子C1的记录标签上。在第二结合循环循环2中,在第二结合剂结合后,包含循环2特异性间隔子C’2的编码标签的信息被传递至末端包含互补的循环2特异性间隔子C2的不同记录标签。该过程持续到第n个结合循环。在一些实施方案中,延伸记录标签中的第n个编码标签用通用反向引发序列加盖,例如,通用反向引发序列可以作为第n个编码标签设计的一部分并入,或者将所述通用反向引发序列添加到第n个结合循环后的后续反应,比如使用加尾引物的扩增反应中。在一些实施方案中,在每个结合循环中,将大分子暴露于与编码标签连接的结合剂集合,所述编码标签包含关于其相应结合剂的识别信息和结合周期信息图9和图10。在一个具体实施方案中,在完成第n个结合循环后,将涂覆有延伸记录标签的珠子基质置于油乳液中,使得平均存在少于或约等于1个珠子液滴。然后使用组装PCR从珠子扩增所述延伸记录标签,并通过在单独的延伸记录标签内通过循环特异性间隔子序列引发来共线组装多个单独的记录标签图10CXiongetal.,2008,FEMSMicrobiol.Rev.32:522-540。或者,可以在每个结合循环期间或之后将循环特异性间隔子分别添加到延伸记录标签,而不使用具有结合剂编码标签的循环特异性间隔子。使用一组延伸记录标签,即一组延伸记录标签一起代表一个单独的大分子相比于单个级联延伸记录标签代表一个单独的大分子的一个优点是更高浓度的记录标签可以提高所述编码标签信息的传递效率。此外,结合循环可以重复几次以确保同源结合事件完成。此外,延伸记录标签的表面扩增可能会提供信息传递的冗余参见图4B。如果编码标签信息不是一直被传递,则在大多数情况下,仍然可以使用不完整的编码标签信息集合来识别具有非常高信息含量的大分子,例如蛋白。即使是短肽也可以包含大量可能的蛋白序列。例如,10-mer肽具有2010种可能的序列。因此,包含缺失和或模糊的部分或不完整序列仍然能够唯一地映射。在一些实施方案中,其中蛋白以其天然构象被检测,用含有编码标签的结合剂进行环状结合测定,所述编码标签在临近所述结合剂的间隔元件内包含可切割或可切刻的DNA链图32。例如,靠近结合剂的间隔子可具有一个或多个尿嘧啶碱基,其可被尿嘧啶特异性切除试剂USER切刻。在另一个实例中,靠近结合剂的间隔子可包含切割核酸内切酶的识别序列,其仅水解双链体的一条链。该设计允许从延伸记录标签中非变性地去除结合剂,并产生游离的单链DNA间隔元件,用于随后的免疫测定循环。在一个优选的实施方案中,将尿嘧啶碱基掺入编码标签中,以允许在引物延伸步骤后,酶促用户USER除去结合剂图32E-F。在用户切除尿嘧啶后,可以在各种温和条件下,包括高盐4MNaCl,25%甲酰胺和温和加热以破坏蛋白质结合剂相互作用。在记录标签上保持退火的另一个截短的编码标签DNA短柱图32F,在略微升高的温度下容易解离。在接近结合剂的间隔元件内,由可切割或可切刻的DNA链组成的编码标签,也允许单一同源测定,用于从多个结合的结合剂传递编码标签信息参见图33。在一个优选的实施方案中,接近结合剂的编码标签包含切口核酸内切酶序列基序,其在dsDNA的背景下以确定的序列基序被切口核酸内切酶识别和切口。在结合多种结合剂后,使用组合的聚合酶延伸缺乏链置换活性+切口核酸内切酶试剂混合物,来产生编码标签向近端记录标签或延伸记录标签的重复传递。在每个传递步骤后,得到的延伸记录标签-编码标签双链体被所述切口核酸内切酶切口,释放附着于所述结合剂的截短间隔子并暴露所述延伸记录标签3'间隔序列,其能够与其它近端结合的结合剂的编码标签退火图33B-D。设计编码标签间隔序列中切口基序的位置以产生亚稳态杂交体,其可以容易地与未切割的编码标签间隔序列交换。以这种方式,如果两种或更多种结合剂同时结合相同的蛋白分子,则通过将来自多个结合的结合剂的编码标签的级联将信息结合到记录标签发送,在单个反应混合物中发生,而没有任何循环试剂交换图33C-D。该实施方案特别适用于下一代蛋白测定NGPA,特别是采用多克隆抗体或混合单克隆抗体群到蛋白上的多价表位。对于涉及变性蛋白质、多肽和肽的分析的实施方案,可以在引物延伸后通过使用高度变性条件例如0.1-0.2NNaOH、6M尿素、2.4M异硫氰酸胍、95%甲酰胺等除去结合的结合剂和退火的编码标签。IX.记录标签信息到编码标签或Di-Tag构建体的循环转移在另一方面,不是在结合剂与大分子结合后将信息从所述编码标签写入所述记录标签,而是可以从包含任选的UMI序列例如鉴定特定肽或蛋白质分子和至少一个条形码例如,隔室标签、分区条形码,样本条形码、空间位置条形码等的记录标签将信息转移到所述编码标签,从而生成延伸编码标签参见图11A。在某些实施方案中,在每个结合循环后,并可选地在Edman降解化学步骤之前,收集所述结合剂和相关的延伸编码标签。在某些实施方案中,所述编码标签包含结合周期特异性标签。在完成所有结合循环后,例如在循环Edman降解中检测NTAA,可以扩增和测序延伸编码标签的完整集合,并且根据UMI肽身份、编码序列NTAA结合剂、隔室标签蛋白组的单个细胞或子集、结合循环特异性序列循环数或其任何组合之间的关联确定肽的信息。具有相同隔室标签UMI序列的文库元件映射回相同的细胞、蛋白组子集、分子等,并可以重建所述肽序列。如果所述Edman降解过程中所述记录标签承受太多损坏,该实施方案可能有用。本发明提供了分析多种大分子的方法,包括:a提供多个大分子和与固体支持物连接的相关记录标签;b使所述多个大分子与多个能够结合所述多个大分子的结合剂接触,其中每种结合剂包含具有关于所述结合剂的识别信息的编码标签;ci将与所述大分子相关的记录标签的信息传递到与所述大分子结合的所述结合剂的所述编码标签,以产生延伸编码标签见图11A;或ii将与大分子结合的结合剂的大分子相关的记录标签和编码标签的信息传递给di-tag构建体参见图11B;d收集所述延伸编码标签或di-tag构建体;e任选地重复步骤b–d进行一个或多个结合循环;f分析延伸编码标签或di-tag构建体的集合。在某些实施方案中,从所述记录标签到所述编码标签的信息传递可以使用引物延伸步骤完成,其中任选地封闭所述记录标签的3'末端以防止所述记录标签的引物延伸参见如图11A。在每个结合事件和信息传递完成之后,可以收集得到的延伸编码标签和相关结合剂。在图11B所示的示例中,所述记录标签包括通用引发位点U2’、条形码例如,隔室标签“CT”、可选的UMI序列和共同间隔序列Sp1。在某些实施方案中,所述条形码是代表单个隔室的隔室标签,UMI可用于将序列读数映射回被查询的特定蛋白或肽分子。如图11B中的所述实例所示,所述编码标签由共同间隔序列Sp2’、结合剂编码器序列和通用引发位点U3组成。在引入所述编码标签标记的结合剂之前,与所述记录标签的U2'通用引发位点互补并包含通用引发序列U1和循环特异性标签的寡核苷酸U2,与所述记录标签U2'退火。另外,衔接子序列Sp1'-Sp2与所述记录标签Sp1退火。该衔接子序列还能够与所述编码标签上的Sp2'序列相互作用,使所述记录标签和所述编码标签彼此接近。在结合事件之前或之后进行间隙填充延伸连接测定。如果在结合循环之前进行间隙填充,则使用结合后循环引物延伸步骤来完成di-tag的构建。在跨多个结合循环收集di-tag后,对di-tag的集合进行测序,并通过UMI序列映射回原始肽分子。应理解,为了最大化功效,所述UMI序列的多样性必须超过由UMI标记的单个分子数量的多样性。在某些实施方案中,所述大分子是蛋白或肽。可以通过从生物样品中片段化蛋白来获得所述肽。所述记录标签可以是DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子或其组合。所述记录标签包含识别与其相关的大分子例如肽的UMI。在某些实施方案中,所述记录标签还包含隔室标签。所述记录标签还可以包含通用引发位点,其可以用于下游扩增。在某些实施方案中,所述记录标签在其3'末端包含间隔子。间隔子可以与所述编码标签中的间隔子互补。可以封闭所述记录标签的3'-末端例如,光不稳定的3'封闭基团以防止聚合酶延伸所述记录标签,促进所述大分子相关记录标签的信息传递到所述编码标签或所述大分子相关记录标签和编码标签的信息传递到di-tag构建体。所述编码标签包含识别所述编码剂所连接的结合剂的编码器序列。在某些实施方案中,所述编码标签还包含与所述编码标签连接的每种结合剂的独特分子标识符UMI。所述编码标签还可以包含通用引发位点,其可以用于下游扩增。所述编码标签可在其3'末端包含间隔子。所述间隔子可以与所述记录标签中的间隔子互补,并可用于引发引物延伸反应以将所述记录标签信息转移到所述编码标签。所述编码标签还可以包含结合循环特异性序列,用于识别延伸编码标签或di-tag起源的结合循环。可以通过引物延伸或连接实现将所述记录标签的信息传递到所述编码标签。可以通过间隙填充反应、引物延伸反应或两者,产生所述记录标签和编码标签的信息至di-tag构建体的传递。Di-tag分子包含与延伸记录标签类似的功能组分。Di-tag分子可能包括衍生自所述记录标签的通用引发位点、衍生自所述记录标签的条形码例如,隔室标签、衍生自所述记录标签的可选独特分子标识符UMI、衍生自所述记录标签的可选间隔子、衍生自所述编码标签的编码序列、衍生自所述编码标签的可选独特分子标识符、结合循环特异性序列、衍生自所述编码标签的可选间隔子以及衍生自所述编码标签的通用引发位点。在某些实施例中,可以使用条形码编码字的组合级联来生成所述记录标签。组合编码词的使用提供了一种方法,通过该方法,退火和化学连接可用于将信息从PNA记录标签传递至编码标签或di-tag构建体参见如图12A-D。在分析本文公开的肽的方法涉及通过Edman降解切割末端氨基酸的某些实施方案中,可能需要使用对抗Edman降解的苛刻条件有抗性的记录标签,例如PNA。Edman降解方案中的一个苛刻步骤是无水TFA处理以切割N-末端氨基酸。该步骤通常会破坏DNA。与DNA相比,PNA对酸水解具有高度抗性。PNA的挑战是信息传递的酶促方法变得更加困难,即通过化学连接传递信息是优选模式。在图11B中,使用酶促间隙填充延伸连接步骤编写记录标签和编码标签信息,但是目前这对于PNA模板是不可行的,除非研发了使用PNA的聚合酶。由于需要化学连接,产物不易扩增,所以将条形码和UMI从PNA记录标签写入编码标签是有问题的。化学连接方法已在文献中广泛描述Gundersonetal.1998,GenomeRes.8:1142-1153;Pengetal.,2010,Eur.J.Org.Chem.4194-4197;El-Sagheeretal.,2011,Org.Biomol.Chem.9:232-235;El-Sagheeretal.,2011,Proc.Natl.Acad.Sci.USA108:11338-11343;Litovchicketal.,2014,Artif.DNAPNAXNA5:e27896;Roloffetal.,2014,MethodsMol.Biol.1050:131-141。为了创建组合PNA条形码和UMI序列,可以组合连接来自n-mer文库的一组PNA词。如果每个PNA字来自1,000个词的空间,则四个组合序列产生1,0004=1012个代码的编码空间。以这种方式,从一组起始的4,000个不同DNA模板序列中,可以产生超过1012个PNA代码图12A。通过调整级联字的数量或调整基本字的数量,可以生成更小或更大的编码空间。因此,使用DNA词组装杂交和化学连接,可以使用杂交的DNA序列完成信息到PNA记录标签的传递参见图12B。在所述PNA模板上组装DNA单词和化学连接所述DNA字后,所得到的中间体可用于将信息传递到所述编码标签从编码标签传递信息参见图12C和图12D。在某些实施方案中,大分子和相关的记录标签与固体支持物共价连接。固体支持物可以是珠子、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶片芯片、流通芯片、包括信号转导电子器件的生物芯片、微量滴定孔、ELISA板、旋转干涉测量盘、硝酸纤维素膜、硝化纤维素基聚合物表面、纳米颗粒或微球。固体支持物可以是聚苯乙烯珠子、聚合物珠子、琼脂糖珠子、丙烯酰胺珠子、固体核心珠子、多孔珠子、顺磁珠子、玻璃珠子或可控孔珠子。在某些实施方案中,结合剂是蛋白质或多肽。在一些实施方案中,结合剂是修饰的或变体的氨肽酶、修饰的或变体的氨酰基tRNA合成酶、修饰的或变体的anticalin、修饰的或变体的ClpS或者修饰的或变体的抗体或其结合片段。在某些实施方案中,结合剂结合肽的单个氨基酸残基、二肽、三肽或翻译后修饰。在一些实施方案中,结合剂结合N-末端氨基酸残基,C-末端氨基酸残基或内部氨基酸残基。在一些实施方案中,结合剂结合N-末端肽、C-末端肽或内部肽。在一些实施方案中,结合剂是肽的翻译后修饰的氨基酸的位点特异性共价标记。在某些实施方案中,在步骤b中使多个大分子与多种结合剂接触后,将包含大分子和相关结合剂的复合物从固体支持物上解离,并分配成液滴或微流体液滴的乳液。在一些实施方案中,每个微流体液滴包含至多一个包含大分子和结合剂的复合物。在某些实施方案中,在产生延伸编码标签或di-tag构建体之前扩增记录标签。在包含大分子和相关结合剂的复合物被分成液滴或微流体液滴使得每个液滴至多有一个复合物的实施方案中,记录标签的扩增提供额外的记录标签作为将信息传递到编码标签或di-tag构建体的模板见图13和图14。乳液融合PCR可用于将记录标签信息传递至编码标签或产生di-tag构建体群。可在分析之前,扩增产生的延伸编码标签或di-tag构建体的集合。对延伸编码标签或di-tag构建体的收集的分析,可能包含核酸测序方法。通过合成测序、通过连接测序、通过杂交测序、通过polony测序、离子半导体测序或焦磷酸测序进行测序核酸测序方法可以是单分子实时测序、基于纳米孔的测序或使用高级显微镜的DNA直接成像。Edman降解和化学标记N-末端胺的方法如PITC、Sanger剂DNFB、SNFB、乙酰化试剂、脒化胍基试剂等,也可以修饰标准核酸或上的内部氨基酸和环外胺或PNA碱基,如腺嘌呤、鸟嘌呤和胞嘧啶。在某些实施方案中,在测序之前,用酸酐、guandination剂或类似的封闭试剂封闭肽的赖氨酸残基的-胺。尽管DNA碱基的环外胺对肽的主要N-末端胺的反应性低得多,但控制胺反应性试剂对N-末端胺的反应性降低了对DNA碱基上的内部氨基酸和环外胺的非靶活性,这对于测序分析很重要。修饰反应的选择性可以通过调节反应条件来调节,例如pH、溶剂水溶液与有机物、非质子、非极性、极性非质子、离子液体等、碱和催化剂、共溶剂、温度和时间。此外,环核胺在DNA碱基上的反应性受DNA是否为ssDNA或dsDNA形式的调节。为了最小化修饰,在NTAA化学修饰之前,记录标签可以与互补DNA探针P1’、{SampleBCs}’、{Sp-BC}’等杂交。在另一个实施方案中,也可以使用具有受保护的环外胺的核酸Ohkubo,Kasuyaetal.2008。在另一个实施方案中,“反应性较低”的胺标记化合物,例如SNFB,会减轻DNA上的内部氨基酸和外环胺的脱靶标记CartyandHirs1968。由于所述对磺酰基从对硝基吸走电子,导致SNFB的氟取代活性低于DNFB,所以SNFB的反应性低于DNFB。通过仔细选择化学和反应条件浓度、温度、时间、pH、溶剂类型等,可以滴定偶联条件和偶联试剂,以优化NTAA-胺修饰并最大限度地减少脱靶氨基酸修饰或DNA修饰。例如,已知DNFB在非质子溶剂如乙腈中比在水中更容易与仲胺反应。环外胺的温和修饰仍可允许互补探针与序列杂交,但可能破坏基于聚合酶的引物延伸。还可能保护外酯胺的同时仍然允许氢键结合。这在最近的出版物中有所描述,其中受保护的碱基仍然能够与感兴趣的靶标杂交Ohkubo,Kasuyaetal.2008。在一个实施方案中,工程化聚合酶用于在所述延伸记录标签期间将核苷酸和受保护碱基并入到DNA编码标签模板上。在另一个实施方案中,工程化聚合酶用于在编码标签的延伸期间将PNA模板w或wo受保护碱基上的核苷酸并入PNA记录标签模板。在另一个实施方案中,通过将外源寡核苷酸与PNA记录标签退火,可以将信息从记录标签传递到编码标签。通过选择序列空间不同的UMI可以促进杂交的特异性,例如基于n-mer词组装的设计Gerry,Witowskietal.1999。虽然可以使用类似Edman的N-末端肽降解测序来确定肽的线性氨基酸序列,但可以使用替代实施方案利用延伸记录标签、延伸编码标签和di-tag方法对肽进行部分组成分析。结合剂或化学标记可用于标记肽上的N-末端和内部氨基酸或氨基酸修饰。化学试剂可以以位点特异性方式共价修饰氨基酸例如标记SlettenandBertozzi2009,Basle,Joubertetal.2010SpicerandDavis2014。编码标签可以附着到靶向单个氨基酸的化学标记试剂上,以促进编码和随后位点特异性标记的氨基酸的识别参见图13。肽组成分析不要求循环降解所述肽,因此避免了将含有标签的DNA暴露于苛刻的Edman化学的问题。在循环结合模式中,还可以使用延伸编码标签或di-tag来提供组成信息氨基酸或二肽三肽信息、PTM信息和初始氨基酸序列。在一个实施例中,可以使用本文描述的延伸编码标签或di-tag方法来读出该组成信息。如果与UMI和隔室标签信息结合,延伸编码标签或di-tag的集合提供关于肽及其起源隔室蛋白或起源蛋白的组成信息。延伸编码标签或di-tag的集合映射回相同的隔室标签并且表面上来源于蛋白分子,是利用部分组成信息来映射肽的有力工具。隔室标记肽的集合不是映射回整个蛋白组,而是映射回蛋白分子的有限子集,大大增加了映射的独特性。本文使用的结合剂可识别单个氨基酸、二肽、三肽或甚至更长的肽序列基序。Tessler2011,DigitalProteinAnalysis:TechnologiesforProteinDiagnosticsandProteomicsthroughSingleMoleculeDetection.Ph.D.,WashingtonUniversityinSt.Louis证明,可以带电二肽表位子集生成相对选择性的二肽抗体Tessler2011。将定向进化应用于替代蛋白支架例如,aaRS、anticalin、ClpS等,适体可用于延伸一组二肽三肽结合剂。来自二肽三肽组成分析的信息与映射回单个蛋白分子的信息,可足以唯一地识别和定量每个蛋白分子。最多,总共有400种可能的二肽组合。然而,最频繁和最具抗原性带电荷、亲水性、疏水性二肽的子集应该足以产生结合剂。该数字可以构成一组40-100种不同的结合剂。对于一组40种不同的结合剂,平均10-mer肽有约80%被至少一种结合剂结合的机会。将该信息与衍生自相同蛋白分子的所有肽组合,可以允许识别蛋白分子。关于肽及其起源蛋白的所有这些信息可以组合起来,提供更准确和精确的蛋白序列表征。最近提出了一种使用部分肽序列信息的数字蛋白表征测定法Swaminathanetal.,2015,PLoSComput.Biol.11:e1004080Yao,Docteretal.2015。即,该方法采用氨基酸的荧光标记,其易于使用标准化学标记,例如半胱氨酸、赖氨酸、精氨酸、酪氨酸、天冬氨酸谷氨酸Basle,Joubertetal.2010。部分肽序列信息的挑战是映射回蛋白组的映射是一对多的关联,无法标识独特蛋白。这种一对多的映射问题可以通过将整个蛋白组空间减少到肽被映射回的蛋白分子的有限子集来解决。实质上,单个部分肽序列可以映射回100或1000个不同的蛋白序列,但是如果已知一组几个肽例如,来自单个蛋白分子消化物的10个肽全部映射回隔室内蛋白分子子集中的单个蛋白分子,则更容易推断出蛋白质分子的身份。例如,来自相同分子的所有肽的肽蛋白质组图谱的交叉点,极大地限制了可能的蛋白身份集参见图15。特别地,通过创造性地使用隔室标签和UMI,显著增强了部分肽序列或组合物的可映射性。即,所述蛋白组最初被分隔到条形码化的隔室,其中所述隔室条形码也附着于UMI序列。所述隔室条形码是所述隔室独有的序列,所述UMI是所述隔室内每个条形码分子独有的序列参见图16。在一个实施方案中,使用类似于PCT公开WO2016061517通过引用全文并入中公开的方法完成该分区,即通过杂交到附着于所述珠子的DNA隔室条形码杂交,使DNA标签标记的多肽与珠子表面直接相互作用见图31。引物延伸步骤将信息从珠子连接的隔室条形码传递到多肽上的DNA标签图20。在另一个实施方案中,通过将含有UMI的条形码珠子和蛋白分子共包封成乳液液滴来完成这种分区。此外,所述液滴可选地含有将蛋白消化成肽的蛋白酶。许多蛋白酶可用于消化所述报告标记的多肽Switzar,Gieraetal.2013。酶促连接酶例如butelaseI与蛋白酶的共包封可能需要对所述酶进行修饰,例如聚乙二醇化,以使其对蛋白酶消化具有抗性FrokjaerandOtzen2005,Kang,Wangetal.2010。消化后,所述肽会连接到所述条形码-UMI标签上。在优选实施方案中,所述条形码-UMI标签保留在珠子上以促进下游生物化学操作参见图13。在条形码-UMI与所述肽连接后,破坏乳液并收获珠子。所述条形码化的肽可以通过它们的初始氨基酸序列或它们的氨基酸组成来表征。所述肽的两种类型的信息都可用于将其映射回所述蛋白组的子集。通常,序列信息映射回所述蛋白组的更小子集而不是组成信息。尽管如此,通过将来自多个肽序列或组合物的信息与相同的隔室条形码组合,可以唯一地识别所述蛋白或所述肽的来源蛋白。以这种方式,可以表征和定量所述整个蛋白组。所述肽的初始序列信息可以通过进行肽测序反应来获得,其中延伸记录标签产生代表肽序列的DNA编码文库DEL。在优选实施例中,记录标签包含隔室条形码和UMI序列。该信息与从编码标签传递的初级或PTM氨基酸信息一起使用,以产生最终的映射肽信息。肽序列信息的替代方案是产生与隔室条形码和UMI连接的肽氨基酸或二肽三肽组成信息。这是通过对具有UMI条形码肽的珠子进行氨基酸标记步骤来实现的,其中每个肽上的选出氨基酸内部用包含氨基酸编码信息的DNA标签和另一个氨基酸UMI进行位点特异性标记AAUMI见图13。最易于化学标记的氨基酸AAs是赖氨酸、精氨酸、半胱氨酸、酪氨酸、色氨酸和天冬氨酸谷氨酸,但为其他AA开发标记方案也是可行的MendozaandVachet,2009。给定的肽可包含几种相同类型的AA。可以通过所属附着的AAUMI标记区分相同类型的多个氨基酸的存在。每个标记分子在所述DNA标签内都有不同的UMI,使得能够计数氨基酸。化学标记的替代方案是用结合剂“标记”所述AA。例如,可以使用用包含AA和AAUMI的编码信息的编码标签标记的酪氨酸特异性抗体标记所述肽的所有酪氨酸。使用这种方法的警告是大体积抗体遇到的空间位阻,理想情况下较小的scFv,anticalins或ClpS变体将用于此目的。在一个实施方案中,在标记AA之后,通过区室化所述肽复合物使得每个液滴含有单个肽并进行乳液融合PCR以构建一组表征所述区室化的肽的氨基酸组成的延伸编码标签或di-tags,信息在记录标签和与肽上结合或共价偶联的结合剂相关的多个编码标签之间转移。对所述di-tags进行测序后,可以将具有相同条形码的肽的信息映射回单个蛋白质分子。在一个具体实施方案中,所述标记的肽复合物与所述珠子解离参见图13,分区成小迷你隔室例如,微乳液,使得给定的隔室内平均仅有一种标记的结合的结合剂肽复合物。在一个具体实施方案中,通过产生微乳液液滴来实现这种区室化Shim,Ranasinghe等人,2013,Shembekar,Chaipan等人,2016。除所述肽复合物外,PCR试剂与三种引物U1,Sp和U2tr也一起共同包封在所述液滴中。在液滴形成后,在较高的退火温度下进行几个循环的乳液PCR约5-10个循环,例如仅使U1和Sp退火并扩增所述记录标签产物参见图13。在最初的5-10个PCR循环之后,降低所述退火温度,使得U2tr和所述氨基酸编码标签上的Sptr参与扩增,并进行另外~10轮。所述三引物乳液PCR有效地将所述肽UMI条形码与所有所述AA编码标签组合,产生代表所述肽及其氨基酸组成的di-tag库。也可以进行所述三引物PCR和所述标签级联的其他方式。另一个实施方案是使用通过光解封闭活化的3'封闭的U2引物,或添加油溶性还原剂以启动不稳定封闭的3'核苷酸的3'解封闭。后乳液PCR,可以使用通用引物进行另一轮PCR以格式化用于NGS测序的所述库元件。以这种方式,所述库元件的不同序列组件用于计数和分类目的。对于给定的肽由隔室条形码-UMI组合标识,存在许多库元件,每个库元件具有识别AA编码标签和AAUMI参见图13。所述AA代编码和相关的UMI用于计算给定肽中给定氨基酸类型的出现。因此,所肽可能是GluC,LysC或EndoAsnN消化物的特征在于其氨基酸组成例如,2个Cys,1个Lys,1个Arg,2个Tyr等,而与空间次序无关。尽管如此,这提供了足够的特征以将肽映射到所述蛋白质组的子集,并且当与衍生自相同蛋白质分子的其他肽组合使用时,唯一地识别和定量所述蛋白质。X.末端氨基酸TAA标记方法在某些实施方案中,在本文所述的方法中,使肽与结合剂接触之前修饰或标记所述肽的末端氨基酸例如,NTAA或CTAA。在一些实施方案中,所述NTAA与异硫氰酸苯酯PITC反应以产生苯基硫代氨基甲酰基PTC-NTAA衍生物。Edman降解通常使用苯基异硫氰酸酯PITC来标记所述N-末端。PITC具有两种非常适合于本公开的方法的性质:1PITC高效地标记所述N-末端胺基;2所得PTC衍生的NTAA在酸处理时经历自身异构化,导致剩余肽中的氨基酸裂解。可用于标记所述NTAA的其它试剂包括:4-磺基苯基异硫氰酸酯、3-吡啶基异硫氰酸酯PYITC、2-哌啶子基乙基异硫氰酸酯PEITC、3-4-吗啉代丙基异硫氰酸酯MPITC、3-二乙氨基异硫氰酸丙酯DEPTICWangetal.,2009,AnalChem81:1893-1900、1-氟-2,4-二硝基苯Sanger试剂,DNFB、丹磺酰氯DNS-Cl或1-二甲基氨基萘-5-磺酰氯、4-磺酰基-2-硝基氟苯SNFB、乙酰化试剂、脒化胍基试剂,2-羧基-4,6-二硝基氯苯、7-甲氧基香豆素乙酸,硫代酰化试剂、硫代乙酰化试剂和硫代苄基化试剂。如果所述NTAA被封闭而无法标记,则有许多方法可以解封所述末端,例如用酰基肽水解酶APH去除N-乙酰基封闭Farries,Harrisetal.,1991,Eur.J.Biochem.196:679-685。解封肽N-末端的方法是本领域已知的参阅例如see,e.g.,Krishnaetal.,1991,Anal.Biochem.199:45-50;Leoneetal.,2011,Curr.Protoc.ProteinSci.,Chapter11:Unit11.7;Fowleretal.,2001,Curr.Protoc.ProteinSci.,Chapter11:Unit11.7,其中每篇都通过引用整体并入本文。丹磺酰氯与肽的游离胺基反应,得到所述NTAA的丹酰基衍生物。DNFB和SNFB与肽的-胺基反应分别产生DNP-NTAA和SNP-NTAA。另外,DNFB和SNFB也都与赖氨酸残基的-胺反应。DNFB还与酪氨酸和组氨酸氨基酸残基反应。SNFB比DNFB对胺基具有更好的的选择性,并且优选用于NTAA修饰Carty和Hirs1968。在某些实施方案中,在多肽蛋白酶消化成肽之前,赖氨酸-胺用有机酸酐预封闭。另一种有用的NTAA修饰剂是乙酰基,因为存在已知的酶以去除乙酰化的NTAA,即酰基肽水解酶APH,其切割所述N-末端乙酰化氨基酸,有效地以单个氨基酸缩短所述肽{Chang,2015#373;Friedmann,2013#374}。所述NTAA可用乙酸酐进行化学乙酰化或用N-末端乙酰转移酶NAT酶促乙酰化{Chang,2015#373;Friedmann,2013#374}。另一种有用的NTAA改性剂是脒基胍基部分,因为已证实的酰胺化NTAA的裂解化学在文献中是已知的,即N-末端酰胺化肽与0.5-2%NaOH的温和温育导致所述N-末端氨基酸的裂解{Hamada,2016#383}。这有效地提供了温和的Edman样化学N-末端降解肽测序过程。此外,某些脒化胍基试剂和下游NaOH裂解与DNA编码十分兼容。NTAA上DNPSNP、乙酰基或脒基胍基基团的存在可以提供与工程化结合剂相互作用的更好操作。存在许多具有低nM亲和力的商业DNP抗体。标记NTAA的其它方法包括用trypigaseLiebscheretal.,2014,AngewChemIntEdEngl53:3024-3028和氨基酰基转移酶Wagner,etal.,2011,JAmChemSoc133:15139-15147标记。在离子液体存在下,异硫氰酸酯已显示出对伯胺的增强的反应性。离子液体是有机化学反应中的优异溶剂并且用作催化剂,并且可以增强异硫氰酸酯与胺反应以形成硫脲。一个例子是使用离子液体1-丁基-3-甲基咪唑四氟硼酸盐[Bmim][BF4]通过异硫氰酸苯酯PITC快速有效地标记芳香族和脂肪胺Le,Chenetal.2005。Edman降解涉及所述异硫氰酸酯如PITC与肽的氨基N-末端的反应。因此,在一个实施方案中,离子液体通过提供更温和的标记和降解条件用于改善所述Edman降解过程的效率。例如,在25℃下,在离子液体[Bmim][BF4]中使用5%vol.vol.PITC10分钟。比在标准EdmanPITC衍生化条件下标记更有效,标准条件是在55℃,在含有吡啶、乙醇和ddH2O1:1:1vol.vol.vol.的溶液中使用5%vol.vol.PITCC60分钟Wang,Fangetal.2009。在优选的实施方案中,在片段化成肽之前,内部赖氨酸、酪氨酸、组氨酸和半胱氨酸氨基酸在所述多肽内被封闭。这样,在所述肽测序反应期间,只有所述NTAA的所述肽-胺基易于修饰。当使用DNFBSanger'试剂和丹磺酰氯时,这尤其重要。在某些实施方案中,所述NTAA在NTAA标记步骤特别是蛋白的原始N-末端之前已被封闭。如果是这样,有许多方法可以解除N末端的封闭,例如用酰基肽水解酶APH去除N-乙酰基封闭Farries,Harrisetal.1991。许多其它解封所述肽N-末端的方法是本领域已知的参阅,例如,Krishnaetal.,1991,Anal.Biochem.199:45-50;Leoneetal.,2011,Curr.Protoc.ProteinSci.,Chapter11:Unit11.7;Fowleretal.,2001,Curr.Protoc.ProteinSci.,Chapter11:Unit11.7,其各自通过引用整体并入本文。所述CTAA可以用许多不同的羧基反应试剂进行修饰。在另一个实例中,用混合酸酐和异硫氰酸酯修饰所述CTAA以产生硫代乙内酰脲LiuandLiang2001andU.S.PatentNo.5,049,507。所述硫代乙内酰脲修饰的肽可以在升高的温度下在碱中裂解以暴露倒数第二个CTAA,有效地产生基于C末端的肽降解测序方法Liu和Liang2001。可以对CTAA进行的其他修饰包括添加对硝基苯胺基团和添加7-氨基-4-甲基香豆酰基。XI.末端氨基酸裂解方法在涉及分析肽的某些实施方案中,在通过结合剂的末端氨基酸N-末端或C-末端结合和编码标签信息转移至记录标签、将记录标签信息转移至编码标签、标签信息和编码标签信息转移到di-tag构建体中之后,从所述肽中除去或切割所述末端氨基酸以暴露新的末端氨基酸。在一些实施方案中,所述末端氨基酸是NTAA。在其它实施方案中,所述末端氨基酸是CTAA。末端氨基酸的切割可以通过许多已知技术完成,包括化学切割和酶促切割。化学切割的一个例子是Edman降解。在Edman降解肽期间,所述nNTAA在温和的碱性条件下与异硫氰酸苯酯PITC反应,形成所述苯基硫代氨基甲酰基-NTAA衍生物。接下来,在酸性条件下,所述苯基硫代氨基甲酰基-NTAA衍生物被切割,产生游离的噻唑啉酮衍生物,从而将肽的所述n-1氨基酸转化为N-末端氨基酸n-1NTAA。此过程中的步骤如下所示:如上所述,典型的Edman降解需要在长的温育时间内施加苛刻的高温化学条件例如,无水TFA。这些条件通常与编码大分子的核酸不兼容。为了将化学Edman降解转化为核酸编码友好的方法,苛刻的化学步骤被温和的化学降解或有效的酶促步骤取代。在一个实施方案中,化学Edman降解可以使用比原始描述的更温和的条件。Edman降解的几种较温和的裂解条件已在文献中描述,包括用乙腈中的三乙胺乙酸酯代替无水TFA参阅,例如:Barrett,1985,TetrahedronLett.26:4375-4378,其全部内容通过引用并入。所述NTAA的切割也可以使用硫酰化降解来完成,与Edman降解相比,其使用较温和的切割条件见美国专利4,863,870。在另一个实施方案中,无水TFA的切割可以用“Edmanase”代替,其是一种工程酶,其通过硫脲硫原子对在温和条件下易断键的羰基的亲核攻击来催化去除所述PITC衍生的N-末端氨基酸参阅,U.S.PatentPublicationUS20140273004,通过引用整体并入本文。Edmanase是通过修饰cruzain,来自Trypanosomacruzi的半胱氨酸蛋白酶Borgo,2014,来制备。C25G突变除去催化半胱氨酸残基,同时选择三个突变G65S、A138C、L160Y以与Edman试剂PITC的苯基基团产生空间配合。NTAA的酶促切割也可以通过氨肽酶完成。氨肽酶以单体和多聚体酶天然存在,并且可以是金属或ATP依赖性的。天然氨肽酶具有非常有限的特异性,并且以逐步方式一个接一个地切割N-末端氨基酸。对于本文所述的方法,氨肽酶可以被工程改造为具有对仅当被N末端标签修饰时的所述NTAA的特异性结合或催化活性。例如,氨基肽酶可以被工程改造,以使其仅切割例如DNPSNP、PTC、丹磺酰氯、乙酰基、脒基等基团修饰的N-末端氨基酸。以这种方式,氨肽酶一次仅从N末端切割单个氨基酸,并允许控制所述降解循环。在一些实施方案中,所述修饰的氨肽酶对氨基酸残基身份是非选择性的,同时对所述N-末端标签具有选择性。在其他实施方案中,所述修饰的氨肽酶对氨基酸残基身份和N-末端标签二者都具有选择性。Borgo和Havranek说明了修饰酶促NTAA降解的特异性的模型的实例,其中通过结构-功能辅助设计,将蛋氨酸氨肽酶转化为亮氨酸氨肽酶Borgo和Havranek2014。可以采用类似的方法用改良的NTAA,例如DNPSNP修饰的NTAA,其中氨基肽酶被工程化使用基于结构-功能的设计和定向进化仅切割存在DNPSNP基团的N-末端氨基酸。结合并切割标记的生物素化的NTAA的单个的或小的基团的工程化氨肽酶突变体已经有人描述参见PCT公开号WO201006532。在某些实施方案中,紧密的单体金属酶促氨肽酶被工程化以识别和切割DNP标记的NTAA。所述单体金属氨肽酶的使用有两个关键优点:1紧密的单体蛋白更容易使用噬菌体展示显示和筛选;2金属氨基肽酶具有独特的优势,即其活性可以通过添加或除去适当的金属阳离子随意打开关闭。示例性的氨肽酶包括M28家族的氨肽酶,例如Streptomycessp.KK506SKAPYoo,Ahnetal.2010、StreptomycesgriseusSGAP、VibrioproteolyticusVPAP,SpunginandBlumberg1989,Ben-Meir,Spunginetal.1993。这些酶在室温和pH8.0下稳定,健壮、且有活性,因此与喜欢温和条件的肽分析相容。在另一个实施方案中,通过将所述氨肽酶工程化为仅在N-末端氨基酸标记存在有活性来实现环状切割。此外,所述氨肽酶可以被工程化为非特异性的,使得它不会选择性地识别一种特定氨基酸而非另一种特定氨基酸,而是仅识别所述标记的N-末端。在一个优选的实施方案中,金属肽酶单体氨肽酶例如Vibro亮氨酸氨肽酶Hernandez-Moreno,Villasenoretal.2014被工程化为仅裂解修饰的NTAA例如PTC、DNP、SNP、乙酰化、酰化等。在另一个实施方案中,通过使用工程化的酰基肽水解酶APH切割乙酰化的NTAA来实现环状切割。APH是丝氨酸肽酶,其能够从封闭的肽中催化去除Nα-乙酰化氨基酸,并且是真核细胞、细菌和古细胞中N末端乙酰化蛋白的关键调节剂。在某些实施方案中,APH是二聚体并且仅具有外肽酶活性Gogliettino,Balestrierietal.2012,Gogliettino,Riccioetal.2014。所述工程化APH可具有比内源或野生型APH更高的亲和力和更低的选择性。在另一个实施方案中,所述NTAA的脒化胍基化采用来促使温和切割所述标记的NTAAHamada,2016,其通过引用整体并入。本领域已知许多脒化胍基化试剂,包括:S-甲基异硫脲、3,5-二甲基吡唑-1-甲脒、S-乙基硫脲溴化物、S-乙基硫脲氯化物、O-甲基异脲、O-甲基二异脲硫酸盐、O-甲基异脲硫酸氢盐、2-甲基-1-硝基异脲、氨基亚氨基甲磺酸、氰胺、氰基胍、双氰胺、3,5-二甲基-1-脒基吡唑硝酸盐、和3,5-二甲基吡唑、N,N'-双邻-氯-Cbz-S-甲基异硫脲、和N,N'-双邻-溴-Cbz-S-甲基异硫脲Katritzky,2005,通过引用整体并入。NTAA标记、结合和降解工作流程的示例如下参见图41和42:来自蛋白水解消化的大量记录标签标记肽例如,5000万至10亿被以合适的分子内间距随机固定在单个分子测序基质上例如,多孔珠。以循环方式,每个肽的N-末端氨基酸NTAA用小化学基团例如,DNP、SNP、乙酰基修饰,以提供对NTAA降解过程的循环控制,并通过同源结合剂增强结合亲和力。每个固定化肽的修饰的N-末端氨基酸例如,DNP-NTAA、SNP-NTAA、乙酰基-NTAA被所述同源NTAA结合剂结合,并且与结合的NTAA结合剂相关的编码标签的信息被转移到与所述固定的肽相关的所述记录标签。在NTAA识别,结合和将编码标签信息转移至记录标签后,通过暴露于工程化氨肽酶例如,用于DNP-NTAA或SNP-NTAA或工程化APH例如,用于乙酰-NTAA来去除标记的NTAA。仅在标记存在下才能进行NTAA切割。其他NTAA标记例如,PITC也可以采用来与适当工程化的氨肽酶一起使用。在一个具体实施方案中,单一工程化氨肽酶或APH普遍切割具有N-末端氨基酸标记的所有可能的NTAA包括翻译后修饰变体。在另一个具体的实施方案中,使用两种、三种、四种或更多种工程化的氨肽酶或APH来切割标记的NTAA的库。对DNP或SNP标记的NTAA具有活性的氨肽酶可以被选择:通过使用结合对apo-酶在没有金属辅因子的情况下无活性的紧密结合选择的筛选,然后进行功能性催化选择步骤,如Ponsard等人描述的工程化用于苄青霉素的金属-β-内酰胺酶方法Ponsard,Gallenietal.2001,Fernandez-Gacio,Uguenetal.2003。这种两步法选择涉及使用通过添加Zn2+离子活化的金属-AP。在紧密结合选择固定的肽基质后,引入Zn2+,并且催化激活能够水解DNP或SNP标记的NTAA的噬菌体以释放结合的噬菌体到上清液中。进行重复选择循环为DNP或SNP标记的NTAA切割富集活性AP。在本文提供的任何实施方案中,NTAA裂解试剂向所述NTAA的募集可以通过嵌合裂解酶和嵌合NTAA修饰剂增强,其中所述嵌合裂解酶和嵌合NTAA修饰剂各自包含能够相互紧密结合的基团例如,生物素-链霉亲和素参见图39。例如,可以用生物素-PITC修饰NTAA,并且通过链霉亲和素-生物素相互作用将嵌合切割酶链霉亲和素-Edmanase募集到所述修饰的NTAA,从而提高所述切割酶的亲和力和效率。所述修饰的NTAA被切割并随着相关的切割酶一起从所述肽中扩散出来。在嵌合Edmanase的例子中,该方法有效地将亲和力KD从μM增强至亚皮摩尔。通过使用与所述记录标签相互作用的裂解剂上的DNA标签进行束缚,也可以实现类似的切割增强参见图44。作为NTAA切割的替代方案,二肽基氨基肽酶DAP可用于从肽上切割最后两个N-末端氨基酸。在某些实施方案中,可以切割单个NTAA参见图45:图45描绘了N-末端降解的方法,其中butelaseI肽底物的N-末端连接将TEV内肽酶底物附着至所述肽的N末端。附着后,TEV内肽酶从所述测试肽经历测序的肽切割新连接的肽,留下与所述NTAA连接的单个天冬酰胺N。与DAP孵育,其从N末端切割两个氨基酸,导致所述原始NTAA的净去除。整个过程可以在N端降解过程中循环。对于涉及CTAA结合剂的实施方案,从肽切割CTAA的方法也是本领域已知的。例如,美国专利6,046,053公开了一种使肽或蛋白质与烷基酸酐反应以将羧基末端转化为恶唑酮,通过与酸和醇或与酯反应释放所述C-末端氨基酸的方法。CTAA的酶促切割也可以通过羧肽酶完成。几种羧肽酶表现出氨基酸偏好,例如,羧肽酶B优先在碱性氨基酸如精氨酸和赖氨酸上切割。如上所述,羧肽酶也可以与氨肽酶相同的方式进行修饰,以改造成特异性结合具有C-末端标记的CTAA的工程羧肽酶。以这种方式,羧肽酶一次仅从所述C末端切割单个氨基酸,并允许控制所述降解循环。在一些实施方案中,所述修饰的羧肽酶对氨基酸残基身份是非选择性的,同时对C-末端标记具有选择性。在其他实施方案中,修饰的羧肽酶对氨基酸残基身份和C末端标记都具有选择性。XII.延伸记录标签,延伸编码标签或Di-Tag的处理和分析可以使用多种核酸测序方法处理和分析延伸记录标签,延伸编码标签和代表感兴趣的大分子的di-tag文库。测序方法的例子包括,但不限于,链终止测序Sanger测序;下一代测序方法,如合成测序、连接测序、杂交测序、polony测序、离子半导体测序、和焦磷酸测序;和第三代测序方法,如单分子实时测序、基于纳米孔的测序、双重中断测序、以及使用高级显微镜的DNA直接成像。可以以各种方式扩增延伸记录标签、延伸编码标签或di-tags的库。延伸记录标签、延伸编码标签或di-tags的库可以进行指数扩增,例如通过PCR或乳液PCR。已知乳液PCR产生更均匀的扩增Hori,Fukanoetal.2007。或者,延伸记录标签、延伸编码标签或di-tags的库可以进行线性扩增,例如,通过使用T7RNA聚合酶的模板DNA的体外转录。可以使用与其中包含的通用正向引发位点和通用反向引发位点相容的引物扩增所述延伸记录标签、延伸编码标签或di-tags的库。所述延伸记录标签、延伸编码标签或di-tags的库也可以使用有尾引物进行扩增,以将序列添加到所述延伸记录标签、延伸编码标签或di-tags的5'端、3'端或两端。可以添加到所述延伸记录标签、延伸编码标签或di-tags末端的序列包括与用于制作测序平台兼容的所述延伸记录标签、延伸编码标签或di-tags的:允许在单个测序运行中复用的多个文库的库特异性索引序列、衔接子序列、读取引物序列或任何其他序列。制备下一代测序的文库扩增的实例如下:使用从~1mg珠子~10ng洗脱的延伸记录标签库,200μMdNTP,正向和反向扩增引物每个1μM,0.5μl1UPhusion热启动酶NewEnglandBiolabs,并进行以下循环条件:98℃30秒,然后98℃10秒20个循环,60℃持续30秒,72℃持续30秒,然后是72℃持续7分钟,然后保持在4℃。在某些实施方案中,在扩增之前,期间或之后,所述延伸记录标签、延伸编码标签或di-tags库可以进行靶富集。靶富集可用于在测序之前从所述延伸记录标签、延伸编码标签或di-tags库中选择性地捕获或扩增代表感兴趣大分子的延伸记录标签。由于高成本和难以产生针对靶蛋白的高度特异性结合剂,蛋白序列的靶标富集是具有挑战性的。众所周知,抗体是非特异性的,并且难以跨越数千种蛋白质上规模化生产。本公开的方法通过将所述蛋白代码转换成核酸代码来规避了该问题,该核酸代码然后可以利用可用于DNA文库的多种靶向DNA富集策略。通过富集它们相应的延伸记录标签,可以在样品中富集感兴趣的肽。靶向富集的方法是本领域已知的,并且包括杂交捕获测定、基于PCR的测定,例如TruSeq定制AmpliconIllumina,挂锁探针也称为分子倒置探针,及其类似方法see,Mamanovaetal.,2010,NatureMethods7:111-118;Bodietal.,J.Biomol.Tech.2013,24:73-86;Ballesteretal.,2016,ExpertReviewofMolecularDiagnostics357-372;Mertesetal.,2011,BriefFunct.Genomics10:374-386;Nilssonetal.,1994,Science265:2085-8;每个都通过引用整体并入本文。在一个实施方案中,通过基于杂交捕获的测定来富集延伸记录标签、延伸编码标签或di-tags库参见例如图17A和17B。在基于杂交捕获的测定中,所述延伸记录标签、延伸编码标签或di-tags库与靶标特异性寡核苷酸或用亲和标签例如生物素标记的“诱饵寡核苷酸”杂交。通过亲和配体例如,链霉亲和素包被的珠子和它们的亲和标签,杂交到所述靶特异性寡核苷酸的延伸记录标签、延伸编码标签或di-tags被“拉下”,并且和背景非特异性延伸记录标签被洗掉参见例如图17。然后获得用于阳性富集例如,从珠子洗脱富集的延伸记录标签、延伸编码标签或di-tags。对于通过基于阵列的“原位”寡核苷酸合成和随后的寡核苷酸库扩增合成的诱饵寡核苷酸,可以通过在给定的寡核苷酸阵列内使用几组通用引物将竞争诱饵工程化到池中。对于每种类型的通用引物,生物素化引物与非生物素化引物的比例控制富集率。几种引物类型的使用使得能够将几种富集比设计到最终的寡核苷酸诱饵池中。诱饵寡核苷酸可以设计成与代表感兴趣的大分子的延伸记录标签、延伸编码标签或di-tags互补。诱饵寡核苷酸与延伸记录标签、延伸编码标签或di-tags上的间隔序列的互补程度可以是0%至100%,以及其间的任何整数。通过一些富集实验可以很容易地优化该参数。在一些实施方案中,所述间隔子相对于所述编码序列的长度在编码标签设计中被最小化,或者间隔子被设计为不可与所述诱饵序列杂交。一种方法是使用在辅助因子存在下形成二级结构的间隔子。这种二级结构的一个例子是G-quadruplex,它是由两个或多个彼此堆叠的鸟嘌呤四联体形成的结构Bochman,Paeschkeetal.2012。鸟嘌呤四联体是由四个鸟嘌呤碱基形成的方形平面结构,其通过Hoogsteen氢键结合。所述G-quadruplex结构在阳离子存在下稳定,例如K+离子vs.Li离子。为了使所用的诱饵寡核苷酸的数量最小化,可以生物信息学地鉴定来自每种蛋白质的一组相对独特的肽,并且将仅与代表目标肽的相应延伸记录标签库互补的那些诱饵寡核苷酸用于杂交捕获检测。也可以使用相同或不同的诱饵组进行连续回合或富集。为了在代表其片段例如肽的延伸记录标签、延伸编码标签或di-tags库中富集全长大分子例如,蛋白质或多肽,可以设计“平铺的”诱饵寡核苷酸以覆盖代表所述蛋白的完整核酸。在另一个实施方案中,引物延伸和基于连接介导的扩增富集AmpliSeq、PCR、TruSeqTSCA等可用于选择和调节module代表大分子子集的文库元件的富集的分级物。竞争oligos也可用于调节引物延伸、连接或扩增的程度。在最简单的实施方案中,这可以通过混合包含通用引物尾的靶特异性引物和缺乏5’通用引物尾的竞争引物来实现。在初始引物延伸后,仅可扩增具有5’通用引物序列的引物。具有和不具有通用引物序列的引物的比例控制扩增的靶标的分数。在其它实施方案中,用包含的除延伸引物以外的杂交来调节经历引物延伸,连接或扩增的文库元件的分数。靶富集方法也可以以用在负选择模式中,以在测序之前从文库中选择性地去除延伸记录标签、延伸编码标签或di-tag。因此,在上述使用生物素化诱饵寡核苷酸和链霉亲和素包被的珠子的实施例中,保留上清液用于测序,而不分析结合在珠子上的所述诱饵寡核苷酸:延伸记录标签、延伸编码标签或di-tag二标签杂交体。可以去除的不需要的延伸记录标签、延伸编码标签或di-tag的例子是那些代表丰度大分子种类例如蛋白质,白蛋白,免疫球蛋白等的延伸记录标签、延伸编码标签或di-tag。与所述靶标杂交但缺乏生物素基团的竞争寡核苷酸诱饵也可用于杂交捕获步骤以调节富集的任何特定位点的分数。竞争寡核苷酸诱饵与标准生物素化诱饵竞争性杂交所述靶标,有效调节富集期间拉下的靶标分数图17。10个数量级动态范围的蛋白质表达可以通过使用这种竞争抑制方法举行几个数量级的压缩,特别是对于过丰种类,例如白蛋白。因此,针对给定位点的捕获的文库元件相对于标准杂交捕获的分数可以从100%调节至0%富集度。另外,文库标准化技术可用于从延伸记录标签、延伸编码标签或di-tag文库中去除过多的种类。这种方法最适用于源自位点特异性蛋白酶例如胰蛋白酶,LysC,GluC等消化产生的肽的定义长度文库。在一个实例中,标准化可以通过使双链文库变性并允许所述文库元件重新退火来完成。由于双分子杂交动力学的二阶速率常数,丰度文库元素比欠丰度元素更快地重新退火Bochman,Paeschkeetal.2012。可以使用本领域已知的方法将ssDNA文库元件与丰度dsDNA文库元件分离,例如羟基磷灰石柱上的色谱法VanderNoot,etal.,2012,Biotechniques53:373-380或用来自Kamchatka蟹的双体特异性核酸酶DSN处理文库Shaginetal.,2002,GenomeRes.12:1935-42,所述双体特异性核酸酶DSN破坏所述dsDNA文库元件。在连接到固体支持物和或得到的延伸记录标签文库之前,大分子的分级分离、富集和扣减方法的任何组合可以节省测序读数并改善低丰度种类的测量。在一些实施方案中,通过连接或末端互补PCR连接延伸记录标签、延伸编码标签或di-tags的文库以产生分别包含多种不同延伸记录标签、延伸编码标签或di-tags的长DNA分子Duetal.,2003,BioTechniques35:66-72;Mueckeetal.,2008,Structure16:837-841;U.S.PatentNo.5,834,252,每个通过引用整体并入本文。该实施方案优选用于纳米孔测序,其中通过所述纳米孔测序装置分析长链DNA。在一些实施方案中,对延伸记录标签、延伸编码标签或di-tags进行直接的单分子分析参阅,例如Harrisetal.,2008,Science320:106-109。可以在固体支持物上,例如流通槽或适于加载到流通槽表面可选地,微孔图形化上珠子,直接分析所述延伸记录标签、延伸编码标签或di-tags,其中所述流通槽或珠子能够与单分子测序仪或单分子解码仪器整合。对于单分子解码,可以使用几轮合并的荧光标记的解码寡核苷酸的杂交Gundersonetal.,2004,GenomeRes.14:970-7来确定所述延伸记录标签中的编码标签的身份和顺序。为了解构所述编码标签的结合顺序,可以用如上描述的循环特异性编码标签标记所述结合剂Gundersonetal.,2004,GenomeRes.14:970-7。循环特异性编码标签既可用于代表单个大分子的单个,级联延伸记录标签,也可用于代表单个大分子的延伸记录标签的集合。在对所述延伸报告标签,延伸编码标签或di-tag文库进行测序后,所得到的序列可以通过它们的UMI折叠,然后相关联到相应的大分子例如,肽、蛋白、蛋白复合物并且与细胞中总体大分子类型例如肽、多肽、蛋白大分子的蛋白质组对准。得到的序列也可以通过它们的隔室标签折叠并与其相应的隔室蛋白质组相关联,在特定的实施方案中,隔室蛋白质组仅包含单个或非常有限数量的蛋白分子。蛋白质鉴定和定量都可以从这种数字肽信息中轻松获得。在一些实施方案中,可以针对特定测序分析平台优化所述编码标签序列。在特定实施方案中,测序平台是纳米孔测序。在一些实施方案中,测序平台具有5%,10%,15%,20%,25%或30%的每碱基错误率。例如,如果要使用纳米孔测序仪器分析所述延伸记录标签,则所述条形码序列例如,编码器序列能设计成在通过纳米孔时是最佳电学上可辨别的。根据本文所述方法的肽测序可能非常适合纳米孔测序,鉴于纳米孔测序的所述单碱基准确度仍然相当低75%-85%,但所述“编码序列”的判定应该更准确99%。此外,一种称为双重中断纳米孔测序DI的技术可以与纳米孔链测序一起使用,而不需要分子马达,大大简化了所述系统设计Derrington,Butleretal.2010。通过DI纳米孔测序读出延伸记录标签需要级联的延伸记录标签库中的间隔元件与互补寡核苷酸退火。本文使用的寡核苷酸可包含LNA,或其它经修饰的核酸或类似物,以增加所得双链体的有效Tm。当用这些双链体间隔区修饰的单链延伸记录标记通过所述孔时,所述双链区将在收缩区瞬时停滞,使得能够读出与所述双链区相邻的约3个碱基的电流。在DI纳米孔测序的特定实施方案中,所述编码器序列以这样的方式设计:与所述间隔元件相邻的三个碱基产生最大程度上可电辨别纳米孔信号Derringtonetal.,2010,Proc.Natl.Acad.Sci.USA107:16060-5。作为无马达DI排序的替代方案,所述间隔元件可以设计成采用二级结构,例如G-quartet,当它通过纳米孔时,它将瞬时停顿所述延伸记录标签、延伸编码标签或di-tag,从而能够读出所述相邻的编码器序列Shim,Tanetal.2009,Zhang,Zhangetal.2016。在经过所述停顿之后,下一个间隔子将再次产生瞬态停顿,从而能够读出下一个编码器序列,依此类推。本文公开的方法可用于同时复用多个大分子例如肽的分析,包括检测、定量和或测序。如本文所用的复用是指在相同测定中分析多个大分子。所述多个大分子可以源自相同的样品或不同的样品。所述多个大分子可以衍生自相同的受试者或不同的受试者。分析的所述多个大分子可以是不同的大分子例如肽,或源自不同样品的相同大分子例如肽。多个大分子包括2个或更多个大分子,5个或更多个大分子,10个或更多个大分子,50个或更多个大分子,100个或更多个大分子,500个或更多个大分子,1000个或更多个大分子,5,000个或更多个大分子,10,000个或更多个大分子,50,000个或更多个大分子,100,000个或更多个大分子,500,000个或更多个大分子,或1,000,000个或更多个大分子。样品复用可以通过前期标记大分子样品的记录标签的条形码化来实现。每个条形码代表不同的样品,并且可以在循环结合测定或序列分析之前合并样品。以这种方式,许多条形码标记的样品可以在单个管中同时处理。该方法是对在反相蛋白质阵列RPPA上进行的免疫测定的显着改进Akbani,Beckeretal.2014,CreightonandHuang2015,Nishizuka和Mills2016。以这种方式,本公开内容基本上对具有简单工作流程的RPPA测定提供了高度数字化样品和分析物复用替代物。XIII.经由NTAA识别、记录标签延伸、和NTAA切割的循环轮的大分子表征在某些实施方案中,本公开内容提供的用于分析大分子的方法包括多个结合循环,其中大分子与多种结合剂接触,并且结合剂的连续结合将历史结合信息以基于核酸的编码标签的形式转移到至少一个与所述大分子关联的记录标签。以这种方式,以核酸形式产生包含关于多个结合事件的信息的历史记录。在涉及使用基于N-末端降解的方法分析肽大分子的方法的实施方案中参见图3,图4,图41和图42,在第一结合剂与n个氨基酸的肽的nNTAA接触和结合后,转移所述第一结合剂的编码标签信息到与肽相关的记录标签,从而产生第一次序延伸记录标签,所述nNTAA如本文所述被切割。所述nNTAA的切割所述将肽的n-1氨基酸转化为N-末端氨基酸,其在本文中称为n-1NTAA。如本文所述,nNTAA可任选地用基团例如,PTC,DNP,SNP,乙酰基,脒基等标记,其特别适用于与被设计来结合标记形式的NTAA的裂解酶结合。如果所述nNTAA被标记,则所述n-1NTAA然后用相同的基团标记。使第二结合剂与所述肽接触并结合所述n-1NTAA,并将第二结合剂的编码标签信息转移至第一次序延伸记录标签从而产生第二次序延伸记录标签例如,用于产生代表所述肽的级联的第n次序延伸记录标签,或至不同的记录标签例如,用于产生多个延伸记录标签,其统一代表所述肽。所述n-1NTAA的切割将所述肽的n-2氨基酸转化为N-末端氨基酸,其在本文中称为n-2NTAA。另外的结合、转移、切割和任选的NTAA标记可如上所述发生直至n个氨基酸以产生共同代表所述肽的第n次序延伸记录标签或n个单独的延伸记录标签。如本文所用,当用于指代结合剂,编码标签或延伸记录标签时,n“次序”是指使用所述结合剂及其相关的编码标签的n个结合循环,或指创建所述延伸记录标签的n个结合循环。在一些实施方案中,所述第一结合剂和所述第二结合剂与大分子的接触,与任选的任何其他结合剂例如,第三结合剂、第四结合剂,第五结合剂等同时进行。例如,可以将第一结合剂和第二结合剂,以及任选的任何其它序数的结合剂合并在一起,例如形成结合剂文库。在另一个实例中,将所述第一结合剂和第二结合剂,以及任选的任何其它序数的结合剂同时加入到大分子中,而不是合并在一起。在一个实施方案中,结合剂文库包含至少20种选择性结合20种标准天然氨基酸的结合剂。在其它实施方案中,所述第一结合剂和第二结合剂,以及任选的任何其它序数的结合剂各自在分开的结合循环中与大分子接触,按顺序添加。在某些实施方案中,优选同时使用多种结合剂,因为平行方法节省时间并且所述结合剂处于竞争中,这减少了非同源结合剂对被同源结合剂结合的位点的非特异性结合。通过本文描述的方法产生的最终延伸记录标签的长度取决于多个因素,包括编码标签的长度例如,编码器序列和间隔区、记录标签的长度例如,独特分子标识符、间隔区、通用引发位点、条形码、操作的结合循环数、以及来自每个结合循环的编码标签是否被转移到相同的延伸记录标签或多个延伸记录标签。在代表肽并且由Edman降解样的裂解方法产生的级联延伸记录标签的实例中,如果所述编码标签具有两侧各有5个碱基的间隔子的5碱基编码序列,则在最终延伸记录标签上的所述编码标签信息,其代表肽的结合剂历史,是10个碱基×Edman降解循环数。对于20个循环的运行,所述延伸记录至少为200个碱基不包括初始记录标签序列。该长度与标准的下一代测序仪器兼容。在最终结合循环和所述最终结合剂的编码标签信息转移到所述延伸记录标签之后,可以通过连接、引物延伸或本领域已知的其他方法添加通用反向引发位点来对所述记录标签加盖。在一些实施例中,所述记录标签中的通用正向引发位点与附加到所述最终延伸记录标签的通用反向启发位点兼容。在一些实施方案中,通用反向引发位点是IlluminaP7引物5'-CAAGCAGAAGACGGCATACGAGAT-3'-SEQIDNO:134或IlluminaP5引物5'-AATGATACGGCGACCACCGA-3'-SEQIDNO133。可以附加有义或反义P7,这取决于所述记录标签的链义。延伸记录标签文库可以直接从固体支持物例如珠子切割或扩增,并用于传统的下一代测序分析和方案中。在一些实施方案中,在单链延伸记录标签文库中进行引物延伸反应以复制其互补链。所述NGPS肽测序分析包括循环进程中的几个化学和酶促步骤。NGPS测序是单分子的事实赋予该过程几个关键优势。单分子测定的第一个关键优势是对各种循环化学酶促步骤中的低效率的稳健性。这通过使用存在于所述编码标签序列中的循环特异性条形码来实现。使用循环特异性编码标签,我们跟踪每个循环的信息。由于这是单分子测序方法,因此在测序过程中每个结合转移循环的70%的效率就足以产生可映射的序列信息。例如,在我们的序列平台上可以将十碱基肽序列“CPVQLWVDST”SEQIDNO:169读作“CPXQXWXDXT”SEQIDNO:170其中X=任何氨基酸;通过循环数跟踪推断出氨基酸的存在。这种部分氨基酸序列读数足以使用BLASTP将其独特地映射回人p53蛋白。因此,我们的流程不必都非常完美。此外,当循环特异性条形码与我们的分区概念相结合时,蛋白质的绝对鉴定可以通过10个位置中仅识别出几个氨基酸来实现,因为我们知道什么肽组映射到原始蛋白质分子通过隔室条形码。XIV.通过分级、区室化、和有限的结合性树脂的蛋白标准化。蛋白质组学分析的关键挑战之一是解决样品中蛋白丰度的大动态范围。血浆中甚至是“前20”耗尽血浆的蛋白超过10个数量级的动态范围。在某些实施方案中,在分析之前从样品中扣减某些蛋白种类例如,高丰度蛋白。这可以通过例如使用商业上可获得的蛋白消耗试剂例如Sigma的PROT20免疫耗尽试剂盒来实现,其消耗前20种血浆蛋白。此外,可以大大降低所述动态范围,甚至降低到可控的3-4个数量级的方法是有用。在某些实施方案中,蛋白质样品动态范围可以通过使用标准分级分离方法包括电泳和液相色谱法Zhou,Ning等人,2012,来分级所述蛋白样品来调节,或者将所述分级物分区到加载有限蛋白结合能力的珠子树脂例如羟基化二氧化硅颗粒McCormick1989的隔室中并洗脱结合蛋白来调节。洗去每个隔室中的过量蛋白质。电泳方法的实例包括毛细管电泳CE、毛细管等电聚焦CIEF、毛细管等速电泳CITP、自由流电泳、凝胶洗脱的液体分级物包埋电泳GELFrEE。液相色谱蛋白质分离方法的实例包括反相RP、离子交换IE、尺寸排除SE,亲水相互作用等。隔室分区的实例包括乳液、液滴、微孔、平面基板上的物理分离区域等。示例性蛋白结合珠子树脂包括用酚基团或羟基衍生的二氧化硅纳米粒子例如,来自AgilentTechnologies的StrataCleanResin,来自LabTech的RapidClean,等。通过限制所述珠子树脂的结合能力,在给定分级物中洗脱的高丰度蛋白将仅部分地与所述珠子结合,并且过量蛋白被除去。XV.分区单个细胞的蛋白质组或分子二次取样在另一方面,本公开内容提供了使用条形码和分区技术对样品中的蛋白进行大规模平行分析的方法。目前的蛋白质分析方法涉及将蛋白质大分子片段化成适合肽测序的较短肽分子。因此,使用此类方法获得的信息受限于片段化步骤的限制并且排除,例如蛋白质的长范围连续性信息,包括翻译后修饰、每个样品中发生的蛋白质-蛋白质互作、样品中存在的蛋白群的组成、或所述蛋白大分子的起源,例如来自特定细胞或细胞群。蛋白质分子内翻译后修饰的长范围信息例如,蛋白质表征提供了更完整的生物学图像,以及关于什么肽属于什么蛋白分子的长范围信息提供更稳健的肽序列到底层蛋白质序列的映射见图15A。当肽测序技术仅提供不完整的氨基酸序列信息,例如仅来自5种氨基酸类型的信息时,这尤其重要。通过使用本文公开的分区方法,结合来自多种源自相同蛋白质分子的肽的信息,蛋白分子例如蛋白质组的身份可以更准确地评估。隔室标签与来自相同隔室的蛋白质和肽的结合促进了分子和细胞信息的重建。在一般的蛋白质组分析中,细胞被裂解并且蛋白质被消化成短肽,破坏了关于哪种蛋白质来自哪种细胞或细胞类型,以及哪种肽来自哪种蛋白质或蛋白质复合物的整体信息。这种整体信息对于理解细胞和组织内的生物学和生物化学非常重要。分区是指将独特条形码随机分配给样品中大分子群体的大分子亚群。可以通过将大分子分配进隔室中来实现分区。分区可以由单个隔室内的大分子或来自一组隔室的多个隔室内的大分子组成。通过独特的隔室标签鉴定已经分隔到多个例如,数百万到数十亿隔室的相同物理隔室或隔室组中的大分子子集或蛋白质样品子集。因此,即使在将成分合并在一起之后,隔室标签也可用于将来自具有相同隔室标签的一个或多个隔室的成分从具有不同隔室标签的另一隔室或隔室组中的成分中区分出来。本公开内容提供了通过将复杂蛋白质组样品例如,多种蛋白质复合物、蛋白质或多肽或复合细胞样品分区成多个隔室来增强蛋白质分析的方法,其中每个隔室包含多个隔室标签,在单个隔室内的隔室标签相同除了可选的UMI序列并且与其他隔室的隔室标签不同参见图18-20。所述隔室任选地包含连接所述多个隔室标签的固体支撑物例如珠子。将多种蛋白质复合物、蛋白或多肽片段化成多个肽,然后在足以允许所述多个肽与所述多个隔室标签在所述多个隔室内退火或连接的条件下与所述多个隔室标签接触,从而产生多个隔室标记的肽。或者,所述多个蛋白复合物、蛋白或多肽在足以允许所述多个蛋白复合物、蛋白或多肽与所述多个隔室标签在多个隔室内退火或连接的条件下连接到多个隔室标签,从而产生多个隔室标记的蛋白复合物、蛋白、多肽。然后从所述多个隔室收集隔室标记的蛋白复合物、蛋白或多肽,并任选地片段化成多个隔室标记的肽。根据本文描述的任何方法分析一种或多种隔室标记的肽。在某些实施方案中,通过引物延伸图5或连接图6将隔室标签信息转移至与大分子例如肽相联的记录标签。在一些实施方案中,所述隔室标签在所述隔室内的溶液中是游离的。在其他实施方案中,所述隔室标签直接连接到隔室的表面例如,微量滴定板或picotiter板的孔底部或珠子或隔室内的珠子。隔室可以是含水隔室例如,微流体液滴或固体隔室。固体隔室包括,例如,纳米颗粒、微球、阵列上的微量滴定孔或picotiter孔或分离区域、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶芯片、流通槽、流通芯片、包括信号转导电子器件的生物芯片、ELISA板,旋转干涉测量盘、硝酸纤维素膜或基于硝酸纤维素的聚合物表面。在某些实施方案中,每个隔室平均含有单个细胞。固体支持物可以是任何支持表面,包括但不限于珠子、微珠、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶芯片、流通槽、流通芯片、包括信号转导电子器件的生物芯片、ELISA板,旋转干涉测量盘、硝酸纤维素膜或基于硝酸纤维素的聚合物表面,纳米颗粒或微球。用于固体载体的材料包括但不限于丙烯酰胺、琼脂糖、纤维素、硝化纤维素、玻璃、金、石英、聚苯乙烯、聚乙烯乙酸乙烯酯、聚丙烯、聚甲基丙烯酸酯、聚乙烯、聚环氧乙烷、聚硅酸盐、聚碳酸酯、特氟隆、碳氟化合物、尼龙、硅橡胶、聚酸酐、聚乙醇酸、聚乳酸、聚原酸酯、官能化硅烷、聚丙基延胡索酸酯、胶原、糖胺聚糖、聚氨基酸或其任何组合。在某些实施方案中,固体支持物是珠子,例如,聚苯乙烯珠子、聚合物珠子、琼脂糖珠子、丙烯酰胺珠子、固体核心珠子、多孔珠子、顺磁珠子、玻璃珠子或可控孔珠子。在Shembekar等人Shembekar,Chaipan等人,2016中综述了将样品分区到具有隔室标记珠子的隔室的各种方法。在一个实例中,蛋白质组通过乳液分配成液滴,从而能够记录被本文公开的方法对蛋白质分子和蛋白质复合物的全局信息举行记录参见例如图18和图19。在某些实施方案中,所述蛋白质组与隔室标记的珠子、可活化的蛋白酶直接或间接通过热、光等,以及被工程化例如,修饰的赖氨酸、聚乙二醇化为具有蛋白酶抗性的肽连接酶一起被分配到隔室例如,液滴中。在某些实施方案中,可以用变性剂处理蛋白质组以评估蛋白或多肽的肽组分。如果需要关于蛋白质天然状态的信息,可以将相互作用的蛋白质复合物分配到隔室,用于随后分析由其衍生的肽。隔室标签包括条形码,其任选地在一侧或两侧侧接间隔子或通用引物序列。所述引物序列可以与记录标签的3’序列互补,从而能够通过引物延伸反应将隔室标签信息转移到所述记录标签参见图22A-B。所述条形码可以由附着于固体支持物或隔室的单链核酸分子或其与固体支持物或隔室杂交的互补序列,或这两种链组成参见例如图16。隔室标签可包含功能基团,例如附着于所述间隔子上,用于偶联肽。在一个实例中,功能基团例如,醛是指能够与所述多个肽上的N-末端氨基酸残基反应的基团。在另一个实例中,功能基团能够与所述多个肽上的内部氨基酸残基例如,赖氨酸或用“点击”反应性基团标记的赖氨酸反应。在另一个实施方案中,功能基团可以仅仅地是能够与DNA标签标记的蛋白杂交的互补DNA序列。或者,隔室标签可以是嵌合分子,还包含含有蛋白质连接酶例如,butelaseI或其同源物的识别序列的肽以允许将所述隔室标签连接至目标肽参见图22A。隔室标签可以是较大核酸分子内的组分,其任选地还包含用于提供与其连接的肽的识别信息的独特分子标识符、间隔序列,通用引发位点或其任何组合。该UMI序列通常与隔室内的隔室标签群不同。在某些实施方案中,隔室标签是记录标签内的组分,使得用于提供个体隔室信息的相同标签也用于记录与其连接的肽的单个肽信息。在某些实施方案中,隔室标签可以通过印刷、点样、喷墨到所述隔室中形成隔室标签。在某些实施方案中,如Kleinetal.,2015,Cell161:1187-1201;Macoskoetal.,2015,Cell161:1202-1214;和Fanetal.,2015,Science347:1258367等描述的通过分开-合并寡核苷酸连接或合成形成多个隔室标记的珠子,其中每个珠子有一种条形码类型。隔室标记的珠子也可以通过单独合成或固定形成。在某些实施方案中,所述隔室标记的珠子还包含双功能记录标签,其中一部分包含含有记录标签的隔室标签,另一部分包含功能基团,其上可以偶联所述消化的肽图19和图20。在某些实施方案中,所述多个隔室内的多种蛋白或多肽用蛋白酶片段化成多个肽。蛋白酶可以是金属蛋白酶。在某些实施方案中,所述金属蛋白酶的活性通过金属阳离子的光活化释放来调节。可以使用的内肽酶的实例包括:胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶、嗜热菌蛋白酶、胃蛋白酶、梭菌蛋白酶、谷氨酰内肽酶GluC、内肽酶ArgC、肽酰基-asp金属内肽酶AspN、内肽酶LysC和内肽酶LysN。它们的活化模式取决于缓冲液和二价阳离子的要求。任选地,在将蛋白质或多肽充分消化成肽片段后,所述蛋白酶被灭活例如,加热、氟代油或硅油可溶性抑制剂,例如二价阳离子螯合剂。在具有隔室标签的肽条形码的某些实施方案中,用DNA标签标记蛋白分子任选地,变性多肽,通过DNA标签与蛋白质的赖氨酸基团的ε-胺基的缀合或间接地通过点击化学附着于用反应性点击基团例如炔预标记的蛋白多肽参见图2B和图20A。然后将所述DNA标签标记的多肽分配进入包含隔室标签例如,与液滴中包含的珠子结合的DNA条形码的隔室参见图20B,其中隔室标签包含识别每个隔室的条形码。在一个实施方案中,单个蛋白质多肽分子与与珠子相关的单一种类的DNA条形码共同包封参见图20B。在另一个实施方案中,所述隔室可以构成珠子的表面,其附着有与PCT公号WO2016061517通过引用整体并入中所描述的类似的隔室珠子标签,除了被应用于蛋白质而不是DNA之外。所述隔室标签可包括条形码BC序列、通用引发位点U1'、UMI序列、和间隔序列Sp。在一个实施方案中,伴随着分区或在其后,将所述隔室标签从所述珠子上切割下并与附着于所述多肽的所述DNA标签杂交,例如分别通过DNA标签和隔室标签上的互补U1和U1'序列。为了在珠子上分区,所述DNA标签标记的蛋白质可以直接与所述珠子表面上的所述隔室标签杂交参见图20C。在该杂交步骤之后,从隔室中提取具有杂交DNA标签的多肽例如,乳液“破裂”,或从珠子切割的隔室标签,并且使用基于聚合酶的引物延伸步骤将条形码和UMI信息写入所述多肽上的所述DNA标签以产生隔室条形码记录标签参见图20D。LysC蛋白酶消化可用于将多肽切割成在其C-末端赖氨酸处用具有含通用引发序列、隔室标签和UMI的记录标签标记的肽参见图20E。在一个实施方案中,所述LysC蛋白酶被工程化以耐受DNA标记的赖氨酸残基。将得到的记录标签标记肽以适当的密度固定在固体基质例如珠子上,以使记录标记的肽之间的分子间相互作用最小化参见图20E和20F。所述肽附着到所述隔室标签或反之亦然可以直接与固定的隔室标签或其互补序列如果是双链的连接。或者,所述隔室标签可以从所述固体支持物或所述隔室的表面分离,且所述肽和溶液相隔室标签在隔室内连接。在一个实施方案中,所述隔室标签上例如,在寡核苷酸的末端的功能基团是醛,其通过席夫碱Schiffbase直接与所述肽的胺N-末端偶联参见图16。在另一个实施方案中,所述隔室标签构建为核酸-肽嵌合分子,其包含用于蛋白连接酶的肽基序n-X...XXCGSHV-c。使用肽连接酶,例如butelaseI或其同源物,将所述核酸-肽隔室标签构建体与消化的肽缀合。ButelaseI,和其它天冬酰胺酰内肽酶AEP同源物可用于将寡核苷酸-肽隔室标签构建体的C末端连接至所述消化肽的N末端Nguyen,Wangetal.2014,Nguyen,Caoetal.2015。这种反应快速而有效。得到的隔室标记肽随后可以固定至固体支持物,用于如本文所述的核酸肽分析。在某些实施方案中,连接至固体支持物或隔室表面的隔室标签在与具有多个片段化肽的隔室标签连接之前释放参见图18。在一些实施方案中,在从多个隔室收集所述隔室标记的肽之后,所述隔室标记的肽连接到与记录标签相关联固体支持物。然后隔室标签信息可以从所述隔室标记的肽上的所述隔室标签转移到所述相关的记录标签上例如,通过从所述记录标签和隔室标签内的互补间隔序列引发的引物延伸反应。在一些实施方案中,然后根据本文所述的方法在肽分析之前从隔室标记的肽中移除所述隔室标签。在进一步的实施方案中,最初用于消化所述多种蛋白质的所述序列特异性蛋白酶例如,EndoAspN也用于在所述隔室标签信息转移至所述相关记录标签后从所述肽的N末端移除所述隔室标签见图22B。基于隔室分区的方法包括通过使用T形接头和流动聚焦的微流体装置形成液滴,使用搅拌产生乳液或通过具有小孔的膜例如,轨迹蚀刻膜挤出等参见图21。区室化的挑战在于处理隔室的内部。在某些实施方案中,由于交换流体组分是具有挑战性的,因此可能难以在隔室内进行一系列不同的生化步骤。如前所述,通过将试剂添加到所述乳液的氟油中,可以改变液滴内部的有限特征,例如pH、螯合剂、还原剂等。然而,在水相和有机相中都具有溶解性的化合物的数量是有限的。一种方法是将隔室中的反应限制为基本上所述条形码至所述目标分子的转移。在用含隔室标签条形码的记录标签标记所述蛋白质肽后,所述将蛋白质肽以合适的密度固定在固体支持物上,以有利于从结合的同源结合剂的编码标签到相应的记录标签附着在所述肽或蛋白质分子上的记录标签的分子内转移。通过控制所述固体支持物表面上分子的分子间间距来最小化分子间信息传递。在某些实施方案中,所述隔室标签对一组隔室中的每个隔室不需要是唯一的。隔室群中的隔室子集两个,三个,四个或更多个可以共享相同的隔室标签。例如,每个隔室可以包含一群珠子表面,其用于从样品中捕获大分子亚群每个珠子捕获许多分子。此外,所述珠子包括隔室条形码,其能够附着到捕获的大分子上。每个珠子仅具有单个隔室条形码序列,但是该隔室条形码可以在隔室中的其他珠子上复制许多珠子映射到相同的条形码。在物理隔室和隔室条形码之间可以存在尽管不是必需的多对一映射,此外,隔室内的大分子之间可以存在尽管不是必需的多对一映射。分区条形码被定义为将独特条形码分配给来自样品内的大分子群的大分子的子样品集。该分区条形码可以包含相同的隔室条形码,所述隔室条形码由在由相同条形码标记的隔室内的分区大分子产生。物理隔室的使用有效地对原始样本进行子采样以提供分区条形码的分配。例如,提供了一套标有10,000个不同隔室条形码的珠子。此外,假设在给定的测定中,在测定中使用100万个珠子的群体。平均而言,每个区室条形码有100个珠子泊松分布。进一步假设所述珠子捕获了1000万个大分子的聚群。平均而言,每个珠子有10个大分子,每个隔室条形码有100个隔室,每个分区条形码包含100个不同的物理隔室的100个隔室条形码实际上有1000个大分子。在另一个实施方案中,通过在N或C末端或两端都用可扩增的DNAUMI标签例如记录标签标记多肽化学或酶促来完成单分子分区和多肽的分区条形码编码参见图37。DNA标签通过非特异性光标记或特异性化学附着到反应性氨基酸如赖氨酸从而附着到所述多肽体内部氨基酸如图2B所示。来自附着于所述肽末端的记录标签的信息通过酶促乳液PCRWilliams,Peisajovichetal.2006,Schutze,Rubeltetal.2011或乳液体外转录逆转录IVTRT步骤转移至所述DNA标签。在优选的实施方案中,使用纳米乳液,使得每个尺寸为50nm-1000nm的乳液液滴平均少于单个多肽Nishikawa,Sunamietal.2012,Gupta,Eraletal.2016。另外,PCR的所有组分都包括在水性乳液混合物中,包括引物、dNTP、Mg2+、聚合酶和PCR缓冲液。如果使用IVTRT,那么记录标签设计有T7SP6RNA聚合酶启动子序列以产生与附着于所述多肽体的所述DNA标签杂交的转录物Ryckelynck,Baudreyetal.2015。逆转录酶RT将来自杂交的RNA分子的信息复制到DNA标签。以这种方式,乳液PCR或IVTRT可用于有效地将信息从末端记录标签转移到附着于多肽体的多个DNA标签Ryckelynck,Baudreyetal.2015。通过珠子中的凝胶化来封装细胞内容物是单细胞分析的有用方法Tamminen和Virta2015,Spencer,Tamminenetal.2016。条形码单细胞液滴使得来自单个细胞的所有组分都能够用相同的标识符标记Klein,Mazutisetal.2015,Gunderson,Steemersetal.2016,Zilionis,Nainysetal.2017。隔室条形码可以通过多种方式实现,包括通过液滴连接Raindance将独特条形码直接结合到每个液滴中、通过将条形码珠子引入液滴10XGenomics、或通过液滴组分的组合条形码后封装、凝胶化使用和分开-合并组合条形码,如Gunderson等人描述。Gunderson,Steemersetal.2016和PCTPublicationWO2016130704,其全部内容通过引用并入本文。如Adey等人所述,类似的组合标记方案也可以应用于细胞核。Vitak,Torkenczyetal.2017。上述液滴条形码方法已用于DNA分析,但没用于蛋白质分析。使上述液滴条形码平台适应蛋白质需要几个创新步骤。第一个是条形码主要由DNA序列组成,需要将这种DNA序列信息赋予所述蛋白质分析物。在DNA分析物的情况下,将DNA信息转移到DNA分析物上相对简单。相反,将DNA信息转移到蛋白质上更具挑战性,特别是当所述蛋白被变性并被消化成肽用于下游分析时。这要求每个肽都用隔室条形码标记。挑战在于,一旦将所述细胞包封成液滴,就难变性所述蛋白质,蛋白酶消化所述得到多肽,并同时用DNA条形码标记所述肽。聚合物形成液滴中的细胞封装及其聚合凝胶化成多孔珠粒,可以将其带入水性缓冲液中,这提供了执行多个不同反应步骤的载体,不像液滴中的细胞Tamminen和Virta2015,Spencer,Tamminenetal.2016Gunderson,Steemersetal.2016。优选地,所述包封的蛋白质与所述凝胶基质交联以防止它们随后从凝胶珠粒扩散。这种凝胶珠粒形式允许所述凝胶中的包埋蛋白质经化学或酶促变性、用DNA标签标记、蛋白酶消化、并进行许多其他干预。图38描绘了凝胶基质中单个细胞的示例性包封和裂解。XVI.组织和单细胞空间蛋白质组学条形码的另一个用途是在空间分布的DNA条形码序列阵列表面上的组织的空间分割。如果用含有条形码的DNA记录标签标记组织蛋白,该条形码反映了安装在阵列表面上的所述细胞组织内的所述蛋白质的空间位置,那么所述组织切片内所述蛋白质分析物的所述空间分布可以在序列分析后重建,就像是如Stahl等人所述,用于空间转录组学研究。2016,Science3536294:78-82和Crosettoetal.Corsetto,Bienkoetal.,2015。空间条形码的附着可以通过从所述阵列释放阵列结合的条形码并将它们分散到所述组织切片中来实现,或者,所述组织切片中的所述蛋白质可以用DNA记录标签标记,然后用蛋白酶消化所述蛋白质以释放标记的肽,其可以扩散并与所述阵列上的空间条形码杂交。然后可以将所述条形码信息转移酶促或化学到与所述肽连接的所述记录标签上。组织内的所述蛋白质的空间条形码可以通过将固定透化的组织切片,用DNA记录标签化学标记,放置在空间编码的DNA阵列上来实现,其中所述阵列上的每个特征具有空间可识别条形码参见图23。为了将阵列条形码附着到所述DNA标签,可以用蛋白酶消化所述组织切片,释放DNA标签标记的肽,其可以扩散并与所述组织切片邻近的近端阵列特征杂交。可以使用化学酶促连接或聚合酶延伸将所述阵列条形码信息转移至所述DNA标签。或者,不是所述允许标记的肽扩散到所述阵列表面,而是可以切割所述阵列上的条形码序列并使其扩散到所述组织切片上的近端区域并与其中的DNA标签标记的蛋白质杂交。再一次,所述条形码信息可以通过化学酶促连接或聚合酶延伸来转移。在第二种情况下,蛋白酶消化可以在转移条形码信息后进行。任一种方法的结果都是记录标签标记的蛋白质或肽的集合,其中所述记录标签包括含蛋白质肽在起源组织内的位置的2-D空间信息的条形码。此外,可以表征翻译后修饰的空间分布。该方法提供了灵敏且高度多路复用的原位数字免疫组织化学分析,并且应该形成导致更准确的诊断和预后的现代分子病理学的基础。在另一个实施方案中,可以在细胞内使用空间条形码来鉴定细胞器和细胞隔室内的蛋白成分PTMChristoforou等,2016,Nat.Commun.7:8992,通过引用整体并入。许多方法可用于提供细胞内空间条形码,其可附着于近侧蛋白质。在一个实施方案中,细胞或组织可以是分级到组成细胞器的亚细胞,以及条形码化的不同的蛋白细胞器分级物。其他空间细胞标记方法在Marx,2015,NatMethods12:815-819的综述中描述,其全部内容通过引用并入本文,类似的方法可以在此使用。提供以下实例是为了说明而非限制。示例示例1:用蛋白酶K消化蛋白质样品通过用蛋白酶如胰蛋白酶、蛋白酶K等消化从蛋白样品制备肽文库。胰蛋白酶优选切割如C-末端赖氨酸和精氨酸等带正电荷的氨基酸,而蛋白酶K在所述蛋白非选择性切割。因此,蛋白酶K消化需要使用优选的酶-多肽比例进行仔细滴定以提供足够的蛋白水解以产生短肽~30个氨基酸,但不过度消化所述样品。通常,需要对给定的蛋白酶K批次进行功能活性的滴定。在该实施例中,用蛋白酶K消化蛋白质样品,在1XPBS1mMEDTA0.5mMCaCl20.5%SDSpH8.0中以1:10-1:100ww酶:蛋白质比例37℃下消化1小时。温育后,加入PMSF至终浓度为5mM以抑制进一步消化。蛋白酶K的比活性可以通过将“化学底物”苯甲酰精氨酸-p-nitroanilide与蛋白酶K一起温育并测量在~410nm吸收的黄色p-nitroanilide产物的发展来测量。酶活性以单位测量,其中一个单位等于每分钟产生的1μMp-nitroanilide,并且以酶活性毫克总蛋白质为单位测量比活性。然后通过将所述酶活性除以溶液中蛋白的总量来计算比活性。示例2:使用SP3在珠子上的蛋白酶消化和标记的样品制备如Hughes等人所述,使用SP3样品制备方案提取蛋白质并使其变性,2014,MolSystBiol10:757。提取后,所述蛋白质混合物和珠子于50mM硼酸盐缓冲液补充有0.02%SDS的pH8.0w1mMEDTA中,37℃溶解1小时。在蛋白质溶解后,通过添加DTT至终浓度为5mM来降低二硫键,并在50℃下孵育样品10分钟。通过加入碘乙酰胺至终浓度为10mM使半胱氨酸烷基化,并在黑暗中室温下温育20分钟。将反应物在50mM硼酸盐缓冲液中稀释2倍,并最终蛋白酶:蛋白质比例为1:50ww加入Glu-C或Lys-C。在37℃on~16hrs.温育所述样品以完成消化。在如Hughes等人描述的样品消化后同上,通过加入100%乙腈至终浓度为95%乙腈使所述肽与所述珠子结合,并在8分钟内用乙腈洗涤孵化。洗涤后,通过5分钟的移液管混合步骤将肽从10μl的2%DMSO中的珠上洗脱下来。示例3:所述记录标签与所述肽的偶联DNA记录标签以几种方式与肽偶联参见Aslam等,1998,Bioconjugation:ProteinCouplingTechniquesfortheBiomedicalSciences,MacmillanReferenceLTD;HermansonGT,1996,BioconjugateTechniques,AcademicPressInc.,1996。在一种方法中,寡核苷酸记录标签构建有采用碳二亚胺化学与所述肽的C-末端偶联的5'胺、和内部张紧性炔烃,使用点击化学与叠氮化物珠偶联的DBCO-dTGlenResearch,VA。使用大摩尔过量的记录标签将所述记录标签与溶液中的肽偶联以驱动所述碳二亚胺偶联完成,并限制肽-肽偶联。或者,所述寡核苷酸用5'张紧炔DBCO-dT构建,并与叠氮化物衍生的肽偶联通过叠氮化物-PEG-胺和碳二亚胺偶联至肽的C-末端,并与醛-反应性HyNic肼珠偶联。为此目的,可以用内部醛甲酰基吲哚Trilink基团容易地标记所述记录标签寡核苷酸。或者,所述记录标签不是偶联到C-末端胺,而是偶联到内部赖氨酸残基上优选在Lys-C消化后,或者可选地在Glu-C消化后。在一种方法中,这可以通过用NHS-叠氮化物或NHS-PEG-叠氮化物基团活化所述赖氨酸胺然后偶联到5'胺标记的记录标签来实现。在另一种方法中,5’胺标记的记录标签可以与过量的NHS同源双功能交联剂如DSS反应,以产生5’NHS活化的记录标签。该5’NHS活化的记录标签可以直接与肽的赖氨酸残基的-氨基偶联。示例4:肽上氨基酸的位点特异性标记五个不同蛋白质或多肽上的氨基酸的例子,是能用活化的DNA标签使用异双功能氨基酸位点特异性试剂激活直接修饰的氨基酸,或能通过采用具有点击基团的位点特异性标记氨基酸的点击化学异双功能试剂间接修饰的氨基酸,所述点击基团后来用于附着于所述DNA标签上的同源点击基团Lundblad2014。典型的蛋白质输入包含在含有0.1%RapiGestTMSF表面活性剂和5mMTCEP的50μl适当水性缓冲液中的1μg蛋白质。RapiGestTMSD可用作酸降解表面活性剂,用于将蛋白质变性为多肽以改善标记或消化。可以使用以下氨基酸标记策略:使用马来酰亚胺化学的半胱氨酸---200μMSulfo-SMCC活化的DNA标签用于在100mMMES缓冲液pH6.5+1%TX-100中对半胱氨酸举行1小时的位点特异性标记;使用NHS化学的赖氨酸---200μMDSS或BS3活化的DNA标签用于在硼酸盐缓冲液50mM,pH8.5+1%TX-100中室温下对溶液相蛋白上或珠子结合肽上的赖氨酸进行位点特异性标记;酪氨酸用4-苯基-3H-1,2,4-三唑啉-3,54H-二酮PTAD或重氮化学修饰用于重氮化学,DNA标签用EDC和4-羧基苯重氮四氟硼酸盐活化AikonInternational,中国。通过将所述蛋白质或珠子结合肽与200μM重氮衍生的DNA标签在硼酸盐缓冲液50mM,pH8.5+1%TX-100中,冰上孵育1小时来产生与酪氨酸连接的重氮Nguyen,Caoetal.2015。使用EDC化学修饰天冬氨酸谷氨酸-将胺标记的DNA标签与所述珠子结合肽和pH6.5MES中的100mMEDC50mM咪唑一起在室温下温育1小时Basleetal.,2010,Chem.Biol.17:213-227。标记后,使用来自C4树脂ZipTipsMillipore的蛋白结合洗脱除去过量活化的DNA标签。将洗脱的蛋白加入50μl1XPBS缓冲液中。示例5:将张紧炔烃记录标签标记的肽固定到叠氮活化的珠子上叠氮化物衍生的M-270珠粒通过使市售的胺M-270与叠氮化物PEGNHS酯异双功能接头JenKemTechnology,TX反应生产。此外,叠氮化物的表面密度可以通过混入适当比例甲氧基或羟基PEGNHS酯来滴定。对于给定的肽样品,1-2mg叠氮化物衍生的M-270珠子~1.3x108珠子在100μl硼酸盐缓冲液50mM硼酸钠,pH8.5中稀释,加入1ng记录标签-肽,23-37℃孵育1小时。用200μl硼酸盐缓冲液洗涤3次。示例6:制备醛基吲哚活性HYNIC珠子胺珠子的HyNic衍生化产生醛基吲哚反应性珠子。将等分的20mgM-270胺珠2.8μm珠悬浮于200μl硼酸盐缓冲液中。在短暂超声处理后,加入1-2mgSulfo-S-HyNic琥珀酰亚胺基6-肼基烟酸酯丙酮腙,SANHCatalog#S-1002,Solulink,SanDiego并在室温下震荡反应混合物1小时。然后将所述珠子用硼酸盐缓冲液洗涤2次,用柠檬酸盐缓冲液200mM柠檬酸钠洗涤1次。将所述珠子以终浓度为10mgml悬浮在柠檬酸盐缓冲液中。示例7:将记录标签醛基吲哚标记的肽固定到活化珠子上将等分的1-2mgHyNic活化的M-270珠~1.3×108个珠稀释于补充有50mM苯胺的100μl柠檬酸盐缓冲液中,加入~1ng记录标签肽缀合物并在37℃孵育1小时。所述珠子用200μl柠檬酸盐缓冲液洗涤3次,并重悬于100μl硼酸盐缓冲液中。示例8:寡核苷酸模型系统-通过编码标签的识别信息到循环方式中的记录标签的转移记录结合剂历史对于核酸编码标签和记录标签,可以使用标准核酸酶学的连接或引物延伸将信息从结合的结合剂上的所述编码标签转移到近侧记录标签。这可以用简单的模型系统来证明,该系统由5'部分代表结合剂靶标,3'部分代表所述记录标签的寡核苷酸组成。可以使用点击化学通过dT-炔烃修饰DBCO-dT,GlenResearch将所述寡核苷酸固定在内部位点。在图24A所示的示例中,所述固定的寡核苷酸AB靶标含有两个靶标结合区域,标记的A和B,同源寡核苷酸“结合剂”可与之结合,所述A寡核苷酸和B寡核苷酸。所述A寡核苷酸和B寡核苷酸与编码标签序列和长度不同连接,所述编码标签通过共同的间隔区Sp与所述记录标签相互作用以引发引物延伸或连接。所述Sp的长度应保持短例如,6-9个碱基以最小化结合剂结合期间的非特异性相互作用。在该特定示例中,所述编码标签的长度被设计为通过凝胶分析易于从来自“B”寡核苷酸结合事件20碱基编码序列中区分出“A”寡核苷酸结合事件10碱基编码序列。通过对PAGE凝胶的简单分析,可以测量A或B编码标签转移的效率,并可以轻松优化实验参数。除所述AB靶标序列外,还可以使用类似的寡核苷酸CD靶序列参见图24B,除了C和D是与A和B不相互作用的不同杂交序列。此外,C和D含有不同序列和长度的编码标签,分别包含30碱基DNA编码和40碱基DNA编码。第二靶序列CD的目的是评估AB和CD靶分子之间的交叉相互作用。假设特异性杂交,所述CD靶标的所述延伸记录标签不应包含A或B编码标签信息,除非在连接到与所述AB靶标结合的寡核苷酸的A或B编码标签之间发生分子间交叉。同样,所述AB目标的所述延伸记录标签不应包含C或D编码标签信息。在所述AB和CD靶标物理邻近即95%,脱盐的肽以1mgml~0.5mM重悬于DMSO中。将约50nmol肽100μl加入到反应混合物中,并在室温下温育过夜。如William等人所述,所述得到的DNA记录标签-肽缀合物使用天然PAGE纯化Williams和Chaput2010。在硅化管中缀合物以浓度为100uM重新悬浮于磷酸盐偶联缓冲液中。示例20:用于DNA-肽固定的底物的开发。适于点击化学固定的磁珠通过将M-270胺磁性Dynabeads转化为能够偶联至炔烃或甲基四嗪标记的寡肽缀合物的叠氮化物衍生或TCO衍生的珠子来产生参见例如图29D-E;图30D-E。即,洗涤10mgM-270珠子并重悬于500μl硼酸盐缓冲液100mM硼酸钠,pH8.5中。将TCO-PEG12-120-NHSNanocs和甲基-PEG12-120-NHS的混合物以1mM重悬于DMSO中,并在室温下与M-270胺珠子一起温育过夜。滴定甲基与TCOPEG的比例以调节所述珠子上的最终TCO表面密度,使得ENCODIA有限公司采用核酸编码的大分子分析760229.401WO人工序列PCT2017-05-02US62330,8412016-05-02US62339,0712016-05-19US62376,8862016-08-18180FastSEQforWindowsVersion4.0115DNA人工序列寡核苷酸条形码BC_11atgtctagcatgccg15215DNA人工序列寡核苷酸条形码BC_22ccgtgtcatgtggaa15315DNA人工序列寡核苷酸条形码BC_33taagccggtatatca15415DNA人工序列寡核苷酸条形码BC_44ttcgatatgacggaa15515DNA人工序列寡核苷酸条形码BC_55cgtatacgcgttagg15615DNA人工序列寡核苷酸条形码BC_66aactgccgagattcc15715DNA人工序列寡核苷酸条形码BC_77tgatcttagctgtgc15815DNA人工序列寡核苷酸条形码BC_88gagtcggtaccttga15915DNA人工序列寡核苷酸条形码BC_99ccgcttgtgatctgg151015DNA人工序列寡核苷酸条形码BC_1010agatagcgtaccgga151115DNA人工序列寡核苷酸条形码BC_1111tccaggctcatcatc151215DNA人工序列寡核苷酸条形码BC_1212gagtactagagccaa151315DNA人工序列寡核苷酸条形码BC_1313gagcgtcaataacgg151415DNA人工序列寡核苷酸条形码BC_1414gcggtatctacactg151515DNA人工序列寡核苷酸条形码BC_1515cttctccgaagagaa151615DNA人工序列寡核苷酸条形码BC_1616tgaagcctgtgttaa151715DNA人工序列寡核苷酸条形码BC_1717ctggatggttgtcga151815DNA人工序列寡核苷酸条形码BC_1818actgcacggttccaa151915DNA人工序列寡核苷酸条形码BC_1919cgagagatggtcctt152015DNA人工序列寡核苷酸条形码BC_2020tcttgagagacaaga152115DNA人工序列寡核苷酸条形码BC_2121aattcgcactgtgtt152215DNA人工序列寡核苷酸条形码BC_2222gtagtgccgctaaga152315DNA人工序列寡核苷酸条形码BC_2323cctatagcacaatcc152415DNA人工序列寡核苷酸条形码BC_2424atcaccgaggttgga152515DNA人工序列寡核苷酸条形码BC_2525gattcaacggagaag152615DNA人工序列寡核苷酸条形码BC_2626acgaacctcgcacca152715DNA人工序列寡核苷酸条形码BC_2727aggacttcaagaaga152815DNA人工序列寡核苷酸条形码BC_2828ggttgaatcctcgca152915DNA人工序列寡核苷酸条形码BC_2929aaccaacctctagcg153015DNA人工序列寡核苷酸条形码BC_3030acgcgaatatctaac153115DNA人工序列寡核苷酸条形码BC_3131gttgagaattacacc153215DNA人工序列寡核苷酸条形码BC_3232ctctctctgtgaacc153315DNA人工序列寡核苷酸条形码BC_3333gccatcagtaagaga153415DNA人工序列寡核苷酸条形码BC_3434gcaacgtgaattgag153515DNA人工序列寡核苷酸条形码BC_3535ctaagtagagccaca153615DNA人工序列寡核苷酸条形码BC_3636tgtctgttggaagcg153715DNA人工序列寡核苷酸条形码BC_3737ttaatagacagcgcg153815DNA人工序列寡核苷酸条形码BC_3838cgacgctctaacaag153915DNA人工序列寡核苷酸条形码BC_3939catggcttattgaga154015DNA人工序列寡核苷酸条形码BC_4040actaggtatggccgg154115DNA人工序列寡核苷酸条形码BC_4141gtcctcgtctatcct154215DNA人工序列寡核苷酸条形码BC_4242taggattccgttacc154315DNA人工序列寡核苷酸条形码BC_4343tctgaccaccggaag154415DNA人工序列寡核苷酸条形码BC_4444agagtcacctcgtgg154515DNA人工序列寡核苷酸条形码BC_4545ctgatgtagtcgaag154615DNA人工序列寡核苷酸条形码BC_4646gtcggttgcggatag154715DNA人工序列寡核苷酸条形码BC_4747tcctcctcctaagaa154815DNA人工序列寡核苷酸条形码BC_4848attcggtccacttca154915DNA人工序列寡核苷酸条形码BC_4949ccttacaggtctgcg155015DNA人工序列寡核苷酸条形码BC_5050gatcattggccaatt155115DNA人工序列寡核苷酸条形码BC_5151ttcaaggctgagttg155215DNA人工序列寡核苷酸条形码BC_5252tggctcgattgaatc155315DNA人工序列寡核苷酸条形码BC_5353gtaagccatccgctc155415DNA人工序列寡核苷酸条形码BC_5454acacatgcgtagaca155515DNA人工序列寡核苷酸条形码BC_5555tgctatggattcaag155615DNA人工序列寡核苷酸条形码BC_5656ccacgaggcttagtt155715DNA人工序列寡核苷酸条形码BC_5757ggccaactaaggtgc155815DNA人工序列寡核苷酸条形码BC_5858gcacctattcgacaa155915DNA人工序列寡核苷酸条形码BC_5959tggacacgatcggct156015DNA人工序列寡核苷酸条形码BC_6060ctataattccaacgg156115DNA人工序列寡核苷酸条形码BC_6161aacgtggttagtaag156215DNA人工序列寡核苷酸条形码BC_6262caaggaacgagtggc156315DNA人工序列寡核苷酸条形码BC_6363caccagaacggaaga156415DNA人工序列寡核苷酸条形码BC_6464cgtacggtcaagcaa156515DNA人工序列寡核苷酸条形码BC_6565tcggtgacaggctaa156615DNA人工序列寡核苷酸条形码BC_1REV66cggcatgctagacat156715DNA人工序列寡核苷酸条形码BC_2REV67ttccacatgacacgg156815DNA人工序列寡核苷酸条形码BC_3REV68tgatataccggctta156915DNA人工序列寡核苷酸条形码BC_4REV69ttccgtcatatcgaa157015DNA人工序列寡核苷酸条形码BC_5REV70cctaacgcgtatacg157115DNA人工序列寡核苷酸条形码BC_6REV71ggaatctcggcagtt157215DNA人工序列寡核苷酸条形码BC_7REV72gcacagctaagatca157315DNA人工序列寡核苷酸条形码BC_8REV73tcaaggtaccgactc157415DNA人工序列寡核苷酸条形码BC_9REV74ccagatcacaagcgg157515DNA人工序列寡核苷酸条形码BC_10REV75tccggtacgctatct157615DNA人工序列寡核苷酸条形码BC_11REV76gatgatgagcctgga157715DNA人工序列寡核苷酸条形码BC_12REV77ttggctctagtactc157815DNA人工序列寡核苷酸条形码BC_13REV78ccgttattgacgctc157915DNA人工序列寡核苷酸条形码BC_14REV79cagtgtagataccgc158015DNA人工序列寡核苷酸条形码BC_15REV80ttctcttcggagaag158115DNA人工序列寡核苷酸条形码BC_16REV81ttaacacaggcttca158215DNA人工序列寡核苷酸条形码BC_17REV82tcgacaaccatccag158315DNA人工序列寡核苷酸条形码BC_18REV83ttggaaccgtgcagt158415DNA人工序列寡核苷酸条形码BC_19REV84aaggaccatctctcg158515DNA人工序列寡核苷酸条形码BC_20REV85tcttgtctctcaaga158615DNA人工序列寡核苷酸条形码BC_21REV86aacacagtgcgaatt158715DNA人工序列寡核苷酸条形码BC_22REV87tcttagcggcactac158815DNA人工序列寡核苷酸条形码BC_23REV88ggattgtgctatagg158915DNA人工序列寡核苷酸条形码BC_24REV89tccaacctcggtgat159015DNA人工序列寡核苷酸条形码BC_25REV90cttctccgttgaatc159115DNA人工序列寡核苷酸条形码BC_26REV91tggtgcgaggttcgt159215DNA人工序列寡核苷酸条形码BC_27REV92tcttcttgaagtcct159315DNA人工序列寡核苷酸条形码BC_28REV93tgcgaggattcaacc159415DNA人工序列寡核苷酸条形码BC_29REV94cgctagaggttggtt159515DNA人工序列寡核苷酸条形码BC_30REV95gttagatattcgcgt159615DNA人工序列寡核苷酸条形码BC_31REV96ggtgtaattctcaac159715DNA人工序列寡核苷酸条形码BC_32REV97ggttcacagagagag159815DNA人工序列寡核苷酸条形码BC_33REV98tctcttactgatggc159915DNA人工序列寡核苷酸条形码BC_34REV99ctcaattcacgttgc1510015DNA人工序列寡核苷酸条形码BC_35REV100tgtggctctacttag1510115DNA人工序列寡核苷酸条形码BC_36REV101cgcttccaacagaca1510215DNA人工序列寡核苷酸条形码BC_37REV102cgcgctgtctattaa1510315DNA人工序列寡核苷酸条形码BC_38REV103cttgttagagcgtcg1510415DNA人工序列寡核苷酸条形码BC_39REV104tctcaataagccatg1510515DNA人工序列寡核苷酸条形码BC_40REV105ccggccatacctagt1510615DNA人工序列寡核苷酸条形码BC_41REV106aggatagacgaggac1510715DNA人工序列寡核苷酸条形码BC_42REV107ggtaacggaatccta1510815DNA人工序列寡核苷酸条形码BC_43REV108cttccggtggtcaga1510915DNA人工序列寡核苷酸条形码BC_44REV109ccacgaggtgactct1511015DNA人工序列寡核苷酸条形码BC_45REV110cttcgactacatcag1511115DNA人工序列寡核苷酸条形码BC_46REV111ctatccgcaaccgac1511215DNA人工序列寡核苷酸条形码BC_47REV112ttcttaggaggagga1511315DNA人工序列寡核苷酸条形码BC_48REV113tgaagtggaccgaat1511415DNA人工序列寡核苷酸条形码BC_49REV114cgcagacctgtaagg1511515DNA人工序列寡核苷酸条形码BC_50REV115aattggccaatgatc1511615DNA人工序列寡核苷酸条形码BC_51REV116caactcagccttgaa1511715DNA人工序列寡核苷酸条形码BC_52REV117gattcaatcgagcca1511815DNA人工序列寡核苷酸条形码BC_53REV118gagcggatggcttac1511915DNA人工序列寡核苷酸条形码BC_54REV119tgtctacgcatgtgt1512015DNA人工序列寡核苷酸条形码BC_55REV120cttgaatccatagca1512115DNA人工序列寡核苷酸条形码BC_56REV121aactaagcctcgtgg1512215DNA人工序列寡核苷酸条形码BC_57REV122gcaccttagttggcc1512315DNA人工序列寡核苷酸条形码BC_58REV123ttgtcgaataggtgc1512415DNA人工序列寡核苷酸条形码BC_59REV124agccgatcgtgtcca1512515DNA人工序列寡核苷酸条形码BC_60REV125ccgttggaattatag1512615DNA人工序列寡核苷酸条形码BC_61REV126cttactaaccacgtt1512715DNA人工序列寡核苷酸条形码BC_62REV127gccactcgttccttg1512815DNA人工序列寡核苷酸条形码BC_63REV128tcttccgttctggtg1512915DNA人工序列寡核苷酸条形码BC_64REV129ttgcttgaccgtacg1513015DNA人工序列寡核苷酸条形码BC_65REV130ttagcctgtcaccga1513116PRT人工序列合成肽MOD_RES1甲酰蛋氨酸131MetAspValGluAlaTrpLeuGlyAlaArgValProLeuValGluThr15101513210PRT人工序列合成肽132ThrGluAsnLeuTyrPheGlnAsnHisVal151013320DNA人工序列寡核苷酸引物133aatgatacggcgaccaccga2013424DNA人工序列寡核苷酸引物134caagcagaagacggcatacgagat241355DNA人工序列寡核苷酸misc_feature1…5n=A,T,CorG135nnnnn51368PRT人工序列合成肽136AspTyrLysAspAspAspAspLys1513714PRT人工序列合成肽137GlyLysProIleProAsnProLeuLeuGlyLeuAspSerThr151013810PRT人工序列合成肽138GluGlnLysLeuIleSerGluGluAspLeu15101399PRT人工序列合成肽139TyrProTyrAspValProAspTyrAla151409PRT人工序列合成肽140AsnTrpSerHisProGlnPheGluLys1514182DNA人工序列合成寡核苷酸修饰的碱基1生物素141tttttgcaaatggcattctgacatcccgtagtccgcgacactagatgtctagcatgccgc60cgtgtcatgtggaaactgagtg8214272DNA人工序列合成寡核苷酸修饰的碱基1生物素142ttttttttttgactggttccaattgacaagccgtagtccgcgacactagtaagccggtat60atcaactgagtg7214310DNA人工序列合成寡核苷酸修饰的碱基1生物素修饰的碱基10三碳3C间隔子143tttttttttt1014462DNA人工序列合成寡核苷酸修饰的碱基31…3218-原子六乙二醇间隔子(18-atomhexa-ethyleneglycolspacer)修饰的碱基62三碳3C间隔子144ggatgtcagaatgccatttgcttttttttttcactcagtcctaacgcgtatacgcactca60gt6214563DNA人工序列合成寡核苷酸修饰的碱基31…3218-原子六乙二醇间隔子修饰的碱基63三碳3C间隔子145ggatgtcagaatgccatttgcttttttttttcactcagtcctaacgcgtatacgtcactc60agt6314663DNA人工序列合成的寡核苷酸修饰的碱基31…32五18-原子六乙二醇间隔子修饰的碱基63三碳3C间隔子146ggatgtcagaatgccatttgcttttttttttcactcagtcctaacgcgtatacgtcactc60agt6314771DNA人工序列合成寡核苷酸修饰的碱基25…2618-原子六乙二醇间隔子修饰的碱基63三碳3C间隔子147gcttgtcaattggaaccagtcttttcactcagtcctaacgcgtatacgggaatctcggca60gttcactcagt7114844DNA人工序列合成寡核苷酸修饰的碱基44三碳3C间隔子148cgatttgcaaggatcactcgtcactcagtcctaacgcgtatacg441498DNA人工序列间隔序列149actgagtg81508DNA人工序列间隔序列150cactcagt815118DNA人工序列寡核苷酸引物151cgtagtccgcgacactag1815220DNA人工序列寡核苷酸引物152cgatttgcaaggatcactcg2015321DNA人工序列合成寡核苷酸153gcaaatggcattctgacatcc2115421DNA人工序列合成寡核苷酸154gactggttccaattgacaagc2115523DNA人工序列合成寡核苷酸修饰的碱基23三碳3C间隔子155cgtatacgcgttaggactgagtg2315638DNA人工序列合成寡核苷酸修饰的碱基38三碳3C间隔子156aactgccgagattcccgtatacgcgttaggactgagtg3815746DNA人工序列寡核苷酸引物157agtccgcgcaatcagatgtctagcatgccggatccggatcgatctc4615846DNA人工序列寡核苷酸引物158agtccgcgcaatcagccgtgtcatgtggaagatccggatcgatctc4615946DNA人工序列寡核苷酸引物159agtccgcgcaatcagtaagccggtatatcagatccggatcgatctc4616046DNA人工序列寡核苷酸引物160agtccgcgcaatcagttcgatatgacggaagatccggatcgatctc4616146DNA人工序列寡核苷酸引物161tgcaaggatcactcgccagatcacaagcgggagatcgatccggatc4616246DNA人工序列寡核苷酸引物162tgcaaggatcactcgtccggtacgctatctgagatcgatccggatc4616346DNA人工序列寡核苷酸引物163tgcaaggatcactcggatgatgagcctggagagatcgatccggatc4616446DNA人工序列寡核苷酸引物164tgcaaggatcactcgttggctctagtactcgagatcgatccggatc4616521DNA人工序列寡核苷酸引物165aatcgtagtccgcgcaatcag2116621DNA人工序列寡核苷酸引物166acgatttgcaaggatcactcg2116716DNA人工序列间隔序列167gatccggatcgatctc16168734DNA人工序列延伸记录标签构建体168aatcacggtacaagtcactcatccgtacgctatctgagaatcgtccagatccggcatgct60agtatctggtgcagactacgattgttacagatcactcagatgatgagcacagaaaatcgt120cgaatcttccatcaccatcgaacagttacgattaatgtagtccgcacaatcgaatgtcta180acatgccgaatcccggacgtctccagcttctaaaccaacagtagtcgcacaaatcattgt240acggtacaagatctaacgagagatgatcggatctgaccactttaaacactgattacgcag300actacgattacgatttaagaatcctcgtccggtacaatcatagtccgcacaatcaaccgt360gtcatgtgaagatcagatcgatctcgaatagcgtaccagacagtgatcttgcaaatcgta420atgtgtccgcgccaatcgatagccatgaatcccagtcgatctcccgcttgtgatctggcg480atcgccttgtaccgtcgtacgatttgagatcacctcgttaactcaagctaaagatcgtcc540ggatcgctttataaacatctgattgcgcggtacgattatcgtagtccgcacatatcgaac600ctgttgaagatccggatcgtctctccaggctcatcatccgagtgatccttgcaaataatc660atgtccgcaccatcaggtgtctaacgcttgccggatccgaatcgatctctccaggctcat720catcgaagtgatgt73416910PRT人工序列合成肽169CysProValGlnLeuTrpValAspSerThr151017010PRT人工序列合成肽VARIANT1…10Xaa=AnyAminoAcid170CysProXaaGlnXaaTrpXaaAspXaaThr15101718PRT人工序列FLAG表位肽171AspTyrLysAspAspAspAspLys1517214PRT人工序列V5表位肽172GlyLysProIleProAsnProLeuLeuGlyLeuAspSerThr151017310PRT人工序列c-Myc表位肽173GluGlnLysLeuIleSerGluGluAspLeu15101749PRT人工序列HA表位肽174TyrProTyrAspValProAspTyrAla1517514PRT人工序列V5表位肽175GlyLysProIleProAsnProLeuLeuGlyLeuAspSerThr15101769PRT人工序列StrepTagII肽176AsnTrpSerHisProGlnPheGluLys1517736DNA人工序列合成核苷酸misc_feature11…22compartmentbarcoden=A,C,T,orGmisc_feature23…27独特分子标识符;n=A,T,CorG177gcgcaatcagnnnnnnnnnnnnnnnnntgcaaggat3617812DNA人工序列合成核苷酸misc_feature1…12间隔条码n=A,T,CorG178nnnnnnnnnnnn121795DNA人工序列合成核苷酸misc_feature1…5独特分子标识符;n=A,T,CorG179nnnnn518010PRT人工序列butelaseI肽底物180CysGlyGlySerSerGlySerAsnHisVal1510

权利要求:1.一种分析大分子的方法,包括以下步骤:a提供大分子和连接在固体支持物上的相关记录标签;b使所述大分子与能够结合所述大分子的第一结合剂接触,其中所述第一结合剂包含具有关于所述第一结合剂的识别信息的第一编码标签;c将所述第一编码标签的信息传递到所述记录标签,以产生第一次序延伸记录标签;d使所述大分子与能够结合所述大分子的第二结合剂接触,其中所述第二结合剂包含具有所述第二结合剂的识别信息的第二编码标签;e将所述第二编码标签的信息传递到第一次序延伸记录标签以产生第二次序延伸记录标签;以及f分析所述第二次序延伸记录标签。2.根据权利要求1所述的方法,其中接触步骤b和d按顺序进行。3.根据权利要求1所述的方法,其中接触步骤b和d同时进行。4.根据权利要求1所述的方法,还包括在步骤e和f之间的以下步骤:x采用能够结合所述大分子的第三或更高次序结合剂替换所述第二结合剂以重复步骤d和e一次或多次,其中所述第三或更高次序结合剂包含具有第三或更高次序结合剂的识别信息的第三或更高次序的编码标签;和y将所述第三或更高次序编码标签的信息传递到所述第二或更高次序延伸记录标签,以产生第三或更高次序延伸记录标签;并且其中在步骤f中分析所述第三或更高次序延伸记录标签。5.一种分析大分子的方法,包括以下步骤:a提供大分子,相关的第一记录标签和连接到固体支持物的相关第二记录标签;b使所述大分子与能够结合所述大分子的第一结合剂接触,其中所述第一结合剂包含具有关于所述第一结合剂的识别信息的第一编码标签;c将所述第一编码标签的信息传递到所述第一记录标签以产生第一次序延伸记录标签;d使所述大分子与能够结合所述大分子的第二结合剂接触,其中所述第二结合剂包含具有所述第二结合剂的识别信息的第二编码标签;e将所述第二编码标签的信息传递到所述第二记录标签以产生第二次序延伸记录标签;f分析所述第一和第二延伸记录标签。6.根据权利要求5所述的方法,其中接触步骤b和d按顺序进行。7.根据权利要求5所述的方法,其中接触步骤b和d同时进行。8.根据权利要求5所述的方法,步骤a还包括提供与所述固体支持物连接的相关的第三或更高次序段记录标签。9.根据权利要求8所述的方法,还包括在步骤e和f之间的以下步骤:x通过采用能够结合所述大分子的第三或更高次序结合剂替换所述第二结合剂以重复步骤d和e一次或多次,其中所述第三或更高次序结合剂包含具有第三或更高次序结合剂的识别信息的第三或更高次序的编码标签;和y将所述第三或更高次序编码标签的信息传递到所述第三或更高次序记录标签,以产生第三或更高次序延伸记录标签;并且其中在步骤f中分析第一、第二和第三或更高次序延伸记录标签。10.根据权利要求5-9任一所述的方法,其中所述第一编码标签、第二编码标签和任何更高次序编码标签包含结合的循环特异性间隔序列。11.一种分析肽的方法,包含以下步骤:a提供肽和连接在固体支持物上的相关的记录标签;b用化学试剂修饰所述肽的N-末端氨基酸NTAA;c使所述肽与能够结合所述修饰的NTAA的第一结合试剂接触,其中所述第一结合试剂包含具有所述第一结合试剂的识别信息的第一编码标签;d将所述第一编码标签的信息传递到所述记录标签以产生一个延伸记录标签;并且e分析所述延伸记录标签。12.根据权利要求第11所述的方法,其中步骤c还包括使所述肽与包含第二或更高次序编码标签的第二或更高次序结合剂接触,所述第二或更高次序编码标签具有第二或更高次序结合剂的识别信息,其中第二或更高次序结合剂能够结合除步骤b的修饰的NTAA之外的修饰的NTAA。13.根据权利要求12所述的方法,其中在所述肽与所述第一结合剂接触后,接着使所述肽与第二或更高次序结合剂接触。14.根据权利要求12所述的方法,其中所述肽与第二或更高次序结合剂接触跟所述肽与所述第一结合剂接触同时发生。15.根据权利要求11-14任一所述的方法,其中所述化学试剂是异硫氰酸酯衍生物、2,4-二硝基苯磺酸DNBS、4-磺酰基-2-硝基氟苯SNFB1-氟-2、4-二硝基苯、丹磺酰氯、7-甲氧基香豆素乙酸、硫代酰化试剂、硫代乙酰化试剂或硫代苄基化试剂。16.一种分析肽的方法,包含以下步骤:a提供肽和连接在固体支持物上的相关的记录标签;b用化学试剂修饰所述肽的N-末端氨基酸NTAA以产生修饰的NTAA;c使所述肽与能够结合所述修饰的NTAA的第一结合试剂接触,其中所述第一结合试剂包含具有所述第一结合试剂的识别信息的第一编码标签;d将第一编码标签的信息传递到所述记录标签以产生第一次序延伸记录标签;e移除修饰的NTAA以暴露新的NTAA;f采用化学试剂修饰所述新的NTAA以产生新的修饰的NTAA;g使所述肽与能够结合所述修饰的NTAA的第二结合剂接触,其中所述第二结合剂包含具有所述第二结合剂的识别信息的第二编码标签;h将所述第二编码标签的信息传送到所述第一次序延伸记录标签以产生第二次序延伸记录标签;以及i分析所述第二延伸记录标签。17.一种分析肽的方法,包含以下步骤:a提供肽和连接在固体支持物上的相关的记录标签;b使所述肽与能够结合所述肽的N-末端氨基酸NTAA的第一结合试剂接触,其中所述第一结合试剂包含具有所述第一结合试剂的识别信息的第一编码标签;c将所述第一编码标签的信息传递到所述记录标签以产生一个延伸记录标签;并且d分析所述延伸记录标签。18.根据权利要求第17所述的方法,其中步骤b还包括使所述肽与包含第二或更高次序编码标签的第二或更高次序结合剂接触,所述第二或更高次序编码标签具有第二或更高次序结合剂的识别信息,其中第二或更高次序结合剂能够结合除所述肽的所述NTAA之外的NTAA。19.根据权利要求18所述的方法,其中在所述肽与所述第一结合剂接触后,接着使所述肽与第二或更高次序结合剂接触。20.根据权利要求18所述的方法,其中所述肽与第二或更高次序结合剂接触跟所述肽与所述第一结合剂接触同时发生。21.一种分析肽的方法,包含以下步骤:a提供肽和连接在固体支持物上的相关的记录标签;b使所述肽与能够结合所述肽的N-末端氨基酸NTAA的第一结合试剂接触,其中所述第一结合试剂包含具有所述第一结合试剂的识别信息的第一编码标签;c将第一编码标签的信息传递到所述记录标签以产生第一次序延伸记录标签;d移除所述肽的NTAA以露出新的NTAA;e使所述肽与能够结合所述新的NTAA的第二结合剂接触,其中所述第二结合剂包含具有所述第二结合剂的识别信息的第二编码标签;h将所述第二编码标签的信息传递到所述第一次序延伸记录标签以产生第二次序延伸记录标签;以及i分析所述第二延伸记录标签。22.根据权利要求1-10任一所述的方法,其中所述大分子是蛋白、多肽或肽。23.根据权利要求1-10任一所述的方法,其中所述大分子是肽。24.根据权利要求11-23任一所述的的方法,其中所述肽是通过碎片化来自生物样品的蛋白而获得。25.根据权利要求1-10任一所述的方法,其中所述大分子是脂质、碳水化合物或大环。26.根据权利要求1-25任一所述的方法,其中所述记录标签是DNA分子、具有假互补碱基的DNA、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子或其组合。27.根据权利要求1-26任一所述的方法,其中所述记录标签包含通用引发位点。28.根据权利要求27所述的方法,其中所述通用引发位点包含用于扩增、测序或二者的引发位点。29.根据权利要求1-28任一所述的方法,其中所述记录标签包含独特分子标识符UMI。30.根据权利要求1-29任一所述的方法,其中所述记录标签包含条形码。31.根据权利要求1-30任一所述的方法,其中所述记录标签在其3’-末端包含间隔子。32.根据权利要求1-31任一所述的方法,其中所述大分子和所述相关的记录标签共价结合到所述固体支持物上。33.根据权利要求1-32任一所述的方法,所述固体支持物是珠子、多孔珠子、多孔基质、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶芯片、流通芯片、含信号转导电子器件的生物芯片、微量滴定孔、ELISA板、旋转干涉测量盘、硝酸纤维素膜、硝化纤维素基聚合物表面、纳米颗粒或微球。34.根据权利要求33所述的方法,其中所述固体支持物是聚苯乙烯珠子、聚合物珠子、琼脂糖珠子、丙烯酰胺珠子、固体核心珠子、多孔珠子、顺磁珠子、玻璃珠子或可控孔珠子。35.根据权利要求1-34任一所述的方法,其中所述多个大分子和相关的记录标签结合到所述固体支持物上。36.根据权利要求35所述的方法,其中所述多个大分子在所述固体支持物上以50nm的平均距离间隔开。37.根据权利要求1-36任一所述的方法,其中所述结合剂是多肽或蛋白。38.根据权利要求37所述的方法,其中所述结合剂是修饰的氨肽酶、修饰的氨酰tRNA合成酶、修饰的anticalin或者修饰的ClpS。39.根据权利要求1-38任一所述的方法,所述结合剂能够选择性地结合所述大分子。40.根据权利要求1-39任一所述的方法,其中所述编码标签是DNA分子、RNA分子、BNA分子、XNA分子、LNA分子、PNA分子、γPNA分子或其组合。41.根据权利要求1-40任一所述的方法,其中所述编码标签包含编码器序列。42.根据权利要求1-41任一的方法,其中所述编码标签还包含间隔子、结合循环特异性序列、独特分子标识符、通用引发位点、或它们的任何组合。43.根据权利要求1-42任一所述的方法,其中所述结合剂和所述编码标签通过接头连接。44.根据权利要求1-42任一的方法,其中所述结合剂和所述编码标签通过SpyTagSpyCatcher或SnoopTagSnoopCatcher肽-蛋白质对连接。45.根据权利要求1-44任一所述的方法,其中所述记录标签到编码标签的信息传递通过DNA连接酶介导。46.根据权利要求1-44任一所述的方法,其中所述记录标签到编码标签的信息传递通过DNA合成酶介导。47.根据权利要求1-44任一所述的方法,其中所述记录标签到编码标签的信息传递通过化学连接介导。48.根据权利要求1-47任一所述的方法,分析所述延伸记录标签包含核苷酸测序方法。49.权利要求48所述的方法,其中所述核酸测序方法是通过合成测序、连接测序、杂交测序、polony测序、离子半导体测序,或焦磷酸测序。50.根据权利要求48所述的方法,其中所述核酸测序方法是单分子实时测序、基于纳米孔的测序或采用高级显微镜的DNA直接成像。51.根据权利要求1-50任一所述的方法,其中在分析前扩增所述延伸记录标签。52.根据权利要求1-51任一所述的方法,其中包含于所述延伸记录标签中的所述编码标签信息的次序,提供关于结合到所述大分子的所述结合剂的结合次序的信息。53.根据权利要求1-52任一所述的方法,其中包含于所述延伸记录标签中的所述编码标签信息的频率,提供关于结合到所述大分子的所述结合剂的结合频率的信息。54.根据权利要求1-53任一所述的方法,其中代表多个大分子的多个延伸记录标签被平行分析。55.根据权利要求54所述的方法,其中代表多个大分子的多个延伸记录标签在一个多路复用测定中分析。56.根据权利要求1-55任一所述的方法,其中在分析之前所述多个延伸记录标签经过靶标丰度检测。57.根据权利要求1-56任一所述的方法,其中所述多个延伸记录标签在分析之前经过扣减法分析。58.根据权利要求1-57任一所述的方法,其中所述多个延伸记录标签在分析之前进行标准化分析以降低高丰度种类。59.根据权利要求1-58任一所述的方法,其中所述NTAA采用修饰的氨肽酶、修饰的氨基酸tRNA合成酶、温和型埃德曼降解、埃德曼酶或无水TFA来移除。60.根据权利要求1-59任一所述的方法,其中至少一种结合剂结合到末端氨基酸残基。61.根据权利要求1-60任一所述的方法,其中至少一种结合剂结合到翻译后修饰的氨基酸。62.一种分析来自于包含多个蛋白复合体、蛋白、或多肽的样本的一个或多个肽的方法,所述方法包含:a将样品内的多个蛋白质复合物、蛋白质或多肽分区成多个隔室,其中每个隔室包括多个隔室标签,其任选地连接到固体支持物,其中在单个隔室内的所述多个隔室标签是相同的,且不同于其他隔室的隔室标签;b将多种蛋白质复合物、蛋白质和或多肽片段化成多个肽;c在足以允许所述多个肽与所述多个隔室内的多个隔室标签退火或连接的条件下,使所述多个肽与所述多个隔室标签接触,从而产生多个隔室标记的肽;d从所述多个隔室收集隔室标记的肽;并且e根据第1-21以及第26-61任一所述的方法分析一个或多个隔室标记的肽。63.根据权利要求62所述的方法,所述隔室是微流体液滴。64.根据权利要求62所述的方法,所述隔室是微孔。65.根据权利要求62所述的方法,所述隔室是平面上的分隔区域。66.根据权利要求62-65任一所述的方法,其中每一个隔室平均包含一个单独的细胞。67.一种分析来自于包含多个蛋白复合体、蛋白或多肽的样本的一个或多个肽的方法,所述方法包含:a用多个通用DNA标签标记多种蛋白质复合物、蛋白或多肽;b将样品内的多个蛋白复合物、蛋白或多肽分区成多个隔室,其中每个隔室包括多个隔室标签,其中在单个隔室内的多个隔室标签是相同的,且不同于其他隔室的隔室标签;c在足以允许所述多个肽与所述多个隔室内的所述多个隔室标签退火或连接的条件下,使所述多个蛋白复合物、蛋白、或多肽与所述多个隔室标签接触,从而产生多个隔室标记的蛋白复合物、蛋白或多肽;d从所述多个隔室收集隔室标记的蛋白复合物、蛋白或多肽;e任选地将隔室标记的蛋白复合物、蛋白或多肽片段化成隔室标记的肽;和f根据第1-21以及第26-61任一所述的方法分析一个或多个隔室标记的肽。68.根据权利要求26-67任一所述的方法,其中所述隔室标签信息通过引物延伸或连接传递到与肽相关的记录标签。69.根据权利要求62-68任一所述的方法,其中所述固体支撑物是珠子。70.根据权利要求69所述的方法,其中所述珠子是聚苯乙烯珠子、聚合物珠子、琼脂糖珠子、丙烯酰胺珠子、固体核心珠子、多孔珠子、顺磁珠子、玻璃珠子或可控孔珠子。71.根据权利要求62-70任一所述的方法,其中所述隔室标签包含单链或双链核苷酸分子。72.根据权利要求62-71任一所述的方法,其中所述隔室标签包含条形码和可选的UMI。73.根据权利要求72所述的方法,其中所述固体支持物是珠子,且所述隔室标签包含条形码,进一步其中包含多个隔室标签连接到其上的珠子通过分开-合并形成。74.根据权利要求72所述的方法,其中所述固体支持物是珠子,且所述隔室标签包含条形码,进一步其中包含多个隔室标签连接到其上的珠子通过单个合成或固定化形成。75.根据权利要求62-74任一所述的方法,其中所述间隔标签是记录标签中的成分,所述记录标签任选地还包含间隔、独特分子标识符、通用引发位点或它们的任何组合。76.根据权利要求62-75任一所述的方法,其中所述间隔标签还包含能够与所述多个蛋白复合体、蛋白或多肽的内部氨基酸或N-末端氨基酸反应的功能基团。77.根据权利要求76所述的方法,所述功能基团是NHS基。78.根据权利要求76所述的方法,其中所述功能基团是醛基。79.根据权利要求62-78任一所述的方法,所述多个隔室标签通过以下步骤形成:打印、点样,将隔室标签喷墨到隔室中,或它们的组合。80.根据权利要求62-69任一所述的方法,其中所述隔室标签还包含肽。81.根据权利要求80所述的方法,其中所述隔室标签还包含蛋白连接酶识别序列。82.根据权利要求81所述的方法,所述蛋白连接酶是ButelaseI或其同源物。83.根据权利要求62-82任一所述的方法,其中所述多个多肽采用蛋白酶片段化。84.根据权利要求83所述的方法,所述蛋白酶是金属蛋白酶。85.根据权利要求84所述的方法,其中所述金属蛋白酶的活性通过金属阳离子的光子激发释放来调节。86.根据权利要求62-85任一所述的方法,还包含在将所述多个多肽分区成多个隔室之前,从样品中扣除一种或多种高丰度蛋白。87.根据权利要求62-86任一所述的方法,还包含在将所述多个肽联合到所述隔室标签之前,从所述固体支持物上释放所述隔室标签。88.根据权利要求62所述的方法,还包括以下步骤d,将所述隔室标记的肽连接到与记录标签相关的固体支持物上。89.根据权利要求88所述的方法,还包含将所述隔室标记的肽上的所述隔室标签的信息传递到所述相关的记录标签。90.根据权利要求89所述的方法,还包含在步骤e之前,将所述隔室标签从所述隔室标记的肽上移除。91.根据权利要求62-89任一所述的方法,还包括基于所述分析的肽的隔室标签序列来确定所分析的肽的来源单细胞的身份。92.根据权利要求62-90任一所述的方法,还包括基于所述分析的肽的隔室标签序列来确定所分析的肽的来源蛋白或蛋白复合体的身份。93.分析多个大分子的方法,包括以下步骤:a提供多个大分子和连接在固体支持物上的相关记录标签;b使所述多个大分子与能够结合所述多个大分子的多个结合剂接触,其中每个结合剂包含具有所述结合剂的识别信息的编码标签;ci将所述大分子相关记录标签的信息传递到与大分子结合的结合剂的所述编码标签,以产生延伸编码标签;或ii将大分子相关记录标签和结合到所述大分子的结合剂的编码标签的信息传递到di-tag构建体;d收集隔所述延伸编码标签或di-tag构建体;e任选地重复步骤b-d一个或多个结合循环;f分析所述延伸编码标签或di-tag构建体的集合物。94.根据权利要求93所述的方法,其中所述大分子是蛋白。95.根据权利要求93所述的方法,其中所述大分子是肽。96.根据权利要求95所述的方法,其中所述肽是通过片段化分离自生物样品的蛋白获得。97.根据权利要求93-96任一所述的方法,其中所述记录标签是DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子或其组合。98.根据权利要求93-97任一所述的方法,其中所述的记录标签包含独特分子标识符UMI。99.根据权利要求93-98任一所述的方法,其中所述记录标签包含隔室标签。100.根据权利要求93-99任一所述的方法,其中所述记录标签包含通用引发位点。101.根据权利要求93-100任一所述的方法,其中所述记录标签在其3'-末端包含间隔子。102.根据权利要求93-101任一所述的方法,其中封闭所述记录标签的3'-末端以防止所述记录标签通过合成酶延伸并且将所述大分子相关记录标签的信息和结合到所述大分子的结合剂的编码标签的信息传递到di-tag构建体。103.根据权利要求93-102任一所述的方法,其中所述编码标签包含编码器序列。104.根据权利要求93-103任一所述的方法,其中所述编码标签包含UMI。105.根据权利要求93-104任一所述的方法,其中所述编码标签包含通用引发位点。106.根据权利要求93-105任一所述的方法,其中所述编码标签在其3'-端包含间隔子。107.根据权利要求93-106任一所述的方法,其中所述编码标签包含结合循环特异性序列。108.根据权利要求93-107任一所述的方法,其中所述结合剂和所述编码标签通过接头连接。109.根据权利要求93-108任一所述的方法,其中所述记录标签到编码标签的信息传递通过引物延伸实现。110.根据权利要求93-108任一所述的方法,其中所述记录标签到编码标签的信息传递通过连接实现。111.根据权利要求93-108任一所述的方法,其中所述di-tag构建体是通过间隙填充、引物延伸或它们二者产生。112.根据权利要求93-97、107、108和111任一所述的方法,其中所述di-tag分子包含衍生自所述记录标签的通用引发位点、衍生自所述记录标签的隔室标签,衍生自所述记录标签的隔室标签、衍生自所述记录标签的独特分子标识符、衍生自所述记录标签的可选间隔子、衍生自所述编码标签的编码序列、衍生自编码标签的独特分子标识符、衍生自编码标签的可选间隔子、和衍生自编码标签的通用引发位点。113.根据权利要求93-112任一所述的方法,其中所述大分子和相关的记录标签共价结合到所述固体支持物上。114.根据权利要求113所述的方法,其中所述固体支持物是珠子、多孔珠子、多孔基质、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶芯片、流通芯片、包括信号转导电子器件的生物芯片、微量滴定孔、ELISA板、旋转干涉测量盘、硝酸纤维素膜、硝化纤维素基聚合物表面、纳米颗粒或微球。115.根据权利要求114所述的方法,其中所述固体支持物是聚苯乙烯珠子、聚合物珠子、琼脂糖珠子、丙烯酰胺珠子、固体核心珠子、多孔珠子、顺磁珠子、玻璃珠子或可控孔珠子。116.根据权利要求93-115任一所述的方法,其中所述结合剂是多肽或蛋白。117.根据权利要求116所述的方法,其中所述结合剂是修饰的氨肽酶、修饰的氨酰tRNA合成酶、修饰的anticalin或者抗体或抗体的结合片段。118.根据权利要求95-117任一所述的方法,其中所述结合剂结合单个氨基酸残基、二肽、三肽或肽的翻译后修饰。119.根据权利要求118所述的方法,其中所述结合剂结合N-末端氨基酸残基、C-末端氨基酸残基或内部氨基酸残基。120.根据权利要求118所述的方法,其中所述结合剂结合N-末端肽、C-末端肽或内部肽。121.权利要求119所述的方法,其中所述结合剂与N-末端氨基酸残基结合,并且在每个结合循环后切割N-末端氨基酸残基。122.根据权利要求119所述的方法,其中所述结合剂与C-末端氨基酸残基结合,并且在每个结合循环后切割C-末端氨基酸残基。123.根据权利要求121所述的方法,其中所述N末端氨基酸残基通过Edman降解法切割。124.根据权利要求93所述的方法,其中所述的结合剂是氨基酸或翻译后修饰的位点特异性共价标签。125.根据权利要求93-124任一所述的方法,其中所述在步骤b之后,将包含大分子和相关结合剂的复合物从固体支持物上解离并分散成液滴或微流体液滴乳液。126.根据权利要求125所述的方法,其中每个微流体液滴,平均而言,都包含一个含所述大分子和所述结合剂的复合物。127.根据权利要求125或126所述的方法,其中所述的记录标签在产生延伸编码标签或di-tag构建体之前扩增。128.根据权利要求125-127任一所述的方法,其中所述的乳液融合PCR用于将所述记录标签信息传递到所述编码标签或创建一组di-tag构建体。129.根据权利要求93-128任一项所述的方法,其中所述的延伸编码标签或di-tag构建体的集合是在分析之前扩增的。130.根据权利要求93-129任一所述的方法,其中分析所述延伸编码标签或di-tag构建体的集合包含核酸测序方法。131.根据权利要求130所述的方法,其中所述核酸测序方法是通过合成测序、连接测序、杂交测序、polony测序、离子半导体测序或焦磷酸测序。132.根据权利要求130所述的方法,其中所述核酸测序方法是单分子实时测序、基于纳米孔的测序或采用高级显微镜的DNA的直接成像。133.根据权利要求130所述的方法,其中所述大分子的部分组成是通过采用特异性隔室标签或可选地UMI分析多个延伸编码标签或di-tag标签构建体来确定的。134.根据权利要求1-133任一所述的方法,其中所述分析步骤用具有每碱基错误率5%、10%、15%、20%、25%或30%的测序方法进行。135.根据权利要求1-134任一所述的方法,其中所述的编码标签、记录标签或两者的识别元件包括纠错码。136.根据权利要求135所述的方法,其中所述识别元件选自编码器序列、条形码、UMI、隔室标签、循环特异性序列或其任何组合。137.根据权利要求135或136所述的方法,其中所述的纠错码,选自汉明码、李距离码、非对称李距离码、里德-所罗门码和Levenshtein-Tenengolts码。138.根据权利要求1-134任一所述的方法,其中所述的编码标签、记录标签或两者的识别元件能够产生独特的电流或离子通量或光学特征,其中所述的分析步骤包含检测所述独特的电流或离子通量或光学特征以识别所述识别元件。139.根据权利要求138所述的方法,其中所述识别元件选自编码器序列、条形码、UMI、隔室标签、循环特异性序列或其任何组合。140.分析多个大分子的方法,包括以下步骤:a提供多个大分子和连接在固体支持物上的相关记录标签;b使所述多个大分子与能够结合同源大分子的多个结合剂接触,其中每个结合剂包含具有所述结合剂的识别信息的编码标签;c将第一结合剂的第一编码标签的信息转移到与第一大分子相关的第一记录标签,以产生第一次序扩延伸记录标签,其中所述第一结合剂与所述第一大分子结合;d使所述多个大分子与能够结合同源大分子的多个结合剂接触;e将第二结合剂的第二编码标签的信息转移到第一次序延伸记录标签,以产生第二次序延伸记录标签,其中所述第二结合剂结合所述第一大分子;f任选地重复步骤d–e“n”个结合循环,其中将结合到第一大分子的每个结合剂的每个编码标签的信息转移到前一个结合循环产生的所述延伸记录标签,以产生代表所述第一个大分子的第n次序延伸记录标签;g分析所述第n次序延伸记录标签。141.根据权利要求140所述的方法,其中生成并分析表示多个大分子的多个第n次序延伸记录标签。142.根据权利要求140或141所述的方法,其中所述的大分子是蛋白。143.根据权利要求142所述的方法,其中所述大分子是肽。144.根据权利要求143所述的方法,其中所述肽是通过碎片化生物样品的蛋白而获得的。145.根据权利要求140至144任一所述的方法,其中所述多个大分子包含来自复合的、汇集的样品的大分子。146.根据权利要求140-145任一所述的方法,其中所述记录标签是DNA分子、RNA分子、PNA分子、BNA分子、XNA分子、LNA分子、γPNA分子或其组合。147.根据权利要求140-146任一所述的方法,其中所述的记录标签包含独特分子标识符UMI。148.根据权利要求140-147任一所述的方法,其中所述记录标签包含隔室标签。149.根据权利要求140-148任一所述的方法,其中所述记录标签包含通用引发位点。150.根据权利要求140-149任一所述的方法,其中所述记录标签在其3'-末端包含间隔子。151.根据权利要求140-150任一所述的方法,其中所述编码标签包含编码器序列。152.根据权利要求140-151任一所述的方法,其中所述编码标签包含UMI。153.根据权利要求140-152任一所述的方法,其中所述编码标签包含通用引发位点。154.根据权利要求140-153任一所述的方法,其中所述编码标签在其3'-端包含间隔子。155.根据权利要求140-154任一所述的方法,其中所述编码标签包含结合循环特异性序列。156.根据权利要求140-155任一所述的方法,其中所述编码标签包含独特分子标识符。157.根据权利要求140-156任一所述的方法,其中所述结合剂和所述编码标签通过接头连接。158.根据权利要求140-157任一所述的方法,其中所述记录标签到所述编码标签的信息转移通过引物延伸介导。159.根据权利要求140-158任一所述的方法,其中所述记录标签到编码标签的信息转移通过连接介导。160.根据权利要求140-159任一所述的方法,其中所述多个大分子、相关的记录标签,或者两者都共价结合到所述固体支持物上。161.根据权利要求140-160任一所述的方法,所述固体支持物是珠子、多孔珠子、多孔基质、阵列、玻璃表面、硅表面、塑料表面、过滤器、膜、尼龙、硅晶芯片、流通芯片、包括信号转导电子器件的生物芯片、微量滴定孔、ELISA板、旋转干涉测量盘、硝酸纤维素膜、硝化纤维素基聚合物表面、纳米颗粒或微球。162.根据权利要求161所述的方法,其中所述固体支持物是聚苯乙烯珠子、聚合物珠子、琼脂糖珠子、丙烯酰胺珠子、固体核心珠子、多孔珠子、顺磁珠子、玻璃珠子或可控孔珠子。163.根据权利要求140-162任一所述的方法,其中所述结合剂是多肽或蛋白。164.根据权利要求163所述的方法,其中所述结合剂是修饰的氨肽酶、修饰的氨酰tRNA合成酶、修饰的anticalin或者抗体或抗体的结合片段。165.根据权利要求142-164任一所述的方法,其中所述结合剂结合单个氨基酸残基、二肽、三肽或肽的翻译后修饰。166.根据权利要求165所述的方法,其中所述结合剂结合N-末端氨基酸残基、C-末端氨基酸残基或内部氨基酸残基。167.根据权利要求165所述的方法,其中所述结合剂结合N-末端肽、C-末端肽或内部肽。168.根据权利要求142-164任一所述的方法,其中所述结合剂结合修饰的N-末端氨基酸残基的化学标签、修饰的C-末端氨基酸残基,或修饰的内部氨基酸残基。169.根据权利要求166或168所述的方法,其中所述结合剂结合所述N-末端氨基酸残基或所述修饰的N-末端氨基酸残基的所述化学标签,并且所述N-末端氨基酸残基在每个结合循环后被切割。170.根据权利要求166或168所述的方法,其中所述结合剂结合所述C-末端氨基酸残基或所述修饰的C-末端氨基酸残基的所述化学标签结合,并且所述C-末端氨基酸残基在每个结合循环后被切割。171.根据权利要求169所述的方法,其中所述的N-末端氨基酸残基通过Edman降解法、埃德曼酶、修饰的氨基肽酶、或修饰的酰基肽水解酶切割。172.根据权利要求163所述的方法,其中所述的结合剂是氨基酸或翻译后修饰的位点特异性共价标签。173.根据权利要求140-172任一所述的方法,其中所述多个n次序延伸记录标签在分析之前扩增。174.根据权利要求140-173任一所述的方法,其中分析所述第n次序延伸记录标签包含核酸测序方法。175.根据权利要求174所述的方法,其中代表多个大分子的多个第n次序延伸记录标签被平行分析。176.根据权利要求174或175所述的方法,其中所述核酸测序方法是通过合成测序、连接测序、杂交测序、polony测序、离子半导体测序或焦磷酸测序。177.根据权利要求174或175所述的方法,其中核酸测序方法是单分子实时测序、基于纳米孔的测序或采用高级显微镜的DNA的直接成像。

百度查询: ENCODIA有限公司 采用核酸编码的大分子分析

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。