以下是针对表观遗传学测序技术(BS测序、ATAC-seq、DAP-seq)的详细介绍,涵盖原理、实验流程、数据分析及应用场景:
1. 表观测序(Epigenomic Sequencing)概述
表观遗传学研究不改变DNA序列的基因表达调控机制,主要包括DNA甲基化、染色质开放性和蛋白质-DNA互作等。相关测序技术如下:
2. BS测序(Bisulfite Sequencing)
原理
-
通过亚硫酸氢盐处理DNA,将未甲基化的胞嘧啶(C)转化为尿嘧啶(U),而甲基化C保持不变,测序后识别甲基化位点。
-
全基因组BS测序(WGBS):覆盖全基因组甲基化,单碱基分辨率。
-
简化代表性BS测序(RRBS):富集CpG密集区域,降低成本。
实验流程
-
DNA处理:亚硫酸氢盐转化→纯化。
-
建库测序:Illumina平台(需双端测序)。
-
数据分析:
-
比对(Bismark、BSMAP)。
-
甲基化水平计算(甲基化率 = 支持甲基化的reads数/总reads数)。
-
应用场景
-
癌症甲基化标志物筛查(如抑癌基因启动子高甲基化)。
-
发育生物学(如胚胎发育过程中的甲基化重编程)。
优缺点
-
优点:单碱基精度、全基因组覆盖。
-
缺点:亚硫酸盐处理导致DNA降解,需高深度测序(≥30X)。
3. ATAC-seq(Assay for Transposase-Accessible Chromatin using Sequencing)
原理
-
利用Tn5转座酶切割开放染色质区域,测序分析染色质可及性(开放区域通常为调控元件)。
实验流程
-
细胞处理:裂解细胞核→Tn5酶切→片段回收。
-
建库测序:PCR扩增后Illumina测序(50 bp短读长)。
-
数据分析:
-
峰值检测(MACS2)。
-
注释到启动子/增强子(HOMER)。
-
应用场景
-
鉴定细胞类型特异性调控元件(如神经元分化中的开放染色质动态)。
-
结合转录组(RNA-seq)揭示基因表达调控机制。
优缺点
-
优点:所需细胞量少(500~50,000个细胞),高灵敏度。
-
缺点:易受线粒体DNA污染(需生物信息学过滤)。
4. DAP-seq(DNA Affinity Purification Sequencing)
原理
-
体外表达转录因子(TF)并与基因组DNA片段孵育,通过亲和纯化富集TF结合位点后测序。
实验流程
-
TF表达:原核系统(如E. coli)表达带标签(如His-tag)的TF。
-
DNA结合:与基因组DNA片段孵育→磁珠纯化结合DNA。
-
测序分析:比对峰值(类似ChIP-seq)。
应用场景
-
植物TF结合位点鉴定(如拟南芥抗旱相关TF)。
-
无抗体依赖的TF-DNA互作研究(适合难以制备抗体的TF)。
优缺点
-
优点:无需抗体、适用于非模式生物。
-
缺点:体外系统可能忽略体内表观修饰(如甲基化)的影响。
技术对比
技术 | 检测目标 | 分辨率 | 样本要求 | 适用场景 |
---|---|---|---|---|
WGBS | DNA甲基化 | 单碱基 | 高纯度DNA | 全基因组甲基化图谱 |
ATAC-seq | 染色质开放性 | 150-500 bp区域 | 新鲜细胞/冻存核 | 调控元件挖掘 |
DAP-seq | TF-DNA结合位点 | ~200 bp峰值 | 体外合成TF | 无抗体TF研究 |
联合分析策略
-
多组学整合:
-
WGBS + ATAC-seq:揭示甲基化与染色质开放的关联(如肿瘤中甲基化沉默的增强子)。
-
DAP-seq + RNA-seq:验证TF调控的下游靶基因。
-
注意事项
-
样本质量:
-
ATAC-seq需新鲜细胞避免核破裂。
-
WGBS需完整DNA(降解样本推荐RRBS)。
-
-
数据分析:
-
甲基化数据需批次效应校正(如ComBat)。
-
ATAC-seq峰值注释需参考基因组注释文件(如GENCODE)。
-
应用案例
-
医学:WGBS发现结直肠癌中特定CpG岛的甲基化特征。
-
植物学:DAP-seq鉴定水稻抗旱转录因子OsNAC10的结合位点。
-
发育生物学:ATAC-seq追踪小鼠胚胎干细胞分化中的染色质动态。
这些技术为解析基因表达调控提供了多维度工具,根据研究目标(甲基化、开放性或TF结合)和样本类型选择合适方法。