导读生信全书 挑 第一节:芯片基础知识 基因芯片 :是固定在某种介质上(比如玻璃或石英平面、微粒等)的一系列微小特征序列的(通常是 DNA 探针)的集合,它们可以被用于定性或者定量...

今天运困体育就给我们广大朋友来聊聊山西甲基化芯片龙头企业,希望能帮助到您找到想要的答案。

生信全书 挑 第一节:芯片基础知识

生信全书 挑 第一节:芯片基础知识

基因芯片 :是固定在某种介质上(比如玻璃或石英平面、微粒等)的一系列微小特征序列的(通常是 DNA 探针)的集合,它们可以被用于定性或者定量检查样品内特异核酸分子的成份。

学习重点:

在中心法则上,芯片的制备和使用涉及到 DNA 复制,DNA 转录出 RNA,以及 RNA 逆转录到 DNA。待检核酸样本与探针结合遵循碱基互补配对原则。

目前的商业芯片都还会 再把 cDNA 转录为 cRNA 进行检测 ,这样再进行一次转录有 2 个意义:

第一,RNA 与DNA 间的互补结合,较两条 DNA 链间更为牢固,我们使用的是 DNA 探针,则 DNA 和 cRNA 结合的敏感性高于 DNA 和 cDNA;

第二,在体外,DNA 到 RNA 的大量转录非常简单,所以从 cDNA 到 cRNA,使得待测核酸又进行了大量扩增,即使原来低丰度的 mRNA 也更好检测。

芯片设计、灵敏度高、重复性高,稳定性好、产品线丰富、表达谱芯片覆盖物种广泛、通用性

Affymetrix 公司表达谱芯片的制作芯片采用的是 光蚀刻技术 ,光蚀刻引导短探针合成,多位点设计。

每一 张芯片上又划分出 650-680 万个小格子,被称为一个“ Feature ” ,即探针合成点或探针检测单元,上面会通过高密度点阵技术和光蚀刻技术生长出几百万个具有相同序列DNA链,也就是探针。

一个通光孔对应一个 Feature,有少数通光孔是通光的,则那些对应的 feature 是亮的,被称为 deprotected features,即“失保护 features”。通光的 feature 是允许添加一个新的核苷酸的。

接头分子“L” :添加第一个 DNA 核苷酸的起点

光敏阻断分子 :是一种阻止 DNA 延长反应的保护剂分子,用红色小三角形表示。

3’IVT 芯片为例:

加入提取的待检测的转录组 RNA→先通过逆转录得到第一链的 cDNA→紧接着就通过复制合成第二链的 cDNA变成双链 cDNA 之后,这个双链 cDNA 就可以作为接下来转录的模板了。

用掺有生物素标记的 UTP 的 4 个单核苷酸的混合物,进行 体外转录 ,转录得到 cRNA (转录出来的 cRNA 片段是带有生物素标签的)。

cRNA 打成片段后再依照碱基互补的原则与芯片上的 探针 进行 杂交 ,将未结合的 cRNA 片段 洗脱 后,用标记了藻红蛋白的链霉亲合素 ( SAPE )对芯片进行 染色 。可发出 红色荧光 , 有一步荧光信号放大过程。最后进行 激光扫描 ,得到一张有着密密麻麻光点的图片,这张图片也就是荧光信号的矩阵。

光点的 X、Y 轴的位置,也就是探针的 ID 号。

光点的 (光)强度 ,也就对应着被杂交到的 cRNA 的量 反映了对应基因的 mRNA 的表达量

3'端表达谱芯片 3´IVT:缺点:①很多同源基因是区分不开的;②不能区分转录本,所以不能用于研究基因可变剪接。③价格上没有优势。

全转录组芯片 WT:①结果准确;②全转录本表达谱;③可变剪接的分析;④检测长链非编码RNA(LncRNA)

Tiling 芯片 :叠瓦式芯片、嵌合芯片,用于寻找和发现新转录本以及结合染色质免疫共沉淀实验研究蛋白和基因互作。目前分辨率最高的基因芯片类型,可以用作全转录组分析。

SNP 芯片 :常用来做 GWAS(读作 G-was)研究。

CNV 研究 : SNP 芯片,还可以使用 OncoScan 和 CytoScan 系列。

定制芯片 :石蜡标本芯片(X3P Array)

甲基化芯片 :都被经典的 Illunima 的 850K 和 450K 霸占了

优势

1)上样量低

2)重复性高且检测通量大

3)特异性高

4)数据准确性高

5)检测的费用相对低廉。

Illumina的芯片分两种,:SAM和右边的 Sentrix BeadChip,表达谱芯片一般为Sentrix BeadChip,它由硅片和二氧化硅微珠两部分组成。通过微机电系统技术等离子蚀刻,在硅片上蚀刻出许多个排列整齐的小孔。

专家认为把芯片扫描技术带入到 临床质量标准 是将全基因组染色体分析的优势 推广到临床领域的一个重要里程碑。

Agilent 的基因芯片应用的是 喷点式化学原位合成 技术(SurePrint 技术),检测原理也是基于 3’IVT 原理。

优点

1)独特的 SurePrint 原位合成技术、

2)灵活方便的定制服务、

3)cRNA 链上直接标记 Cy5 荧光基团,检测过程快、

4)检测线性范围更大、

5)60-mer 长探针,特异性好、

6)样本用量少,节约珍贵样本、

7)可选择双色(通道)芯片检测

3’IVT:

第一个问题,Affymetrix 的 U133 系列、PrimeView 和 Agilent 的 SurePrint G3 都是 3’IVT

第二个问题,转录本水平的检测或可变剪接的研究选择什么芯片

第三个问题,研究LncRNA用什么芯片

对于其他要求,比如定制化芯片、双色芯片等,肯定优先选择 Agilent。

如果样品珍贵,建议选择Agilent的SurePrint G3 Human Gene Expression v3 8x60K Microarray和Illumina的Human HT-12 V4,上样量相对较小。

追求性价比,也建议选择Agilent的SurePrint G3 Human Gene Expression v3 8x60K Microarray 和 Illumina 的 Human HT-12 V4。

其他芯片

首先 RNA-Seq 的技术优势是: 1)不需要物种或转录本特异性探针;

2)它可以检测新的转录本、基因融合、SNPs(包括突变)、INDELs(小插入和缺失)以及芯片无法检测到的其他未知的变化,而芯片是个相对封闭的系统,即只能对已知的序列进行检测;

3)有更宽的动态范围;如果选择测序,还要注意:一是建库类别,即全基因组还是全外显子组测序,二是测序深度

芯片 的优势:

芯片进行定量会更为准确,而测序具有一定的偏好性;

研究低丰度转录本(基因)或者样本为石蜡包埋组织(RNA 降解严重),同样价位测序深度不高时,芯片较为合适;当然不同的芯片的准确度和适用情况也不同,也需要做好筛选;

一张芯片可以同时对多组学(如编码基因表达、LNCRNA 和 mRNA)进行检测,而测序则由于建库方法的限制,一般要对它们进行分别检测芯片的实验周期通常约为测序的一半时间或者更短;

根据研究材料、目的和性价比选择最合适的方法

[甲基化问题锦集]

今天和大家聊聊甲基化。

问:什么是表观遗传修饰?

答:基因组表观遗传修饰主要包括DNA甲基化修饰与核小体中组蛋白的修饰等,使得被修饰DNA的空间结构发生改变或使染色体结构发生改变,导致基因的沉默或过度表达。这两种修饰都是在不改变DNA碱基种类与数量的前提下使生物体表型呈现出多样化。

问:什么是DNA甲基化?

答:DNA甲基化是指在DNA 甲基化转移酶的作用下,将甲基选择性地添加到胞嘧啶上形成5’-甲基胞嘧啶的过程。

问:DNA甲基化修饰有什么作用?

答:DNA甲基化是最早发现的一种表观遗传修饰,可能存在于所有高等生物中, 它并不改变基因的碱基序列, 而是通过改变基因的表达影响细胞的功能,与基因沉默、X染色体失活、基因组印记、RNA i以及肿瘤等生物事件密切相关,它们的共同作用机制是调节基因的表达。

问:不同生物,DNA甲基化类型是一样的吗?

答:当然不一样啦。原核生物中甲基化多发生在CCA/TGG和GATC序列,而真核生物中DNA甲基化一般只发生在CpG位点上,哺乳动物DNA甲基化只发生在CpG岛的胞嘧啶,植物甲基化发生在CpG和CpNpG。

问:什么是CpG岛?

答:CpG双核苷酸在人类基因组中的分布很不均一,而在基因组的某些区段CpG序列密度很高,可达到均值5倍即所谓的CpG岛。CpG岛主要位于基因的启动子(promotor)和第一外显子区域,约有60%基因的启动子含有CpG岛。CpG岛的GC含量大于50%,经常出现在真核生物的编码基因的调控区。

问:CpG岛为什么要有个"p",而不叫CG岛?p有什么特殊含意?

答:CpG是胞嘧啶-磷酸-鸟嘌呤的缩写,p代表磷酸。

问:如何预测CpG岛?

答:由于CpG 岛区域较小,研究起来更为方便,因此,众多的研究热点集中在CpG 岛甲基化状态的研究上。而研究CpG岛甲基化的前提条件是确认最合适的CpG 岛区域。

目前有一些网站可以进行CpG岛的预测,我推荐几个比较好用的:

CpG Island( )

CpGfinder( )

CpG islands revealing( )

CpGPlot/CpGReport/Isochore( )

然后用实验证实,可以用bisulfite sequencing来比较处理前后的不同,找到甲基化位点。

问:验证特定甲基化位点,并进行甲基化程度分析有哪些方法?

答:采用对照组和实验组样本进行甲基化验证。

(1) MSP方法:可进行特定位点甲基化验证,适用于甲基化芯片后的结果,无法进行甲基化程度分析;

(2) BSP克隆测序法:验证某些相关基因的甲基化位点,并精确计算出甲基化程度百分比;

(3) HRM法:适用于大批量样本甲基化验证,并能计算出甲基化程度范围。

(4) 焦磷酸测序:测序有效长度不超过60bp,精确定量每一个CpG位点。

(5) MassARRAY® 平台:用于单个基因启动子区域的甲基化检测;每个反应覆盖长达500 bp的多个CpG位点; 精准定量每一个CpG位点。

问:刚刚开始研究甲基化,如何寻找甲基化位点?

答:甲基化的研究是近年来较为火热的研究领域之一,您是不是也对它垂涎已久,却苦于无从下手?其实甲基化的研究并没那么难,一句话,还是套路!

首先,甲基化位点的筛选,可以使用全基因组Bisulfite测序(WGBS)、简化基因组甲基化测序(MethylRAD技术)或者甲基化芯片进行基因组整体水平甲基化检测,每种方法各有利弊,要根据实际的研究方向选择不同的方法。对于样品间差异甲基化位点的筛选,可以采用WGBS和MethylRAD技术,其中MethylRAD技术可以应用于无参考基因组的物种,Illumina Methylation EPIC芯片只能用于人类的DNA甲基化水平检测。当然也可以根据一些相关研究显示某些基因存在表达量降低的现象,预测该基因是否存在CpG岛;或者根据文献寻找相关基因的甲基化位点。

其次,对选择的特异位点进行甲基化验证,并进行甲基化程度分析。

最后,根据对照组和实验组样本的检测结果,分析甲基化位点与研究的相关性。

问:只知道基因名称,如何做甲基化检测?

答:只需要将物种及基因信息告知相应或测序公司,会为您提供全方位的检测服务。

原文: 甲基化问题锦集

认识甲基化

人的甲基化、基因结构、启动子的一些概念 - (jianshu.com)

1> 染色体

2> 转录本:1stExon 3'UTR 5'UTR Body IGR TSS1500 TSS200

3> 基因组:Coding Non-coding Intergenic

4> CpG岛:island opensea shelf shore

甲基化芯片注释中的CpG shores, open sea 是什么 - (jianshu.com)

表观遗传学: DNA甲基化 - (jianshu.com)

甲基化芯片的一般分析流程 - 知乎 (zhihu.com)

甲基化芯片数据的差异分析 - (jianshu.com)

450k甲基化基础(一)

DNA甲基化是表观遗传学的中最为常见的一种修饰,其主要形式包括:5-甲基胞嘧啶 (5-mC)、少量的N6-甲基腺嘌呤 (N6-mA) 以及7-甲基鸟嘌呤(7-mG)。

目前常说的DNA甲基化一般指 CpG岛甲基化 ,即在 DNA甲基化转移酶(DNMTs) 的作用下使CpG二核苷酸5’端的 胞嘧啶 转变为 5’甲基胞嘧啶 。

哺乳动物体细胞的DNA胞嘧啶甲基化主要发生在 CpG岛

CpG岛(CpG islands) :指CpG序列密度相比整个基因组来说是特别高的富集区域,一般位于 启动子附近 , 5’端非翻译区 或 第一个外显子 ;一般CpG岛序列长度在 500bp , GC含量高于55%以及CpG出现比率大于0.65 ,40%的启动子区域含有CpG岛。

CpG shores 指距CpG岛边缘 2kb 的区域

CpG shelves 是指距CpG岛边缘 4kb 的区域

哺乳动物中的非CpG甲基化主要是发生在胚胎发育阶段和脑组织中

基因组中60%-90%的CpG都被甲基化,未甲基化的CpG形成CpG岛,位于 结构基因启动子的核心序列和转录起始点

一般来说,DNA甲基化主要作用在于调控基因的表达,即 基因启动子区域CpG岛的甲基化水平越高 , 其对应基因的表达水平就相对越低 ;DNA甲基化受到 甲基化酶 (如DNMT3A)和 去甲基化酶 (TET2)的调控。

除了CpG岛的甲基化水平的变化会导致肿瘤的发生外,CpG shores and shelves的异常甲基化也会导致其基因转录水平的抑制

甲基化芯片的原理是 基于亚硫酸盐处理后的DNA序列杂交的信号探测 ,亚硫酸盐处理是将 非甲基化的胞嘧啶变成尿嘧啶 ,而 甲基化的胞嘧啶则保持不变 ,然后 再将尿嘧啶转化为胸腺嘧啶 ,最后进行 芯片杂交 ;

Illumina的450K芯片采用两种assay:Infinium I和Infinium Ⅱ,前者有两种bead(微珠),分别是甲基化M和非甲基化U,后者则是一种bead(不区分甲基化和非甲基化)。

以及下面这张图,注:左边一列是非甲基化的GpC locus,右边是甲基化的GpC locus,上下分别是Infinium I 和Infinium Ⅱ

探针是以甲基化位点为单位的,每个探针对应检测一个甲基化位点。为了能够区分甲基化位点和非甲基化位点,在450K 和 850K中,有两种类型的探针,分别叫做I 型探针和 II 型探针

对于human 来说,目前主流的DNA甲基化芯片有450K 和 850K 两种,都是illumina 公司研发的。这里的450K 和 850K 指的是芯片上探针的数量,对应可以检测的甲基化位点个数。

—————————————————————————————————————

对于亚硫酸氢盐处理的DNA ,非甲基化的C会变成T , 而甲基化的C不会变。

对于I 型探针而言,有两种序列,专业名词叫做bead type, 其中Unmethylated bead type 用来和非甲基化的C杂交,Methylated bead type 用来和甲基化的C杂交。

对于human而言,主流的DNA甲基化芯片有450K和850K两种,这两个数字代表覆盖到的甲基化位点的个数,是一个约数;

甲基化芯片上混合使用了I 型探针和II 型探针,I 型探针通过两个bead type 分别识别甲基化的C和非甲基化的C,II 型探针通过1个bead type 就可以区分甲基化的C和非甲基化的C。

一、Illumina HumanMethylation450 BeadChip (甲基化450k芯片)简介

450K芯片的芯片图形及其原理可以以下图展示

1、芯片:一张芯片包括12个array(如图显示),也就是一张芯片可以做12个sample,一台机子一次可以跑8张芯片,也就是一共96个sample,每个样本可以测到超过450,000个CpG位点的甲基化信息(大概人所有的1%,但是覆盖了多数CpG岛和启动子区),芯片本身包含一些控制探针可以做质控。

2、原理:简而言之,基于亚硫酸盐处理后的DNA序列杂交的信号探测。亚硫酸盐是甲基化探测的“金标准”,不管是芯片或者甲基化测序,都要先对DNA样品进行亚硫酸盐处理,使非甲基化的C变成U,而甲基化的C保持不变,从而在后续的测序或者杂交后区分出来。450K采用了两种探针对甲基化进行测定,Infinium I采用了两种bead(甲基化M和非甲基化U,如图显示),而II只有一种bead(即甲基化和非甲基化在一起),这也导致了它们在后续荧光探测的不同,450K采用了两种荧光探测信号(红光和绿光)。

二、分析需要考虑的问题

1、背景校正

2、红光和绿光的校正

3、控制芯片的使用(illumina450K本身有一些控制芯片,可以用来做质控,如亚硫酸盐处理效率)

4、探针类型(I型和II型)的校正(不同探针类型产生的数据不同)

最终我们选择BMIQ的方法(基于ebayes的原理将II型探针的甲基化水平拉伸到I型水平)来做矫正。

5、位置的校正(芯片上的不同位置产生的数据可能会有偏差)

6、批次的校正(不同的批次做的数据会有偏差)

7、探针序列本身是否可靠(有些探针本身位于repeat区或者包含snp等就会影响杂交及最后的结果,应该去除,附上一片参考文献,里边有list可以用来去除不好的探针)

平均β=信号B /(信号A +信号B + 100)

通过计算甲基化(信号A)和未甲基化(信号B)等位基因之间的强度比来确定DNA甲基化水平(β值)。

具体地,β值是由甲基化(M对应于信号A)和未甲基化(U对应于信号B)等位基因的强度计算的,荧光信号的比率β= Max(M,0)/ [Max( M,0)+ Max(U,0)+ 100]。

因此,β值的范围从0(完全未甲基化)到1(完全甲基化)

具体的β值的意义是:

任何等于或大于0.6的β值都被认为是完全甲基化的。

任何等于或小于0.2的β值被认为是完全未甲基化的。

β值在0.2和0.6之间被认为是部分甲基化的。

参考:

多组学在科学研究中有哪些重要意义?

近日,备受瞩目的2022年诺贝尔生理学或医学奖揭晓,因“对已灭绝的古人类基因组和人类进化的发现”,瑞典科学家Svante Pbo博士荣膺此奖项。

Svante Pbo团队的研究中,充满了古老样本和先进基因组学技术的融基因组学技术在溯源人类进化与发展的研究中展现了不可替代的作用。之前,研究者更多依靠考古和生物学指标来探索进化的秘密。然而,这些信息远不能揭示人群中的遗传性关系。DNA序列信息的出现,正在重塑我们对人类演化历史及遗传的理解。基因组学的发展,为人类进化的研究提供了一把把解密的钥匙。例如,通过线粒体DNA序列信息探索母系遗传、通过Y染色体测序挖掘父系遗传信息、结合全基因组测序等信息多维度探索人类群体的起源、关系、历史、结构和迁移模式的问题。

然而生物具有多层次和复杂性,单独基因组研究也有局限,例如无法仅依靠基因信息复原人类进化全景图、无法单独实现精密解构人类健康原因的任务。这就需要结合表型信息综合分析。表型,即生命体的各种特征,是一种多维度的生物指征,伴随着人类的进化而不断演化。表型组与基因组信息互为补充,与人类的进化和生活息息相关。为了同时完成多维度基因组及表型组的测序和平行综合分析,多基因组学应运而生。

多组学将基因组数据与转录组学、表观遗传学、蛋白质组学其他模式的数据相结合,可检测基因表达、基因激活和蛋白质水平表达,可以助力在多个生物学层面平行探索,为解决复杂问题提供更全面视角。同时,多组学分析研究能够帮助我们更全面地了解分子变化对正常发育、细胞应答和疾病的影响。研究人员可以借助多组学技术更好地将基因型与表型联系起来,不断探索、发现新药物靶点和生物标志物,加速临床转化。

图:通过多组学更全面地了解生物学——多组学不仅研究基因组,还带来对生物学更深层次的见解。分析每一条可用的分子数据,加速生物学发现,转变我们对人类健康的理解。

在多组学研究中,基因组学方法可以全面覆盖多种变异类型,如拷贝数变异(CNV)、插入/缺失(INDEL)、单核苷酸变异(SNV)和结构变异(SV)。除此之外,表观遗传学研究在多组学研究中发挥越来越重要的作用。全面的表观遗传学分析可以揭示基因调控模式发现基因组变异的功能。

DNA甲基化是表观遗传学的中最为常见的一种修饰,可以使细胞抑制病毒和非宿主DNA元素表达,促进对环境刺激的反应。异常的DNA甲基化对基因表达调控的影响与多种疾病相关。将甲基化信息和遗传信息相结合的多组学方法可以帮助破译复杂的通路和疾病机制。

基于芯片的甲基化研究可以为基因表达调控提供有价值的信息,目前主流应用平台有Illumina MethylationEPIC BeadChip等。在使用甲基化芯片的研究中,芯片CpG的覆盖度对于甲基化的检测水平至关重要, Illumina Methylation EPIC BeadChip则结合了全面的覆盖范围和高通量检测能力,为深入了解表观遗传变化提供了强大的检测分辨率。

Illumina甲基化芯片全面覆盖整个基因组,可以定量研究超过85万个甲基化位点的表观基因组信息,包括CpG岛、非CpG和差异甲基化位点、FANTOM5增强子、ENCODE开放染色质、ENCODE转录因子结合位点及miRNA启动子区域等。

此外,Illumina甲基化芯片可平行分析包括福尔马林固定石蜡包埋(FFPE)组织在内的多个样本,从而在最大限度减少每个样本成本的同时实现高通量。对于所有Illumina甲基化芯片来说,技术平行分析之间的重现性均超过98%。

Illumina甲基化芯片系列产品中不仅包括针对人类研究的Human MethylationEPIC BeadChip, 还包括了针对小鼠的Mouse Methylation BeadChip。此外,还有定制化产品Custom Methylation Beadchip可为目标研究和商业应用提供最大程度的灵活性和成本节约,适用于各种应用。

随着NGS技术水平的提升及测序成本的下降,NGS技术也广泛应用于蛋白质组学的研究,并形成了蛋白质组学与其他组学结合的模式,例如CITE-Seq技术,这种基于NGS的测序技术可以在单细胞层面上同时检测转录组和细胞表面蛋白,可以实现单细胞维度下的蛋白质信息与转录组信息的整合,更全面地定义细胞状态和细胞功能。此外,还有邻位延伸(PEA)技术,这种技术作为一种突破性的技术,在精准蛋白质组学中发挥重要功能,通过结合免疫学反应和值得信赖的Illumina测序技术,克服了传统的蛋白质组学在检测通量和灵敏度的限制。

多组学是一种快速兴起的、以先进的测序和芯片技术为动力的生命科学研究方法,代表了一种新的全面理解生物学的视角,能够帮助我们探寻规律、看到隐藏在某一类数据后的“秘密”,让我们更深入地了解生物学,解码生命奥秘。

近年来,随着测序成本的不断降低和技术水平进步,多组学分析也变得更加全面,具备更好的整体性。Illimina测序仪使包括甲基化分析和蛋白质组学在内的新兴应用和多组学测序方法成为可能。通过提供具有业界领先的数据质量、灵活性和可扩展性的解决方案,Illumina为多组学分析提供产品和服务支持。NGS方法中的数据结果可以整合多种数据类型研究人员最大限度地发挥珍贵研究样本基因组数据的潜力,为突破科学新见解的极限提供更多可能性。

今天的内容先分享到这里了,读完本文《湖北甲基化芯片》之后,是否是您想找的答案呢?想要了解更多,敬请关注www.zuqiumeng.cn,您的关注是给小编最大的鼓励。