详细介绍一下第二代dna测序技术测序技术中的pair-end是什么意思

1.概述  DNA测序(DNA sequencing)作为一种重要的实验技术,在生物学研究中有着广泛的应用。早在DNA双螺旋结构(Watson and Crick,1953)被发现后不久就有人报道过,但是当时的操作流程复杂,没能形成规模。随后在1977年Sanger发明了具有里程碑意义的末端终止测序法,同年A.M.Maxam和W.Gilbert发明了。因为既简便又快速,并经过后续的不断改良,成为了迄今为止DNA测序的主流。然而随着科学的发展,传统的Sanger测序已经不能完全满足研究的需要,对模式生物进行基因组重测序以及对一些非模式生物的基因组测序,都需要费用更低、通量更高、速度更快的测序技术,第二代测序技术(Next-generation sequencing)应运而生。第二代测序技术的核心思想是边合成边测序 (Sequencing by Synthesis),即通过捕捉新合成的末端的标记来确定DNA的序列,现有的技术平台主要包括Roche/454 FLX、Illumina/Solexa
Analyzer和Applied Biosystems SOLID system。这三个技术平台各有优点,454 FLX的测序片段比较长,高质量的读长(read)能达到400bp;Solexa测序性价比最高,不仅机器的售价比其他两种低,而且运行成本也低,在数据量相同的情况下,成本只有454测序的1/10;SOLID测序的准确度高,原始碱基数据的准确度大于99.94%,而在15X覆盖率时的准确度可以达到99.999%,是目前第二代测序技术中准确度最高的。虽然第二代测序技术的工作一般都由专业的商业公司来完成,但是了解测序原理、操作流程等会对后续的数据分析有很重要的作用,下文将以Illumina/Solexa Genome Analyzer 测序为例,简述第二代测序技术的基本原理、操作流程等方面。2.基本原理  Illumina/Solexa Genome Analyzer测序的基本原理是边合成边测序。在Sanger等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测DNA的序列信息。3.操作流程  1)测序文库的构建(Library Construction)
  首先准备基因组DNA(虽然测序公司要求样品量要达到200ng,但是Gnome Analyzer系统所需的样品量可低至100ng,能应用在很多样品有限的实验中),然后将DNA随机片段化成几百碱基或更短的小片段,并在两头加上特定的接头(Adaptor)。如果是转录组测序,则文库的构建要相对麻烦些,RNA片段化之后需反转成cDNA,然后加上接头,或者先将RNA反转成cDNA,然后再片段化并加上接头。片段的大小(Insert size)对于后面的数据分析有影响,可根据需要来选择。对于基因组测序来说,通常会选择几种不同的insert size,以便在组装(Assembly)的时候获得更多的信息。
  2)锚定桥接(Surface Attachment and Bridge Amplification)
  Solexa测序的反应在叫做flow cell的玻璃管中进行,flow cell又被细分成8个Lane,每个Lane的内表面有无数的被固定的单链接头。上述步骤得到的带接头的DNA 片段变性成单链后与测序通道上的接头引物结合形成桥状结构,以供后续的预扩增使用。
  3)预扩增(Denaturation and Complete Amplification)
  添加未标记的dNTP 和普通Taq 酶进行固相桥式PCR 扩增,单链桥型待测片段被扩增成为双链桥型片段。通过变性,释放出互补的单链,锚定到附近的固相表面。通过不断循环,将会在Flow cell 的固相表面上获得上百万条成簇分布的双链待测片段。
  4)单碱基延伸测序(Single Base Extension and Sequencing)
  在测序的flow cell中加入四种荧光标记的dNTP 、DNA 聚合酶以及接头引物进行扩增,在每一个测序簇延伸互补链时,每加入一个被荧光标记的dNTP就能释放出相对应的荧光,测序仪通过捕获荧光信号,并通过计算机软件将光信号转化为测序峰,从而获得待测片段的序列信息。从荧光信号获取待测片段的序列信息的过程叫做Base Calling,Illumina公司Base Calling所用的软件是Illumina’s Genome Analyzer Sequencing Control Software and Pipeline Analysis Software。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。随着读长的增加,错误率也会随之上升。
  5)数据分析(Data Analyzing)
  这一步严格来讲不能算作测序操作流程的一部分,但是只有通过这一步前面的工作才显得有意义。测序得到的原始数据是长度只有几十个碱基的序列,要通过生物信息学工具将这些短的序列组装成长的Contigs甚至是整个基因组的框架,或者把这些序列比对到已有的基因组或者相近物种基因组序列上,并进一步分析得到有生物学意义的结果。
&|&相关影像
互动百科的词条(含所附图片)系由网友上传,如果涉嫌侵权,请与客服联系,我们将按照法律之相关规定及时进行处理。未经许可,禁止商业网站等复制、抓取本站内容;合理使用者,请注明来源于。
登录后使用互动百科的服务,将会得到个性化的提示和帮助,还有机会和专业认证智愿者沟通。
此词条还可添加&
编辑次数:6次
参与编辑人数:5位
最近更新时间: 14:22:36
申请可获得以下专属权利:
贡献光荣榜  [罗氏诊断]第二代高通量测序系统GS FLX引领快速基因组测序时代的到来罗氏供稿
&&& DNA测序技术上的快速发展,加快了我们对不同物种和生物体的基因组序列和结构的研究步伐。2005年底,罗氏诊断公司和454公司推出了基于焦磷酸测序法的超高通量基因组测序系统――Genome Sequencer 20 System (GS 20)。自问世以来,已经被世界上几乎所有从事基因组测序和相关结构功能研究的顶级实验室配备使用,Nature,Science,PNAS,Cell等世界知名期刊上发表的文章就已经近五十篇。在已有GS 20的技术基础上,罗氏诊断公司和454公司不断加大创新投入,又于2007年推出了通量更大,读长更长,准确性更高的第二代基因组测序系统――Genome Sequencer FLX System (GS FLX),相信它的出现,必将掀起测序技术的进一步革命;对整个基因组学的研究将产生巨大的推动作用。
GS FLX系统超高通量测序技术原理
&&& GS FLX系统的测序原理和GS 20一样,也是一种依靠生物发光进行DNA序列分析的新技术;在DNA聚合酶,ATP硫酸化酶,荧光素酶和双磷酸酶的协同作用下,将引物上每一个dNTP的聚合与一次荧光信号释放偶联起来 (图 1)。通过检测荧光信号释放的有无和强度,就可以达到实时测定DNA序列的目的。此技术不需要荧光标记的引物或核酸探针,也不需要进行电泳;具有分析结果快速、准确、灵敏度高和自动化的特点。
GS FLX系统的操作过程&&GS& FLX系统提供了完整的从样品制备到后续的生物信息学分析解决方案。
1)样品种类:GS FLX系统支持各种不同来源的样品序列测定:包括基因组DNA,PCR产物,BAC,cDNA,小分子RNA等等。
2)样品DNA打断:样品例如基因组DNA或者BAC等被打断成300-800 bp的片段;对于小分子的非编码RNA,这一步骤则不需要。短的PCR产物则可以利用GS融合引物进行扩增后直接进行步骤4)的工作。
3)衔接子连接:借助一系列标准的分子生物学技术,将A和B接头(3’和5’端具有特异性)连接到DNA片段上。接头也将在后继的纯化,扩增和测序步骤中用到。图中仅仅显示了后续步骤中要用到的单链的DNA片段。
4)一条DNA片段=一个磁珠:接头使成百上千条DNA片段结合到它们自己唯一的磁珠上,此磁珠被单个油水混合小滴包被后,在这个小滴里进行独立的扩增,而没有其他的竞争性或者污染性序列的影响;整个DNA片段进行平行扩增。
5)一个磁珠=一条读长:经过PCR扩增后,每个磁珠上的DNA片段拥有了成千上万个相同的拷贝。经过富集以后,这些片段仍然和磁珠结合在一起,随后就可以放入到PicoTiterPlate板中供后继测序使用了。
6)数据读取和分析工具:GS FLX系统 在7.5小时的运行当中可获得40多万个读长,读取超过1亿个碱基信息。GS FLX 系统提供三种不同的生物信息学工具对测序数据进行分析,适用于不同的应用:例如多达3 GB序列的重测序,对比已知参考序列进行的扩增产物差异分析,及 120 MB的从头测序工作等。
GS FLX系统的技术优势
GS FLX系统具备的卓越性能:
一个测序反应耗时7.5个小时,获得超过1亿个的碱基数据
单个序列的读长更长,平均可达到200-300碱基左右
通量更高,每个反应可以得到超过40万个序列读长,成本大大降低
读长超过200 bp时,单一读长的准确性可以超过99.5%
测序结果一致性超过99.99%
技术成熟,提供完整的解决方案
可以进行Pair-End 测序研究
&完整的软件包是GS FLX系统的又一特色:
简单易用的图形用户界面,可以用来进行作图,拼接和扩增产物差异检测等研究。
利用项目管理软件工具,可以把多次测序反应得到的数据进行成组分析,并且可以添加已完成的测序反应数据来进行其他方面的分析
利用新一代的算法得到高度可信的结果-无论是碱基识别, 拼接和作图,还是差异分析,都是如此。
GS FLX系统的应用&&& 自从2005年底GS 超高通量基因组测序系统问世以来,已经相继在世界上各大测序实验室成功落户。这项技术的第一个“试验品”就是来自有“DNA之父”之称的James D Waston,他向454公司提供了自己的血液样本。目前GS系统的用户在Nature,Science,PNAS等世界顶级的期刊杂志上已经发表了五十多篇的学术论文。(详细列表请查询https://www.roche-/sis/sequencing/genome/index.jsp)。与GS 20系统相比较,硬件配置和软件系统方面的革新改进,使得GS FLX系统具有了广泛的应用:全基因组测序
多达120 Mb的未知基因组的测序-生成基因组结构概图-研究DNA序列的组织,分布和信息-基因筛查:寻找新基因,定位和功能-和其他基因组进行比较研究 &
全基因组进行从头鸟枪法测序,例如微生物基因,BAC和YAC克隆测序。&
比较基因组研究-识别单碱基突变-识别突变热点和保守区域-识别插入或者缺失的基因-断定基因型和表型之间的相关关系(比如,研究药物抗性的遗传基础) - 基于基因测序变化进行毒性预测-进行流行病学分析-了解工业生产菌株和它们的亲代菌株序列上的差异作为进行工业生产菌株开发的遗传基础-进行宏基因组 (metagenomics)研究-古代化石DNA 测序研究&
利用配对末端方法(Pair-End Tag)将Contigs拼接成Scaffolds。
转录组和基因调节研究
基于短Tags,ESTs, ChIP,或者GIS-PET序列的高通量转录组分析,或者miRNA 序列的基因组范围识别,小分子和非编码RNA的测序。&
研究DNA的甲基化模式来进行基因调节的研究。
扩增产物分析
PCR产物的超精细测序(应用于医学研究的重测序) -在混合的肿瘤样本中识别体细胞突变-在群体水平上发现高可信度的SNP位点&
参考文献:
De Novo,基因组和BAC测序GS FLX可以在一次反应中完成未知微生物和病毒基因组的全基因组测序,或者利用BAC克隆完成复杂动物和植物基因组的测序,并且可以用配对末端应用相关的试剂和软件来把contigs拼接成scaffolds
参考文献Andries, K. et. al. A Diarylquinoline Drug Active on the ATP Synthase of Mycobacterium tuberculosis. Science. 307, 223-227 (2005) Velicer GJ et al Comprehensive mutation identification in an evolved bacterial cooperator and its cheating ancestor.& PNAS May 23, 2006 vol. 103 no. 21 Jarvie, T whole genome assembly using pair-end reads in E coli,B licheniformis and S cerevisiae Genome Sequencer System A pplication Note No. 1/July,2006, Available at www.
全基因组测序进行比较基因组研究&&& GS FLX可以以无与伦比的方式来支持遗传变化的识别,包括异质性SNP,插入缺失,和突变热点的研究;以及流行病学,进化学和元基因组学(metagenomics)研究
参考文献Poinar HN et al Metagenomics to paleogenomics: large-scale sequencing of mammoth DNA. Science. 2006 Jan 20;311( (2006)Analysis of one million base pairs of Neanderthal DNA.Green RE et al Nature, vol. (7117), 444 330-336,2006&
扩增产物重测序&&& 利用新的扩增产物测序工具可以加速在复杂的肿瘤样本中发现体细胞突变,或者在人类,动物植物或者微生物群体中分析遗传变异性。由于GS FLX一次可以产生高通量的读长,它可以1000倍的覆盖度发现的遗传变化可以达到5%的敏感性,以5000倍的覆盖度可以达到1%的敏感性。
参考文献Thomas RK et al Sensitive mutation detection in heterogeneous cancer specimens by massively parallel picoliter reactor sequencing Nature Medicine ):852-5.Sogin ML et al Microbial diversity in the deep sea and the underexplored ‘‘rare biosphere’’PNAS, 2006 vol. 103 no. 32
转录组研究&&& 检测和鉴定相同表达序列标签ESTs-不管基因组是已知的还是未知的。无论是崭新的,还是已知的EST都可以进行识别,会在基因表达的水平上提供信息,不管易位和反式剪接事件是否发生。
参考文献Gowda M et al Robust analysis of 5’-transcript ends (5’-RATE): a novel technique for transcriptome analysis and genome annotation Nucleic Acids Research Advance Access published online on September 29, 2006Bainbridge M N et al, Analysis of the prostate cancer cell line LNCaP transcriptome using a sequencing-by-synthesis approach BMC Genomics Nielsen K L et al., DeepSAGE―digital transcriptomics with high sensitivity, simple experimental protocol and multiplexing of samples Nucleic Acids Research, Advance Access published October 5, 2006
基因调节研究
发现新型的非编码RNA(sncRNA)。在基因组范围内识别sncRNA,更好的理解基因表达控制的机制
结合染色质免疫沉淀(ChIP)技术,完成转录因子结合位点的全基因组图谱
通过已知的亚硫酸盐处理方法,定量检测目的基因组中每个CpG双核苷酸的甲基化状态。启动子区域的低甲基化或者高甲基化都被认为是好多基因非常重要的调节机制
参考文献Lu C et al MicroRNAs and other small RNAs enriched in the Arabidopsis RNA-dependent RNA polymerase-2 mutant Genome Research ):1276-88Axtell M J et al , A Two-Hit Trigger for siRNA Biogenesis in Plants Cell 127, 565C577, 2006Berezikov E et al Diversity of microRNAs in Human and Chimpanzee Brain Nature Genetics, Published Online 29 October 2006; doi:10.1038/ng1914Girard A et al, A germline-specific class of small RNAs binds mammalian Piwi proteins Nature 2006 Jul 13;442(2 Epub 2006 Jun 4.Turcott,C et al Detection and quantitation of methylation patterns using amplicon sequencing Genome Sequencer System A pplication Note No. 3/Sep,2006, Available at
原文有声技术讲座:请看生物通技术大讲堂
关于罗氏诊断应用科学部&&& 罗氏的诊断部门在成功收购德国宝灵曼公司(Boehringer Mannheim GmbH.)后,成立了专业服务于科学研究领域用户的罗氏诊断应用科学部(Roche Applied Science,www.roche-),凭借半个多世纪在生命科学研究领域积累的经验,罗氏诊断应用科学部已成为在此领域中具领先地位的试剂及系统供应商之一。从耗时少的,全自动的样本制备系统(MagNA Lyser 和MagNA Pure),到快速精准的卡盘式LightCycler&2.0/1.5和高通量模块式LightCycler&480实时荧光定量PCR系统,以及创新的超高通量基因组测序系统Genome Sequencer FLX System,罗氏诊断应用科学部研究和开发了多种应用于分子生物学相关研究领域的产品――广泛地应用在基因组学和蛋白组学研究中;同时罗氏诊断应用科学部也提供用于生物医药和诊断行业以及食品安全检测方面的试剂,为用户需求提供完整的解决方案。
我来说两句(0)
[Ctrl+Enter]
相关文章:
加载相关文章......
今日文章:
加载今日文章......
生物通快讯
加载中......
加载中......
加载中......
加载中......
技术大讲堂
加载中......
加载中......
加载中......
加载中......
加载中......
加载中......
版权所有 生物通
Copyright&
, All Rights Reserved
联系信箱:推荐这篇日记的豆列
&&&&&&&&&&&&关注今日:34 | 主题:314224
微信扫一扫
二代测序中pair-end的细节:中间的距离信息相关的碱基信息是怎么找补回来的?
页码直达:
如下图,用pair-end测序时1号片段中空白的部分的碱基信息是怎么知道的?正在自学生物学,很基础的问题:二代测序会用到pair-end方法。这个方法比如PE50,假设片段长度300,那么只测两头的50pb,两头加起来测了100pb,中间还有200pb是不知道具体碱基信息的。这中间的200pb是怎么知道它的具体碱基的呢。有种说法是说虽然只测两头50bp,但有很多这样的片段,它们有很多重叠的地方,重叠的地方可以覆盖住中间不知道的碱基信息。如下图,1号片段中间的白色是不知道具体碱基信息的地方,但有很多片段,这些片段两头测序了的地方可以覆盖住1号片段中间没测序的空白地方。如下图2、3、4、5、6片段两头测了的地方可以覆盖住1号片段中间空白的地方,所以通过软件拼接可以知道中间没有测序的地方的碱基信息,通过这样的拼接也就知道了整个基因组的碱基信息。问题是其他有重叠关系的这些片段是怎么来的呢(如下图,下面的2、3、4、5、6片段是怎么来的呢)?
这可能涉及到文库构建和扩增的过程。二代测序是将DNA超声波打成小片段,然后两端加接头,然后扩增,然后测序。假设DNA样品来源就是一个细胞里面的一个基因组,那么把这个基因组的DNA片段化后,再扩增,比如下图的1号片段扩增,再怎么扩增还是它自己,形不成下面的2、3、4、5、6号片段。所以这可能和扩增没关系。那么应该就是DNA样品来源上,比如样品来源不是来自一个细胞,而是来自一百万个细胞里面的基因组,这样就会有很多套同样的一个基因组。它们里面的同一个染色体中的DNA被超声波打断后,会产生不同的断裂位点,这样就会产生如下图所示的1、2、3、4、5、6以及更多的有重叠关系的片段。那么如果是这样,样品来源上要有多少套同样的基因组才能在概率上全部覆盖呢。这个是怎么算的。 所以我想问的问题是:1.二代测序中pair-end的方法时,一个片段两端测的碱基序列是知道的,中间没测的碱基序列是怎么知道的?
2.如果是靠重叠关系拼接出来知道的,那么那些有重叠关系的片段是怎么来的。
3.这些有重叠关系的片段,通过软件拼接可以知道中间没有测序地方的序列,那么这个过程和扩增有没有关系。
4.如果原因是样品来源本身就有很多套同样的基因组,它们打断后形成重叠关系,那么在概率上要有多少套这样的基因组才能全部覆盖,这个是怎么算出来的。
5.为啥要那么麻烦搞个两端测序pair-end,一个片段从头到尾测完不行?
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
shengwudemimi 如下图,用pair-end测序时1号片段中空白的部分的碱基信息是怎么知道的?正在自学生物学,很基础的问题:二代测序会用到pair-end方法。这个方法比如PE50,假设片段长度300,那么只测两头的50pb,两头加起来测了100pb,中间还有200pb是不知道具体碱基信息的。这中间的200pb是怎么知道它的具体碱基的呢。有种说法是说虽然只测两头50bp,但有很多这样的片段,它们有很多重叠的地方,重叠的地方可以覆盖住中间不知道的碱基信息。如下图,1号片段中间的白色是不知道具体碱基信息的地方,但有很多片段,这些片段两头测序了的地方可以覆盖住1号片段中间没测序的空白地方。如下图2、3、4、5、6片段两头测了的地方可以覆盖住1号片段中间空白的地方,所以通过软件拼接可以知道中间没有测序的地方的碱基信息,通过这样的拼接也就知道了整个基因组的碱基信息。问题是其他有重叠关系的这些片段是怎么来的呢(如下图,下面的2、3、4、5、6片段是怎么来的呢)?
这可能涉及到文库构建和扩增的过程。二代测序是将DNA超声波打成小片段,然后两端加接头,然后扩增,然后测序。假设DNA样品来源就是一个细胞里面的一个基因组,那么把这个基因组的DNA片段化后,再扩增,比如下图的1号片段扩增,再怎么扩增还是它自己,形不成下面的2、3、4、5、6号片段。所以这可能和扩增没关系。那么应该就是DNA样品来源上,比如样品来源不是来自一个细胞,而是来自一百万个细胞里面的基因组,这样就会有很多套同样的一个基因组。它们里面的同一个染色体中的DNA被超声波打断后,会产生不同的断裂位点,这样就会产生如下图所示的1、2、3、4、5、6以及更多的有重叠关系的片段。那么如果是这样,样品来源上要有多少套同样的基因组才能在概率上全部覆盖呢。这个是怎么算的。 所以我想问的问题是:1.二代测序中pair-end的方法时,一个片段两端测的碱基序列是知道的,中间没测的碱基序列是怎么知道的?
2.如果是靠重叠关系拼接出来知道的,那么那些有重叠关系的片段是怎么来的。
3.这些有重叠关系的片段,通过软件拼接可以知道中间没有测序地方的序列,那么这个过程和扩增有没有关系。
4.如果原因是样品来源本身就有很多套同样的基因组,它们打断后形成重叠关系,那么在概率上要有多少套这样的基因组才能全部覆盖,这个是怎么算出来的。
5.为啥要那么麻烦搞个两端测序pair-end,一个片段从头到尾测完不行?序列都是重叠法读出来的,pair-end法测序时,一条测序DNA带上可以测出两条碱基(例如两条50bp),这两条50b在重叠拼接时是有关联的,它们间的序列只可能在100到300bp间,不可能中间间隔1kb,2Kb,这就是你做pair-end文库的限定。比你说的乱测全50bp的拼接要简单的。至于为什么要扩增,你想一个DNA分子你能检测到吗,所以一个分子要扩增至少20万个分子你的机器才能读到荧光信号。还有个测序要多少个细胞才能覆盖住全基因组,有个名词叫测序深度,好多年前一次测序得到的数据多是20多倍覆盖
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
泡泡糖原 序列都是重叠法读出来的,pair-end法测序时,一条测序DNA带上可以测出两条碱基(例如两条50bp),这两条50b在重叠拼接时是有关联的,它们间的序列只可能在100到300bp间,不可能中间间隔1kb,2Kb,这就是你做pair-end文库的限定。比你说的乱测全50bp的拼接要简单的。至于为什么要扩增,你想一个DNA分子你能检测到吗,所以一个分子要扩增至少20万个分子你的机器才能读到荧光信号。还有个测序要多少个细胞才能覆盖住全基因组,有个名词叫测序深度,好多年前一次测序得到的数据多是20多倍覆盖想请教下这个重叠法测出来的,它为啥会重叠呢,是不是主要是最开始的样本里就有很多套基因组,这样打断时,打断的地方不一样,所以重叠了,扩增并不能帮助重叠。另外测序深度,比如我测了3G的数据,生物基因组大小有300k,深度为10,可以理解为测了10遍,这10遍是不是重新采集的10个样本,重新构建的10个文库呢
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
shengwudemimi 想请教下这个重叠法测出来的,它为啥会重叠呢,是不是主要是最开始的样本里就有很多套基因组,这样打断时,打断的地方不一样,所以重叠了,扩增并不能帮助重叠。另外测序深度,比如我测了3G的数据,生物基因组大小有300k,深度为10,可以理解为测了10遍,这10遍是不是重新采集的10个样本,重新构建的10个文库呢是的样木基因组有很多套,怎么打断都有会片段可以将打断部重叠补起来,原理是这样的。测序深度是一次做库测的数据,不是多次
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
哦,这样,@泡泡糖原,1.测序深度:比如基因组3g,10倍深度,测序的流程是构建一个文库样本,两端加接头扩增,然后上机测序,是不是说这个扩增后的样本上机测了30g的数据量。那么这个30g的数据量是怎么测的呢。比如illumina,测的时候是每次加入四种dNTP,这个dNTP有化学保护,使得一次只能连一个dNTP上去,有1种dNTP连接上了,然后再把其他dNTP清洗掉,再去掉化学保护,再下一次循环。那么这个基因组一共就3g的大小,它这样每一轮进去,把该测的都测了,最后测出来也是3g的大小,这个30g是怎么出来的呢?2.测序过程:测序的时候,因为扩增的样本是打成了很多片段的,那么每一轮添加dNTP时,不同的片段是会连接不同的dNTP的。比如这个片段在这一轮连接的是dATP,那个片段连接的是dGTP,用激光激发荧光时它发出的是不同的荧光,这个机器怎么知道哪个片段到底连的是哪个dNTP?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园导读:高通量测序最新进展,目前最新款SOLiD5500xl含有两张微流体芯片(microfluidic,单次运行能得到的最大数据量为300Gb(使用最新设计的nanobeads),高通量是第二代和第三代测序技术的共同特点,由于使用高通量测序技术可以实现对不同组织mRNA表达差异进行检测,而高通量测序则能够很好地弥补基因芯片这方面的不足,高通量测序技术建立的时间还很短,高通量测序技术将会越来越成熟并得高通量测序最新进展
--------综合不同的测序技术 进入21世纪后,以Roche 454、Illumina Solexa和ABI SOLiD为代表的第二代测序技术诞生了,并迅速掀起了你追我赶的技术比拼高潮。2010年,Illunima和ABI先后发布新款测序仪,改进了原有机型,测序通量不断提升,测序成本不断降低,现在已经进入了数千美元测一个人全基因组的时代。
Roche 454 GS FLX Titanium每次运行能产生100万条序列,平均读长能达到400nt,且第400个碱基的准确率能达到99%。一次运行所需时间为10小时,能获得4-6亿个碱基的序列信息。
Illumina公司的第二代测序仪最早由Solexa公司研发,利用其专利核心技术\簇\和\可逆性末端终结(reversible terminator)\,实现自动化样本制备和大规模并行测序。Illumina公司于2007年初花费6亿美金巨资收购了Solexa。2010年初,Illumina将其第二代测序仪Genome Analyzer IIx升级到HiSeq 2000。
目前最新款SOLiD 5500xl含有两张微流体芯片(microfluidic FlowChip),每张芯片含有6条相互独立的运行通道(run lane)。每条lane都能运行相对独立的测序反应,这样的设计使得SOLiD 5500xl测序平台极具灵活性。最大测序读长为75nt,同样支持Fragment、Pair-end和Mate-Paired文库。单次运行能得到的最大数据量为300Gb(使用最新设计的nanobeads)。测序的系统准确性能达到99.99%。
技术推进科学研究的发展。随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题。比如在基因组水平上对还没有参考序列的物种进行重头测序(de novo sequencing),获得该物种的参考序列,为后续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序(resequencing),在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序(whole transcriptome resequencing),从而开展可变剪接、编码序列单核苷酸多态性(cSNP)等研究;或者进行小分子RNA测序(small RNA sequencing),通过分离特定大小的RNA分子进行测序,从而发现新的microRNA分子。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的DNA区域和基因组上的甲基化位点。 第三代测序: 1. Helicos公司 Helicos公司的Heliscope单分子测序仪基于边合成边测序的思想,将待测序列随机打断成小片段并在3'末端加上Poly(A),用末端转移酶在接头末端加上Cy3荧光标记。用小片段与表面带有寡聚Poly(T)的平板杂交。然后,加入DNA聚合酶和Cy5荧光标记的dNTP进行DNA合成反应,每一轮反应加一种dNTP。将未参与合成的dNTP和DNA聚合酶洗脱,检测上一步记录的杂交位置上是否有荧光信号,如果有则说明该位置上结合了所加入的这种dNTP。用化学试剂去掉荧光标记,以便进行下一轮反应。经过不断地重复合成、洗脱、成像、淬灭过程完成测序。Heliscope的读取长度约为30-35 nt,每个循环的数据产出量为21-28 Gb。 2. Pacific Biosciences公司 Pacific Biosciences公司的SMRT技术基于边合成边测序的思想,以SMRT芯片为测序载体进行测序反应。SMRT芯片是一种带有很多ZMW(zero-mode waveguides)孔的厚度为100 nm的金属片。将DNA聚合酶、待测序列和不同荧光标记的dNTP放入ZMW孔的底部,进行合成反应。与其他技术不同的是,荧光标记的位置是磷酸基团而不是碱基。当一个dNTP被添加到合成链上的同时,它会进入ZMW孔的荧光信号检测区并在激光束的激发下发出荧光,根据荧光的种类就可以判定dNTP的种类。此外由于dNTP在荧光信号检测区停留的时间(毫秒级)与它进入和离开的时间( 微秒级) 相比会很长,所以信号强度会很大。其它未参与合成的dNTP由于没进入荧光型号检测区而不会发出荧光。在下一个dNTP被添加到合成链之前,这个dNTP的磷酸基团会被氟聚合物(fluoropolymer)切割并释放,荧光分子离开荧光信号检测区。 3. Oxford Nanopore Technologies公司 Oxford Nanopore Technologies公司正在研究的纳米孔单分子技术是一种基于电信号测序的技术。他们设计了一种以α-溶血素为材料制作的纳米孔,在孔内共价结合有分子接头环糊精。用核酸外切酶切割ssDNA时,被切下来的单个碱基会落入纳米孔,并和纳米孔内的环糊精相互作用,短暂地影响流过纳米孔的电流强度,这种电流强度的变化幅度就成为每种碱基的特征。 一、测序技术总结与展望 第一代测序技术凭借其长的序列片段和高的准确率,适合对新物种进行基因组长距框架的搭建以及后期GAP填补,但是成本昂贵,而且难以胜任微量DNA样品的测序工作。第二代测序技术中,454序列片段最长,比较适合对未知基因组从头测序,搭建主体结构,但是在判断连续单碱基重复区时准确度不高。Solexa较454具有通量高、片段短、价位低的特点,可以用于大基因组和小基因组的测序和重测序。Solexa双末端测序(paired-end sequencing)可以为基因组进一步拼接提供定位信息,但是随着反应轮数增加,序列长度和质量均有所下降,而且在阅读AT区时有明显错误倾向。SOLiD基于双碱基编码系统的纠错能力以及较高的测序通量,适合转录本研究以及比较基因组学特别是SNP检测等,但是测序的片段短限制了该技术在基因组拼接中的广泛应用。第三代测序技术目前正在研发阶段,尚未正式投入使用。
高通量是第二代和第三代测 序技术的共同特点。由于这些测 序技术一次可获得上百万条、甚 至几百万条序列信息,因此可对 某一组织、某一时间表达的所有 mRNA进行序列测定,故又被称为 深度测序[32]。由于使用高通量测 序技术可以实现对不同组织mRNA 表达差异进行检测,通过与基因 组进行比较可以确定组织特异表 达的基因,因此具有取代“基因 芯片” 技术的态势。由于基因 芯片的检测范围取决于芯片上探 针的信息,因此只能检测人们已 知序列的特征,缺乏发现寻找新 基因的能力,而高通量测序则能 够很好地弥补基因芯片这方面的 不足。但就目前而言,高通量测 序技术建立的时间还很短,技术 不是很成熟,其信息储备量也很 有限;而基因芯片技术已经发展 了近16年,其实验技术及后期数 据分析理论已经很成熟很完备, 也积累了庞大的公共数据库,因 此短时间内基因芯片技术还会占 据主导优势。但相信在不久的将 来,高通量测序技术将会越来越 成熟并得到更加广泛的应用。 Genome Analyzer技术的基本原理: 1. 文库制备 将基因组DNA打成几百个碱基(或更短)的小片段,在片段的两个末端加上接头(adapter)。 2. 产生DNA簇 利用专利的芯片,其表面连接有一层单链引物,DNA片段变成单链后通过与芯片表面的引物碱基互补被一端“固定”在芯片上。另外一端(5’或3’)随机和附近的另外一个引物互补,也被“固定”住,形成“桥 (bridge) “。反复30轮扩增,每个单分子得到了1000倍扩增,成为单克隆DNA簇。DNA簇产生之后,扩增子被线性化,测序引物随后杂交在目标区域一侧的通用序列上。
3. 测序 Genome Analyzer系统应用了边合成边测序(Sequencing By 包含总结汇报、党团工作、外语学习、专业文献、IT计算机、资格考试、行业论文、工作范文、考试资料、教学教材以及高通量测序最新进展等内容。本文共2页
相关内容搜索

我要回帖

更多关于 第二代测序 的文章

 

随机推荐