Illumina二代测序平台比较的比较完整的介绍,比如什么是文库,什么是测序深度

&p&没有人回答“趋势”。那我来抛砖引玉,说说我的思考:&/p&&p&&b&申明:&/b&&/p&&p&&b&利益相关:&/b&是。&/p&&p&&b&转载要求:&/b&未经授权不允许转载,尤其不允许修修改改后用于商业目的。&/p&&p&另外,这个问题和&u&(&/u&&u&&a href=&/question/& class=&internal&&个人基因组测序降到 500 元以内后基因组学将有哪些大的改变? - 生物信息学&/a&)&/u&其实没有本质区别,建议有兴趣的童鞋两边都看看,或者把这两个问题合并了。&/p&&p&&b&——以下是絮絮叨叨的分界线——&/b&&/p&&p&先说个题外话。&/p&&p&1998年的时候,我正在上初中,家买了一台电脑,这是一台586电脑,要近一万元(价格记得很清楚,巨款来的)。牌子也记得很清楚,红壹佰(放在今天的话,妥妥滴华强北品牌),你问为什么价格和牌子都还记得这么清楚呢?因为同时期邻桌的富二代小伙伴家里也买电脑了,IBM的,还配上打印机,花了2w4——这个价格在当时的上海可以买断一套单位分配的公房。&/p&&p&在我家,这台电脑地位超然,大多数时候披着个盖头放在那里谁也不准动——谁想到十几年后,电脑不仅可以装在裤兜里,而且一年得换好几个,而且吃喝玩乐上班上学都离不开它呢?&/p&&p&书归正传,无论是价格、实用性、还是在老百姓中的普及度,现在的基因组测序所处的位置,或许就是当年的586。而在98年至今,一波又一波的计算机、信息化、互联网热潮,终于彻底地改变了人们的生活方式,也改变了科学研究、工业生产、国家经济,甚至把商业模式彻底颠覆又颠覆了好几个轮回。&/p&&p&这一切也都会发生在和生物行业相关的方方面面,并且由于其与人类自身的健康、生殖密不可分的特殊性,它造成的冲击层面只会更多、更广泛、更颠覆。&/p&&p&&b&——以下是跳到结论的分界线——&/b&&/p&&p&1.
临床检测,从只有极少部分人群适用的遗传病检测逐渐普及为常规检测(甚至出生时的健康档案)的一部分。&/p&&p&2.
健康人群,从只有少部分有钱有知识的高端人士专享普及到城市中产阶级健康管理的一部分。&/p&&p&3.
商业模式,从卖检测服务转化为极具互联网思维(不是简单的挂在网上哦,而是免费+收费+合作)的商业形式。&/p&&p&4.
伦理争议与政策风险并存。&/p&&p&5.
市场格局剧变。&/p&&p&6.
带动科研、新药研发、临床治疗手段的突破。&/p&&p&&b&——以下是广告的分界线——&/b&&/p&&p&先写结论,求赞求关注求收藏,我打算开一个专栏写写在基因检测行业的见闻和思考,但是级别不够。所以……&/p&&br&&p&&b&——这是自己挖的坑,含着泪也要填完的分界线——&/b&&/p&&p&&b&——临床检测方面——&/b&&/p&&p&其实,基因检测应用于临床已有多年,只是非常局限。&/p&&p&过去,医生诊断遗传病的流程是这样的:这孩子看上去不对劲——唔,脸部特征xxx,发育落后,肝脾肿大,呕吐昏迷,唔,怀疑代谢病,唔,做一系列血液尿液影像学检查,排除疾病a,疾病b,疾病c,疾病d后,高度怀疑疾病e——做基因检测验证——阴性结果?再从头排查——几个月甚至一两年才能确诊。&/p&&p&趋势是(其实已经开始了),医生诊断遗传病的流程是这样的:这孩子看上去不对劲——唔,做基因检测,一次性检测遗传病疾病a-z所有相关所有基因——检测结果发现可以导致疾病e的基因突变——孩子的临床指标也符合疾病e的特点——确诊,费时十几天甚至几天。&/p&&p&不仅仅是比较罕见的遗传病,甚至是糖尿病、高血脂、心律失常、癌症等“常见病”的诊断也会发生变化。现在,很多遗传性单基因糖尿病被误诊为I型或II型糖尿病,导致患者并没有获得最合适的治疗方案。未来的基因检测的广泛应用,使医生先进行基因检测,排除单基因糖尿病后,再结合餐后血糖、糖化蛋白等指标进行诊断用药。其他疾病的诊断也是类似。&/p&&p&这是对于临床思维的颠覆,是对医疗的颠覆,也是千亿级的市场。&/p&&p&&b&——健康检测方面——&/b&&/p&&p&健康检测和临床检测,技术上没有区别,区别只是在于一个是预防性质,一个是诊断目的。&/p&&p&那么如何衡量一项针对健康检测是否值得做?其实是一个天平秤。&/p&&p&天平左边是检测费用。右边是潜在受益,也就是发病风险x发病代价x健康理念系数。&/p&&p&如果右边大于左边,那么显然是值得去进行这项检测的。&/p&&p&一项一万元的心源性猝死基因检测。对于普通人,可能认为不值得,因为发病率低。但是对于年入百万,工作压力大,经常熬夜的金领人士(发病风险高),或者身家千万级的富豪(发病代价高),那显然是值得的。因为即使50-60/10万的发病风险,右边的代价显然远高于左边付出的检测费用。&/p&&p&这是现状。&/p&&p&趋势是什么?趋势是,左边的检测费用不断降低。同时一次检测所能覆盖到的疾病大大提高(右边的累计发病率提高,累计发病代价提高),而且随着越来越多人知道基因检测,健康理念系数也大大提高。&/p&&p&左右两边天平的倾斜,不言而喻。&/p&&p&这是基因检测未来能够普及到大众的根本原因。&/p&&p&这是一个万亿级的市场。&/p&&br&&br&&p&&b&过来撒点土——商业模式方面——&/b&&/p&&p&&b&筛查&/b&走政府项目,不赘述。&/p&&p&&b&临床诊断&/b&走学术推广,不赘述。&/p&&p&&b&个体化用药&/b&与药厂合作,尤其是儿童用药、肿瘤个体化治疗方面,不赘述。&/p&&p&&b&针对大众&/b&的最有意思,我来细说:&/p&&p&不考虑政策风险,很快会出现免费或者几乎免费的基因检测(几十万个位点的芯片,或者全基因组测序),然后每提供某一方面的结果收取少量费用,由消费者或合作方承担——&/p&&p&宝宝出生时,看看有没有遗传病,或者预测一下宝宝未来的相貌脾性,几百块,家长和政府买单;&/p&&p&宝宝喝奶粉腹泻?看看是否存在乳糖不耐受,需要换水解奶粉?几十块,奶粉厂买单。&/p&&p&生病了该选什么药?几块,药厂买单。&/p&&p&长大会有什么疾病风险?几百块。保险公司买单。&/p&&p&应聘销售员老板想看看你酒量?几块钱,老板买单。&/p&&p&到年纪了该找对象?基因配对,帮你找到另一半。婚恋网站甚至爸妈都愿意买单的。&/p&&p&……&/p&&p&我不是开玩笑,真的有这样的服务可以延伸的。看下图:&/p&&img src=&/353e194bdfbfa41d63dfabb3dff11d8b_b.jpg& data-rawwidth=&554& data-rawheight=&415& class=&origin_image zh-lightbox-thumb& width=&554& data-original=&/353e194bdfbfa41d63dfabb3dff11d8b_r.jpg&&&br&&p&(图片来自:知因网站活动链接&a href=&///?target=http%3A///project/67& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&落入凡间的月老红绳——基因配对活动&i class=&icon-external&&&/i&&/a&,貌似帮精皮士做广告了。精皮士老板你看过来!!给我广告费啊!!!)&/p&&p&参考23andme,目前已经能提供的此类结果至少有200+以上,覆盖方方面面。但是作为疾病诊断或者健康预测的精度是不够的。所以要真正实现基因测序能在疾病诊断、健康管理、还有我说得趣味应用方方面面实现整合,最终还是要靠全基因组(至少是全外显子测序)测序,而不是简单查SNP即可。&/p&&p&只要有这个人的基因组数据,那么这服务就能无限延伸。长远看来,效益远高于前期付出的检测成本。当然,短期来看,这个前期投入还是很大的,所以要么有足够的资金和互联网经验(国外最成功的23andme是谷歌撑腰的,貌似水果公司也要搞基因数据服务了,国内嘛,目前还没有这样量级的公司进入这个领域,或者采用这样的模式在运营。)&/p&&p&另外就是看谁有这个技术突破,能把全基因组测序成本降到500元以下了。&/p&&p&另外这些数据反过来又非常有助于提升对疾病、医疗的认知,再回过头又可以进一步为用户提供分析,可以说是形成无限循环。&/p&&br&&p&——伦理争议方面——&/p&&p&——政策风险方面——&/p&&p&——给业内的一点鸡血——&/p&&p&——给准备踏入行业的一点建议——&/p&
没有人回答“趋势”。那我来抛砖引玉,说说我的思考:申明:利益相关:是。转载要求:未经授权不允许转载,尤其不允许修修改改后用于商业目的。另外,这个问题和()其实没有本质区…
楼上的很多人已经给出了比较准确的解读,而且很多回答能把一些晦涩的生物学概念用很浅显的语言和例子做以说明,深入浅出地介绍给非生物专业的读者,非常不错,值得学习。&br&&br&不过这里本人就做一个小小的补充:&br&&br&1)文章提到的基因检测,其实确切的说是&b&direct to consumer genetics testing&/b& (直接面向用户的基因检测)。通常使用的方法是通过检测某些基因位点(这里不是对基因(组)进行测序)然后对一些&b&常见病&/b&风险进行评估,给出一个患病的百分比,然后用户根据检测结果,在日后的生活中对饮食,生活方式以及相关的方面进行预防和干预。这种检测,个人认为更具“娱乐”性质,不太具有临床指导意义。为什么呢?首先给出一个百分比就是一个很难解读的结果。比如,患二型糖尿病的风险26%,相比于平均人群的风险24% 高出2个百分点,这个2个百分点之于一个个体而言意义几乎为零。其次,评估风险的疾病大部分是一些&b&常见病&/b&。不同于罕见病(大多数是单基因或少数基因造成,且基因型和疾病表型的关系比较简单明了)的是常见病大多数是多基因,以及基因和环境的相互作用造成,致病机理也相对复杂。目前,通过GWAS研究找到的和常见病相关的基因位点(具体方法原理参见&b&火焰之河&/b&的回答里面关于2米小明的例子),很多只是证明的相关性,但是对造成疾病的作用(effect)有多大,有的还没有很好的功能性实验的证据。所以说,对常见病的患病的风险评估本身是一个非常具有挑战性的工作,目前的基因检测也只能做到靠大量的数据统计计算一个百分比的程度,生物学意义和临床意义都不大。&br&&br&2)这种直接面向用户的基因检测其实是基因检测发展到近期,努力市场化的一个产物。但是这并不代表基因检测的&b&全部应用&/b&。 很多消费者其实不了解基因检测的应用,错误的认为基因检测就是用来预测疾病风险的,这样误解加上new york times上这样的报道,很容易让人们产生基因检测“不靠谱”的错误印象。事实上,基因检测还大量运用在临床检测方面(不同于直接面向用户的基因检测,这样的服务可以称作&b&面向医生/病人的基因检测&/b&),这也是我一直强调的具有临床意义的基因检测。个人认为,目前的技术水平将基因检测使用在确切的具有临床指导意义的医学检测更实际,也更加“靠谱”。那么临床上如何应用基因检测的呢?这里举几个例子&br&&ul&&li&本人工作的地方是美国一家大学附属医院下面的独立实验室,主要提供罕见病的基因检测。这里检测的大部分样本不是来自于“健康人群”,而是来自于病人的。这些病人因为出现某些罕见病的症状,去看医生,然后医生根据身体检查,做一些基本的检测,怀疑某种罕见病。于是,为了&b&帮助确诊&/b&,医生将病人refer到实验室做基因检测。向我上面提到的,罕见病一般是单基因或者少数基因的突变造成的疾病,并且&b&基因和疾病的关系比较明确&/b&,所以这类针对罕见病的检测,一般不会检测整个基因组,而只是针对可能的&b&一个或几个致病基因&/b&进行深度的测序和分析。一旦找到明确的致病基因,那么该疾病的诊断便可以确立。再加上大部分罕见病也是遗传病,所以基因检测的同时,还为病人及家属提供遗传咨询服务,比如显性隐性的遗传概率多大;父母能否生育正常的孩子;病人将来生育遗传疾病给下一代的概率多大,等等之类。&/li&&li&关于罕见病,目前还有个应用就是:有少数的病人患了病后,根据临床症状连医生都没办法确切地知道是什么疾病,通常这个叫做&b&undiagnosed disease(未确诊的疾病&/b&)。这样的病人现在有一个选择,就是做全基因组或者全外显子组测序,试图通过这样的基因检测,找到致病基因,然后把基因以及已知基因的功能和临床症状联系起来,看看能不能试图找到治疗方案。目前美国有实验室和公司都有提供这样的服务,也的确有病人通过这样的基因检测最后确诊了疾病,并且得到有效的治疗。不过这个技术目前更多使用在比较棘手的病人身上,因为测序尤其是数据的分析和解读非常困难且耗时,需要有经验的专业人员来做。&/li&&li&基因检测目前还用于癌症的诊断和治疗,主要在指导靶向药物的使用。比如病人患了癌症,可以对其癌变的组织进行检测,察看是哪个突变基因造成的癌症。肺癌白血病等都有针对某一个突变基因的靶向抗癌药物。如果病人刚好携带那个突变的基因,便可以使用对应的靶向药。这样的治疗不同于化疗,对病人的伤害比较小。但临床上有时候是和传统方法结合起来使用。但是,目前的靶向药物不多,如果病人即便得了癌症,但是不携带靶向药物针对的突变基因,那么靶向药物就起不到作用。&/li&&li&同样还是癌症,最近有研究发现对于癌症的划分可以不再遵循发病的器官,比如乳腺的癌变就是乳腺癌,结肠的癌变就是结肠癌。而根据基因检测的结果,可以把癌症按照致病的突变基因来划分。比如两个不同的病人,一个乳腺癌,一个宫颈癌,看似不同的疾病,但是可能是同样的基因突变造成的,且癌变组织里的其他分子特征都非常类似。那么这种情况下,可以把用于该突变基因的靶向药物同时使用在不同的癌症病人身上。这种做法已经在一些临床案例中证明有效的。去年大概CNN还是某个知名媒体就报道了一个神奇的案例,那个病人患白血病,不断地化疗但是复发,后来通过基因检测和基因表达谱的检测,找到异常基因是一个经常造成肾癌的突变基因。于是医生大胆地把治疗肾癌的药物用在这个病人身上,结果白血病治好了。&/li&&li&药物基因检测。这个在临床上也有应用。因为每个人对药物的代谢和反应是不同的,这个主要是由体内药物代谢的酶决定的。为了防止不良药物反应,主要针对病人代谢药物的基因进行检测,根据不同的基因型,来给病人特定剂量的药物。比如用于针对抗血栓药物的warfarin(华法令)的药物基因检测,目前比较广泛应用在临床。&/li&&/ul&以上举的一些例子,就是基因检测在临床上的应用。个人认为这才是现阶段基因检测的主要战场,并且是对病人具有实质帮助的基因检测。比起那些所谓的面向用户的疾病风险预测的检测,个人觉得如果好奇的话去玩玩可以,但是别太当真。反正我自己是不会做这样的检测,因为意义不大。不过23andme里检测有上面提到的药物基因组的检测,这个可能还有点意义吧。&br&&br&还有一个就是关于癌症的screening (筛查),个人觉得这个检测对于有&b&癌症家族史&/b&的人还是有意义的。但是对于普通人群,如果体检的时候想做个癌症基因筛查,我觉得这个意义还有待商榷。因为如果没有家族史的话,非遗传性癌症,那大部分是自发性的癌症,这样的话通过血液测癌症基因不一定能检测到。但是鉴于本人还没有详细的了解过这些筛查都包括哪些癌症哪些基因,目前不好评论,以后如果有详细资料的话可以拿出来讨论一下。&br&&br&矮马,第一次在之乎回答问题码了这么多字,不过都是想到什么写什么,希望大家可以指正,提问和讨论!
楼上的很多人已经给出了比较准确的解读,而且很多回答能把一些晦涩的生物学概念用很浅显的语言和例子做以说明,深入浅出地介绍给非生物专业的读者,非常不错,值得学习。 不过这里本人就做一个小小的补充: 1)文章提到的基因检测,其实确切的说是direct to…
谢邀,今天和导师闲聊关于这个话题很久,也没得出太多结论。先说一说我的观点:我认为如果仅限于“&b&测序成本的降低&/b&”对“&b&基因组学领域内&/b&“的影响,那么只能说比较有限。但是一旦考虑到对领域外科研、产业界再到更广泛的日常生活,其影响恐怕会逐渐扩大到无法估计。&br&&br&对于基因组学研究,我认为不会有质的变化。原因是,在巨大的投入下,&b&前沿科学研究是可以不计成本的&/b&,尤其对于本领域的核心技术。&br&&br&当下个人基因组测序是约5000USD的情况下,那么想要知道降100倍会怎么样,可以参考以前成本更高时的状况,通过比较自然能得出部分结果。&br&&br&大约20年前还没有illumina等高通量测序技术的时候,人类基因组的测序预算约为1美元/碱基,一个基因组要30亿美刀。当时甚至在美国各地建立了基因组测序工厂,雇佣了上千名员工,用五年时间来测一个基因组。&br&&img src=&/bd48b02bfb85a51c09b0671b_b.jpg& data-rawwidth=&426& data-rawheight=&323& class=&origin_image zh-lightbox-thumb& width=&426& data-original=&/bd48b02bfb85a51c09b0671b_r.jpg&&当第一个人类基因组序列完成的时候,还没有高通量测序技术。而如今我们的人类基因组参考序列(hg19),几乎都是来自于那一次测序。&br&&br&到了2005年前后,第二代测序技术开始涌现出来。这下成本一下子下降几万倍啊!那么它们带来了什么影响?首先是千人基因组计划(1000 Genomes Project),既然便宜了上万倍,那么”给你少一点预算,再去测一千个来看看“是一个很容易想到的事。然后是带动生物信息学的发展,这个也很好理解,数据一下子爆炸了,需要更高效地分析比较来挖掘得到更多深层次的结论,比如SNP啊,单倍型啊等等。这些影响持续至今,已经变成基因组学研究的主流。&br&&br&如果测序成本进一步降低至500RMB,也不过近百倍,所以可预测的影响是很有限的:不会超出上一段所提到的两方面。具体的来讲,&b&一方面,能测得更深更广。&/b&比如,一个国家政府就可以轻松承担一个千人或者万人基因组计划;我们可以把常见动植物统统拿来测一遍;把一个动物或人每隔一段时间就测一下基因组和转录组,看看时序性差异……&b&另一方面,充足的数据将推动生物信息学研究从个体走向群体,从群体走向群体间。&/b&比如,把一个科里的所有属的代表物种都测了,就可以推算出这些属之间在进化上的关系;结合人类学研究一下人类起源;功能基因组学等等……&br&&br&进一步地讲,&b&基因组学中很多前沿的问题不是单单靠测序成本的降低就能解决的&/b&。比如另一位答主提到的非编码RNA。现在以平均5000USD的成本,我们已经得到了上千个个人基因组序列。理论上来讲,数据量足够我们鉴定并标记出绝大多数未知的非编码RNA,但为什么我们现在还做不到?是因为我们对非编码RNA缺乏认识。反观编码蛋白质的基因,我们有着充分的认识,从序列结构的共性(三碱基的密码子、内含子和外显子、启动子以及转录因子结合域)以及功能(蛋白质相关的研究)。这些认识大多来自于上世纪60年代开始遗传学、分子生物学等其他领域研究的结晶。在人类基因组计划启动前,科学家已经对各个物种上万个基因逐个克隆到载体上进行过研究。所以,&b&要先在分子水平把基因从结构到功能研究清楚了,我们才有资格提出研究基因&/b&&u&&b&组&/b&&/u&(组这个字要大写)&b&。&/b&所以,想要研究非编码RNA,第一步是把它们一个个作为个案来仔细研究,而不是上来就高通量。同样地,染色质三维重构、单细胞基因组学等前沿方向的瓶颈统统不是测序成本。&br&&br&综上所述,一个领域的发展不仅需要领域内核心技术的突破,更需要相关领域的积淀来推动。&br&&br&============================================&br&当然,测序成本的进一步降低确实可以对领域外科研、产业界再到更广泛的日常生活产生更大的影响,也非常值得大家讨论。但是:1)这不是我专业范围。2)不好意思,离题了。
谢邀,今天和导师闲聊关于这个话题很久,也没得出太多结论。先说一说我的观点:我认为如果仅限于“测序成本的降低”对“基因组学领域内“的影响,那么只能说比较有限。但是一旦考虑到对领域外科研、产业界再到更广泛的日常生活,其影响恐怕会逐渐扩大到无法…
当前基因的检测报告目前能够比较可信的是遗传性疾病和靶向药物的分析,23andme是拥有当前最大的基因和表型关联数据库,所以最近频繁的和一些药厂签署了合作的大单。&br&健康相关的基因检查报告,更多的是给自己一个提醒和参考作用,报告本身的意义目前并不是特别大。&br&PS,我们做了一个&a href=&///?target=http%3A//& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a& 提供23andme的接口做中文的基因检测分析报告。有兴趣的可以登录上来看看。&br&同时我们在做一个有偿祖源的调查,用于建立中国民族姓氏区域的分析图谱。
当前基因的检测报告目前能够比较可信的是遗传性疾病和靶向药物的分析,23andme是拥有当前最大的基因和表型关联数据库,所以最近频繁的和一些药厂签署了合作的大单。 健康相关的基因检查报告,更多的是给自己一个提醒和参考作用,报告本身的意义目前并不是特…
这个行业发展还是很快的,目前国内有仪器平台且进行商业化服务的公司机构估计有近二十家了吧?这还只是国内的不包括千年基因这种国外的公司。&br&
有自己仪器平台且比较大的公司最早那批都是有国家的单位做背景的或密切相关的,比如目前国内市场占有率较高的BGI这个地球人都知道,是当初的北方中心,现在的诺赛就和北方中心有密切联系。然后生物芯片国家工程中心的上海中心是上海生物芯片公司,旗下的伯豪是做芯片和测序的,又整合了上海生物芯片公司的另一子公司南方基因;生物芯片国家工程中心的北京中心是博奥公司,在北方地区占有率较大。&br&&br&
上面的几个历史“悠久”的公司中很多中高层员工都出去创业了,就我知道的说一说:&br&&br&&br&
华大系:最有名的的现在应该是诺禾致源(李瑞强)和贝瑞和康了吧。其他的有安诺优达、未来组、百迈客等。这个应该让&a class=&member_mention& data-hash=&96ebce54a6d2e8be1bf5& href=&///people/96ebce54a6d2e8be1bf5& data-tip=&p$b$96ebce54a6d2e8be1bf5& data-hovercard=&p$b$96ebce54a6d2e8be1bf5&&@GentleYang 杨振涛&/a& 和&a class=&member_mention& data-hash=&aed9& href=&///people/aed9& data-tip=&p$b$aed9& data-hovercard=&p$b$aed9&&@陈钢&/a& 来说说哈。&br&&br&
上海生物芯片公司系:与测序相关的我知道的有上海的欧易生物、晶能、其明,北京的康普森等,好像康普森的老板之一也在贝瑞和康呆过。欧易、晶能、其明都是上海生物芯片公司的销售高层出去创建的。前两者有自己的测序平台(有的没有所有权有使用权)。其明公司是国内成立的比较早的专门做高通量生物数据分析的公司,成立于2005年年底,专门做生物芯片及高通量测序的数据分析,直到2011年才建立了Affymetrix的芯片平台算是有了wet lab。现在从其明公司也出走了一些人建立了自己的公司,一个是上海烈冰,发起人除其明公司原员工外还有上海交大的几个博士。另一家算是其明系的公司在北京,北京中康博,似乎2012年才成立。&br&&br&
做纯粹的数据分析公司还有上海丰核和上海敏芯,不过印象中敏芯一直靠办培训班赚钱和使用客户不知道的免费软件来进行服务,不知现在发展得如何有无自己的研发产品了。上海丰核是上海交大几个博士自己创办的公司,去过一次很朝气蓬勃的感觉。&br&
苏州众信与上海生物信息中心有密切关系。据小道消息说上海生工和欧易等的454测序数据都是众信的人帮分析的。&br&
上海派森诺是上海交大老师建立的。上海佰真也是,佰真背靠上海交大的Bio-X中心,平台那叫一个多啊看得口水哗哗的(不过再多也没BGI多哈哈)&br&
上海其他公司还有康成生物、美吉生物,上海生工2011年的时候听那里的人说要买测序仪不知买了没有。还有个天昊生物是复旦大学金力实验室的几个博士创办的,发展得很不错。&br&
Lifetech、联川这种国外公司就不说了。韩国千年基因最近把市场价格打压得很厉害,我甚至都怀疑是不是为了得到数据才这么便宜的……不过做的客户不多,因为要把样本送到首尔去做,有的客户跟我说样本出国怕被基金委知道了再也申请不到基金了哇哈哈……&br&
还有一些研究机构也进行商业化测序及分析服务比如北京计算中心,我习惯性把药明康德也算这类里,都是兼职服务的哈。&br&
广州赛业一直是做干细胞和转基因小鼠的,现在在苏州太仓成立了子公司也做测序服务,是Complete Genomics的代理。公司的办公地点就在太仓市生物信息中心的楼里。&br&
还有一些比如深圳华因康、武汉生命之美等就是只知道名字其他啥也不知道了……&br&&br&
居然写了这么多,本来只想休息五分钟的啊……抛砖引玉了吧,刚来知乎,生信行业的人不是很多啊……
这个行业发展还是很快的,目前国内有仪器平台且进行商业化服务的公司机构估计有近二十家了吧?这还只是国内的不包括千年基因这种国外的公司。 有自己仪器平台且比较大的公司最早那批都是有国家的单位做背景的或密切相关的,比如目前国内市场占有率较高的BGI…
我是华大产业公司的员工,张勇在华大也算领导层吧,之前的那位匿名用户的确说的有点极端。但是!!!吐槽开始,华大的工资的确很低,基层普遍赶不上深圳的平均工资,就更不用跟百度华为比了,同学聚会时都只能默默的低头,一点点钱都跟员工计较。这样气魄的公司,牛也更多是吹起来的吧。一边说承诺是金,一边还不停的给你重新划坑,就怕坑不死我们这些底层员工。即便不谈钱,说起文章挂名,众多同事也是一把鼻涕一把泪,就不说那些被某些领导抢一作抢二作的事情了吧。不否认,华大的确凭借着国家和其他科研机构的资金以及生物富士康模式做了好多贡献,正所谓一仗功成万骨枯,大家看到华大牛逼闪闪的 CNS 和汪健王俊口沫横飞的时候,谁又能想起我们这几千被当做炮灰的蝼蚁呢。
我是华大产业公司的员工,张勇在华大也算领导层吧,之前的那位匿名用户的确说的有点极端。但是!!!吐槽开始,华大的工资的确很低,基层普遍赶不上深圳的平均工资,就更不用跟百度华为比了,同学聚会时都只能默默的低头,一点点钱都跟员工计较。这样气魄的…
&p&谈到隐私,我们不妨回忆一下数年前(甚至持续至今的)关于互联网信息安全/隐私的争议。然而争议归争议,互联网还是不可避免地席卷了我们的生活。所以我想,互联网在带来隐私问题的同时也带来了令人无法抗拒的好处。&/p&&p&基因信息所产生的隐私问题,与互联网的既有相似又有不同。但是无疑的,有两点它们是完全一致的:第一,基因技术与互联网技术一样,是不可逆转的时代方向,避无可避。第二,基因技术与互联网技术一样,是善恶并存的。&/p&&p&所以我想,我们在畅享基因隐私泄露导致的“最坏的假设”导致的恶果时,也应当考虑这些技术带来的福祉。这样才能客观地选择和使用这个技术。好比有些妈妈听说抗生素滥用导致细菌耐药性的问题后,坚决拒绝让患病孩子服用抗生素一样,因噎废食并不是我们所希望看到的后果。&/p&&p&基因隐私涉及多个层面的伦理问题。我们就几位答主@三娘娘、@张帆 所提到的问题逐一解读利弊:&/p&&p&&b&1.
基因信息可以识别身份?&/b&&/p&&p&&b&2.
基因信息可能暴露意外的亲缘关系(非亲缘关系)?&/b&&/p&&p&&b&3.
基因信息可用于推测个人特征?&/b&&/p&&p&&b&4.
基因信息可能导致基因歧视?&/b&&/p&&p&&b&5.
基因信息可能导致保险公司歧视性/差异性定价策略?&/b&&/p&&p&&b&6.
基因信息可能被用作新型杀伤性生物武器的研制?&/b&&/p&&p&以及:&/p&&p&&b&7.
什么类型的基因检测更存在这方面的隐患?&/b&&/p&&p&&b&8.
我该如何注意避免泄漏基因隐私?&/b&&/p&&p&答:&/p&&p&&b&1.
基因信息可以识别身份?&/b&&/p&&p&是的。每个人的基因都不尽相同,尤其是STR(短串联重复序列)。不同到什么程度呢?理论上,任何两个人(除了同卵双胞胎以外),只要检测几个DNA不同区域的STR,就可以进行区分。并且,这种STR也是由父母遗传给孩子的,因此孩子的STR序列中,可以匹配到双亲的特征。STR的这些特点,决定了它可以用于身份识别和亲子关系的鉴定,就好像是一份基因层面的身份证——无法伪造、无法丢弃、不会被冒领。&/p&&p&这个技术其实已经非常普及了,公安、司法、亲子鉴定一直都在使用。尽管存在争议,但我个人非常希望这个技术能够进一步的普及到每一个——如果每个孩子在出生时都进行了这样的检测,那么被拐卖的儿童可以很容易找回他们的父母,而拐卖儿童也将无利可图。&/p&&p&&b&2.
基因信息可能暴露意外的亲缘关系(非亲缘关系)?&/b&&/p&&p&是的。一谈到这个话题就能脑补好多剧情,并且都能上晚八点档,这里可能有很多伦理争议,但是问题并不出在检测本身。&/p&&p&好比说孩子受伤需要输血,父亲去献血发现血型不匹配,意外发现了孩子不是亲生的。基因检测是“更高级别”的血型检测(可能携带更多信息,用于鉴定亲子关系要比血型靠谱多了)。但本质上,除了亲子鉴定以外,为了诊断或其他目的而进行基因检测,结果以外发现孩子非亲生,这就跟献血发现孩子不是亲生没有什么区别——你能因此说献血技术本身不道德吗?另外,如果血型一样,只知道孩子是什么血型的,不能判断孩子是不是亲生的,必须同时知道父双方及孩子的才能判断。基因检测也是一样,如果只对某一个人进行检测,是不能判断亲缘关系的,必须同时检测这个人及他的亲属(或者把这个人的基因信息拿出去跟一个很大的数据库进行比对)。&/p&&p&&b&3.
基因信息可用于推测个人特征?&/b&&/p&&p&是的。但是目前不能做到准确推断的,主要还停留在科研,刑侦方面国外有一些试探性的应用,比如通过犯罪现场留下的嫌疑犯的精斑来推测嫌疑犯的外貌特征(头发颜色、眼睛颜色等等。但是准确性还不能保证,并且由于这些特征可能会被掩盖,因此也只是作为参考。&/p&&p&需要说明的是,要想推测一个人的多维度的个体特征,需要拥有一个人非常完整的基因信息。如果只是检测很小一部分基因片段,那么能推测的个人信息就很少。比如上面所说到的STR检测,由于只是定向的检测这些特征序列,因此只能用于身份识别,鉴定出你是你,而不能由这个结果来推测你的身高、体重、眼睛、鼻子。&/p&&p&&b&4.
基因信息可能导致基因歧视?&/b&&/p&&p&是的。每个人的基因都不是那么“完美”,多少携带有一些遗传疾病的致病基因。存在由于携带了致病基因而被歧视的可能性。就如果其他答主提到的,如果儿媳携带某种遗传病基因的隐私被婆婆知道了,挑三拣四的婆婆可能会嫌弃儿媳是某遗传病的携带者。&/p&&p&但是同样的,我们也看到,基因信息也有助于在某种程度上降低歧视。举个例子,工作中我们遇到过一对来咨询的男女朋友,因为女方的侄子是一个苯丙酮尿症的孩子,所以男方的家长百般阻挠两人结婚——不得已,两人只得通过基因检测证明两人并没有同时携带这个基因,结婚不会影响生孩子。另一方面,由于每个人几乎人人都或多或少地携带了“不好”的基因,大家也就谁也别歧视谁了吧?&/p&&p&&b&5.
基因信息可能导致保险公司歧视性/差异性定价策略?&/b&&/p&&p&是的。这是对人们最直接的影响了。如果基因检测技术足够普及,可靠性足够高,并且价格足够低廉的情况下,保险公司可能先对你进行基因检测,然后根据你基因检测的结果来估算你的保费。当然,这个在美国是不被允许的,因为法律规定保险公司不得根据基因检测结果制定差异性的保险策略。中国目前还没有相应的法律,但是随着基因行业的兴起,相关规范也指日可待。&/p&&p&如果没有法规的约束,那么保险公司的差异性定价就一定是坏事吗?也不见得。投保人与保险公司之间的关系可以用博弈来形容。一方面保险公司势必要从投保人身上赚钱,另一方面也必须提供有吸引力的条款来促进投保。为了吸引投保人,可能出现以下情况:原来直接拒保的或者拒绝理赔的遗传疾病,现在可能能推出相应的保险产品了。原来一刀切的保额,现在可能能够针对投保人不同疾病风险而进行调整了。比如:保险公司在对投保人进行癌症风险评估后,发现其乳腺癌风险较高而结肠癌风险较低,因此将原有一刀切的20w保额修改为:乳腺癌赔付30w、结肠癌赔付5w。&/p&&p&当然,由于目前国内的保险公司还没有推出跟基因检测挂钩的保险条款,因此这些也只是猜测。(目前市面上有买一些买癌症保险送基因检测的,这些不影响保险费,只能算是为保险促销。)事实上,也有保险公司曾经试图给投保人做体检后根据他们的健康状况来评估保费,但是投保人并没有很买账,这种类型的保险卖得不好。&/p&&p&(题外话,如果实在担心,那就趁现在买好保险吧。)&/p&&p&&b&6.
基因信息可能被用作新型杀伤性生物武器的研制?&/b&&/p&&p&这个是最不需要个人来担心的。即使真的有这样丧心病狂的研究,那也是基于人群的研制,和你个人的基因检测结果没啥关系——何况国外那么多华裔,基于华裔的基因数据库人家早就有了啦。&/p&&p&以及:&/p&&p&&b&7.
什么类型的基因检测更存在这方面的隐患?&/b&&/p&&p&市面上的基因检测主要可以分成以下几类,其所对应的基因隐私问题的程度并不相同:&/p&&p&&b&①
&/b&&b&单项基因检测,&/b&如99元的酒精代谢能力检测、199元的肥胖检测。这类型的检测只检测很少的基因位点,从数据价值来看并不高(也就是说,一方面,这个检测能够提供的健康建议并不多,但是另一面也没什么基因层面的隐私可以挖掘的)。充其量,也就是像淘宝买了一次巧克力,单凭这一次的购物,商家只能知道你的:1.姓名、地址、电话;2.你是个吃货。&/p&&p&&b&②
&/b&&b&疾病的基因检测&/b&。一般而言是针对某一遗传疾病,或某一类型的遗传疾病所设计的检测panel。检测公司也只针对可能引起疾病的突变进行分析,考虑到大多数人进行这种类别的检测都是有非常明确的诊断需求,对“治病救人“的渴求要多过对隐私的担忧。&/p&&p&&b&③
&/b&&b&全外显子、全基因组检测,或检测位点非常多的芯片检测。&/b&这类型的检测是真正意义上的”大数据“,能够提供非常、非常、非常、非常大的信息。(好比像淘宝提供了你历年来所有的购物记录。那就有非常多的信息可以挖掘了。)一方面可以不断挖掘出新的与健康或者基因相关的信息提供给受检者(为什么说不断呢,因为我们对基因的认识是在在不断更新的,很多我们现在还清楚是什么意义的突变,会逐渐了解),另一方面其数据的大数据价值可能导致其挖掘出”隐私“数据。(活跃在知乎的@陈钢、@郑强
以999元的价格提供60w个位点的检测,但目前能在检测报告中检测的只占很小一部分,两位可以来讲一下对这个商品的基因数据和隐私是怎么考虑的)&/p&&p&④
亲子鉴定、司法鉴定:这些刚才说过了。&/p&&p&&b&8.
我该如何注意避免泄漏基因隐私?&/b&&/p&&p&①
了解检测的目的(是疾病的检测、某一个特性的检测、还是全部基因的检测?),根据需求来选择。&/p&&p&②
阅读知情同意书和条款,关注以下几点:检测公司是否会销毁你的剩余DNA样品;检测公司是否有权向第三方提供你的检测结果;检测公司是否有权将你的检测结果应用于科学研究;如果向第三方提供你的检测结果或应用于科研,是否是以匿名的形式;除你本人之外,是否其他人有权获取你的基因数据及查看你的检测结果,需要提供什么证明。&/p&&p&③
了解检测所使用的技术手段,从信息量来看:二代测序>高通量芯片>低通量芯片>一代测序。检测的价值也相应由高到低、隐私方面的隐患同样也是由高到低。@张帆所举例用的数据,就是信息量最大的全基因组测序(二代测序),目前大多数人还是承受不起的。&/p&
谈到隐私,我们不妨回忆一下数年前(甚至持续至今的)关于互联网信息安全/隐私的争议。然而争议归争议,互联网还是不可避免地席卷了我们的生活。所以我想,互联网在带来隐私问题的同时也带来了令人无法抗拒的好处。基因信息所产生的隐私问题,与互联网的既…
所谓$1000基因组,是二代测序行业内反复被提起的一个里程碑概念,打个比方就好比汽车工业里面的“10万元家轿”,开启了中国汽车市场的井喷时代。&br&&br&就像我在另一个问题里面(&a href=&/question//answer/& class=&internal&&为什么不同基因测序公司提供的分析结果大相径庭?&/a&)写过的,人的基因组这本蓝图,决定了每一个个体的几乎所有生理与疾病状态,所以测序的终极解决方案就是全基因组测序,把这本蓝图巨细无遗地全部解读出来。一直以来这件事情有三大障碍:速度、成本和数据解读。数据解读在前面问题里面也讲过了,还需要相当长时间,大量的实验数据,才能把越来越多的性状与基因组突变联系在一起,需要科研、临床和商业的共同努力。但是速度和成本就是Illumina这种商业公司可以独立解决的问题了。&br&&br&在所谓新一代测序NGS出现没多久,基因组测序的速度其实就已经在可以承受的范围内。比如当年广受报道、还被Times评为2012年十大医学突破的案例:一个8个月大的婴儿出现发育迟缓等症状,无法确定病因,最后在两天内做了一个全基因组测序,定位了致病基因突变。可见两天这个时间,无论对正常人、还是急症临床病人,都在一个可以接受的范围之内。&br&&br&那么最后一个障碍,也就是题目里面问到的“成本”问题。$1000美金里面应该是不计入昂贵的仪器折旧的,单纯算运行成本。从我自己的分析,其实这个里程碑早就可以达到了(从这里面开始我都打算匿了,哈哈),但是为什么一直没有宣布呢?还回到家轿的例子:大众桑塔纳进入中国那么多年,为什么当初一直卖20多万?那个时候除了这个你还有别的选择吗?&br&&br&Roche的454退出江湖了,Life的Proton到现在都达不到一次正常全基因组测序需要的数据量(100G bp左右)。。。。。。&br&&br&从目前放出来的千元基因组的仪器参数来看,比起此前的型号没有颠覆性的飞跃,技术应该也没有离开原有的原理,所以成本的下降应该是挤压自己原来的空间。那么为什么突然愿意放弃原有的超额利润了呢?首先这个仪器的定位其实并不是临床或者普通的小型科研公司,彩页上写的是“population-scale whole genome sequencing(大规模人群全基因组测序)”,说白了盯着的是测序国家队,比如最近英国在搞的10万人基因组什么的,这个是一个很重要的细分市场,而且也足够新,没有像样的竞争者,拿出一个专门的机型和相对廉价的试剂来直接掠夺掉是很正常的。其次这个机器是要求10台一买的,每次都是这样级别的大单,把试剂成本降下来也是应该的。&br&&br&这次Illumina在JP Morgan上动作很多,除了千元基因组外,还有另外一个桌面式NGS测序仪,可以说是Life的Proton杀手,然后又把低端型号MiSeq降价,想直接踩死PGM,最后又HiSeq 2500和无创产筛应用进入FDA申报,都是分分钟走向垄断的路线啊。&br&&br&Illumina股票去年是40刀,今年涨到100多刀,昨天一天又是7%,大家有兴趣,这个点位应该还可以买,因为公司的路子是对的,而且管理层头脑很清楚。
所谓$1000基因组,是二代测序行业内反复被提起的一个里程碑概念,打个比方就好比汽车工业里面的“10万元家轿”,开启了中国汽车市场的井喷时代。 就像我在另一个问题里面()写过的,人的基因组这本蓝图,决…
目前已有序列数据(并不是完整基因组数据)的动物分布:&br&&img src=&/cf7de08ea03c15cb844063_b.png& data-rawwidth=&733& data-rawheight=&761& class=&origin_image zh-lightbox-thumb& width=&733& data-original=&/cf7de08ea03c15cb844063_r.png&&&br&其实很多物种的基因组还没测,目前不存在测了又测,所以这个问题我把范围缩减在:为何&b&人的基因组测了又测&/b&上。&br&&br&首先要明白,一个基因组拼完后,得到结果的质量,就和圣斗士一样,是分等级的。当然因为逼格比较高,所以最高是白金级的,青铜什么的就不能算了。(目前一千美元能测的,应该算钢铁圣斗士。。。)&br&&img src=&/0c1b25eb0bf81cac1ed285ea383bf08a_b.png& data-rawwidth=&2842& data-rawheight=&1935& class=&origin_image zh-lightbox-thumb& width=&2842& data-original=&/0c1b25eb0bf81cac1ed285ea383bf08a_r.png&&GRCh38,也就是目前科研上使用的最新版本的人参考基因组,上图看上去数据很完美,但在指导医疗实践上是有问题的,因为它是来源于混合样本,并不能反映任何一个人的单倍型基因组。比如,MAPT(微管相关&img src=&///equation?tex=%5Ctau& alt=&\tau& eeimg=&1&&蛋白)区域,与神经退行性疾病(e.g.帕金森)高度相关的区域,在这种关键区域上,混合样本测得的DNA序列没什么意义。&br&&br&所以,现在老外搞了个“精准参考基因组”计划(中文名我瞎起的,英文名叫&br&Reference Genomes Improvement Project)。选取有代表性的人种:&br&&img src=&/0cf21ee8e8460bfa73e98d2da2eefb06_b.png& data-rawwidth=&3108& data-rawheight=&2062& class=&origin_image zh-lightbox-thumb& width=&3108& data-original=&/0cf21ee8e8460bfa73e98d2da2eefb06_r.png&&&br&计划采用的路线是用PacBio数据de novo组装,配合BioNano Irys光学图谱来搭脚手架。最后用细菌人工染色体+PacBio来补洞。&br&&br&&img src=&/708c02e6dfcaec_b.png& data-rawwidth=&1816& data-rawheight=&1156& class=&origin_image zh-lightbox-thumb& width=&1816& data-original=&/708c02e6dfcaec_r.png&&&br&这里稍微解释下,为何测高质量的个人基因组需要de novo,而不是resequencing:因为每个人各自都携带有自身独特的、正常的结构变异,使用resequencing也就是比对现成的参考基因组,那么这部分信息毫无疑问会丢失掉。这也是结构变异相关研究比较难做的地方,比如研究癌症,那么最好的对照不是其他正常人,而是自身的正常组织,比如癌与癌旁。&br&&br&参考资料:&br&&a href=&///?target=http%3A///science/article/pii/S00891& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&The evolution of animal genomes&i class=&icon-external&&&/i&&/a&&br&&a href=&///?target=http%3A//genome.wustl.edu/projects/detail/reference-genomes-improvement/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Project - The Elizabeth H. and James S. McDonnell III Genome Institute at Washington University&i class=&icon-external&&&/i&&/a&&br&&br&-------------------------------------------------更新---------------------------------------------------------------&br&&br&&b&Q&/b&: de novo 是不是更贵?&br&价格由选用的技术与所需数据量决定。当然de novo对数据质量、数量、读长、算力都要求更高。&br&&br&可以把测序拼基因组当成是拼图游戏,有参考基因组,就是拼图的时候,你已经知道最后要拼成的图是啥样子了,也就是可以大致确定手上的碎片是在哪个位置。而无参考基因组,就是拼的时候,并不知道最后结果是什么样子。&br&&br&拼图游戏的难点在于,图形是否有很多碎片都是同一个样子的(一个基因组是否有许多短重复序列),如果这些碎片完全相同(测序仪读长小于重复序列长度时),你是无法将这些碎片唯一定位到最后的拼图里的。
目前已有序列数据(并不是完整基因组数据)的动物分布: 其实很多物种的基因组还没测,目前不存在测了又测,所以这个问题我把范围缩减在:为何人的基因组测了又测上。 首先要明白,一个基因组拼完后,得到结果的质量,就和圣斗士一样,是分等级的。当然因为…
国内高通量测序服务公司表&br&&br&&b&1.
华大基因&/b&&br&
137台Hiseq;3台Miseq;27台Solid; n台Proton&br&
全方位高通量测序应用&br&
联系方式:400-706-6615,&br&&br&&br&&b&2.
药明康德基因组学中心&/b&&br&
4台Hiseq;4台Miseq;1台PGM。&br&
科研服务、测序外包服务、药企测序服务、Affymetrix生物芯片服务&br&
联系方式:021-,&br&&br&&br&&b&3.
贝瑞和康&/b&&br&
5台Hiseq;1台Miseq。&br&
无创产前诊断、科研服务、Illumina生物芯片服务&br&
联系方式:400-610-8005,&br&&br&&br&&b&4.
诺禾致源&/b&&br&
5台Hiseq;2台Miseq。&br&
科研服务、农林行业测序服务、De novo专家&br&
联系方式:010-,&br&&br&&br&&b&5.
安诺优达,&/b&&br&
3台Hiseq。
无创产前诊断,科研服务&br&
联系方式:010-, &br&&br&&br&&b&6.
北京药用植物所,&/b&&br&
1台PacBio,真正的三代测序仪,单分子测序仪。&br&
联系方式:010-&br&&br&&br&7. 康圣环球,Illumina官方临床合作伙伴,N台Hiseq,并同时有Ion Torrent平台。大型医学检验服务商。400-736-166&br&8. 达安基因临检中心,6台Proton,1台PGM,1台专门做SNP和甲基化的MassARRAY(SEQUENOM)。广州爱健(达安子公司)。2台Proton, 2台PGM。地中海贫血分析。联系方式:020-&br&9. 北京大学 Biopic 中心,3台Hiseq,&br&10. 新培晶上海医学检验所有限公司,1台Hiseq, 1台Miseq。医学检验服务商。021-&br&11. 上海南方基因中心,1台Hiseq,2台454,新采购1台PacBio。021-&br&12. 上海佰真公司,1台Hiseq,1台Miseq,1台PGM,1台454。021-&br&13. 广州锐博生物,1台Hiseq, 1台Miseq,1台PGM。400-686-0075&br&14. 上海凡迪生物,1台Hiseq 2500, 1台Proton, 1台PGM,产前诊断服务商,&br&15. 中科院北京遗传与发育所,1台Hiseq,1台454,1台Miseq,1台PGM。010-&br&16. 上海美吉,1台Hiseq,1台Miseq,2台454。微生物测序,宏基因组测序。联系方式:400-660-1216&br&17. 上海生物芯片公司/伯豪公司,1台Hiseq,1台Roche 454 FLX。联系方式:021-&br&18. 上海晶能,1台Hiseq。外显子组测序,Illumina生物芯片服务。联系方式:400-720-8232&br&19. 苏州众信,1台Hiseq。微生物测序。联系方式:2&br&20. 北京理化中心,1台Hiseq。010-&br&21. 上海康成。1台Hiseq。Exiqon指定中国服务商,生物芯片服务商,microRNA专家。021-&br&22. 北京博奥(北京生物芯片公司)。1台Hiseq 2000。专业生物芯片服务商。010-&br&23. 中科院上海分院,1台Hiseq。&br&24. 中科院基因组所,1台Hiseq。010-&br&25. 中科院遗传发育所,1台Hiseq, 1台Ion Torrent, 1台Roche FLX. 010-&br&26. 中科院国家基因研究中心(水稻基因中心),上海市漕宝路500号,1台Hiseq, 021-&br&27. 上海派森诺,1台Miseq,1台454。De novo, 宏基因组测序,RNA-seq专家。021-&br&28. 中科院北京基因组所,1台Hiseq,010-&br&29. 上海宝藤生物/上海张江转化医学研发中心,1台Hiseq。021-&br&30. 复旦大学医学院,1台Hiseq,明道楼5楼&br&31. 浙江大学医学院,1台Hiseq 2000。&br&32. 金唯智,1台Hiseq。一代测序服务商、寡核苷酸合成服务商。400-8100-66&br&33. 中科院昆明动物所,遗传资源与进化国家重点实验室,1台Hiseq&br&34. 中科院上海逆境生物中心,1台Hiseq, 1台Miseq&br&35. 上海天昊生物。1台Miseq。遗传分析,SNP分析专家。联系方式:400-065-6886&br&36. 尤尼曼,1台Miseq, &br&37. 张宗峰,1台Miseq,&br&38. 英骏生物,1台PGM。一代测序、寡核苷酸合成服务商,Life Tech公司子公司。800-820-8982&br&39. 联合基因,1台PGM。健康咨询。021-&br&40. 中美泰和,1台PGM,010-&br&41. 生工生物,1台PGM。一代测序服务、寡核苷酸合成服务领导品牌,常用生物耗材生产商、分销商。021-&br&42. 金域检验,1台PGM.大型医学检验服务商。&br&43. 赛哲生物,1台PGM。论文图文美化。400-888-4242&br&44. 华冠生物,1台PGM。021-1&br&45. 吉玛生物,1台PGM。shRNA合成服务商领导品牌。021-&br&46. 千年基因,在韩国有30台以上的Hiseq。2&br&47. 奥拓基因,在美国有2台Hiseq,
021-&br&48. 北京百迈客。De novo专家,农林基因分析专家,品种遗传改良服务专家。联系方式:400-600-3186&br&49. 北京迈基诺基因科技有限公司。健康服务。联系方式:010-&br&50. 科诺检验、科贝生物、苏州生物医药创新中心,这三家是同一个实体。主要从事医学检验、产前诊断。9&br&51. 北京博莱明创生物技术有限公司,010-&br&52. 广州瑞科基因。020-&br&53. 武汉未来组。De novo专家,生物分析专家。 联系方式:027-&br&54. 上海其明信息公司。Affymetrix指定服务商,生物信息专家。 联系方式:400-604-0030&br&55. 广州基迪奥生物。生物信息服务商。020-&br&56. 杭州锐创生物技术有限公司,二代测序,生物芯片,&br&57. 上海敏芯公司。生物信息学服务,代谢组实验。021-&br&58. 北京市计算中心。生物信息服务。联系方式:010-&br&59. 上海烈冰公司。生物信息服务商。021-&br&60. 青岛生物能源与过程研究所徐建 构建MP library(Mate Pair library),173.&br&61. 上海欧孚。建库服务,多种核酸抽提服务。&br&62. 北京毅新兴业。Sequenome质谱服务。联系方式:010-&br&63. 凯基生物。025-&br&64. 上海阿趣生物。&br&65. 艾博斯.&br&66. 博仕生物医学中心&br&67. 博苑生物&br&68. 上海丰核信息,课题设计,论文撰写,生物信息分析。&br&69. 上海朗通生物&br&70. 上海锐金生物医药科技有限公司&br&71. 赛业生物,曾经是Complete Genome公司在中国的代理商&br&72. 上海生咨&br&73. 翼科&br&74. 上海英拜生物&br&75. 武汉生命之美&br&76. 苏州帕诺米克生物公司,5&br&77. 北京源泉宜科生物科技有限公司, &br&78. 凌科生物,环境基因组/宏基因组数据分析,021-&br&79. 上海泉脉生物科技有限公司,二代测序,生物芯片,021-&br&80. 拜珐(上海)信息技术有限公司,二代测序,生物芯片,021-&br&81. 无锡艾吉因生物信息技术有限公司,自行设计的测序原理和测序机器,1, 中国人自主知识产权的产品,特别支持&br&82. 杭州联川生物,生物芯片服务商,代销二代测序,3&br&83. 深圳华因康基因科技有限公司,自行设计的测序原理和测序仪,0, 中国人自主知识产权的产品,特别支持&br&84. 北京康普森生物技术有限公司,010-&br&85. 博淼生物科技(北京)有限公司,&br&86. 上海欧易生物科技有限公司,生物芯片服务商,021-&br&87. 派利来生物,010-&br&88. 武汉菲沙基因信息有限公司,生物信息服务商,027-&br&89. 杭州英睿,2&br&90. 武汉大众源生,027-&br&91. 天津生物芯片,022-&br&92. 达迈生物,Illumina分销代理商,021-&br&93. 仁科生物,Illumina分销代理商,021-&br&94. 北京怡美通德,Illumina分销代理商,010-&br&95. 北京华生恒业科技有限公司, 生物信息学软件销售商,010-&br&96. 北京圣谷同创,N台Proton + N台PGM?, 010-
国内高通量测序服务公司表 1. 华大基因 137台Hiseq;3台Miseq;27台Solid; n台Proton 全方位高通量测序应用 联系方式:400-706-6615, 2. 药明康德基因组学中心 4台Hiseq;4台Miseq;1台PGM。 科研服务、测序外包服务、药企测序…
&p&===更新===&/p&&p&&b&源基因&/b&推出SNP检测的服务,测Y上的1800个SNP,价格是999元。同时也推出了女性用户也能测的线粒体检测服务。这个是用二代测序对整个线粒体全长进行测序,价格是1200元。&/p&&p&WeGene的价格和检测都保持没变,但在其平台上提供了K12b,K13等多个开源的常染色体admixture计算工具,使用起来很方便。开放了姓氏基因组,展示姓氏、祖籍和Y单倍群的统计分析结果。另外,下载的原始数据可以提交到GedMatch等第三方分析网站。&/p&&p&Again,利益相关,WeGene创始人。&/p&&p&===被严实老师点赞了,优化一下 ====&/p&&p&23andme,199美元,最近推出了只有祖源信息的低价版,99美元。大淘宝有代购的,优点是第三方分析多,数据质量不错,缺点是祖源无论是Y还是常染色体,对东亚人群都太糙了。最大的麻烦是买不进来,买进来了也寄不出去。60万位点的SNP Array。&/p&&p&Ancestry,99美元。分析更加糙,不过用户基数大,做了&200万人了。国内购买和送样品同样很不方便。60W+位点的SNP Array。&/p&&p&复旦大学严实老师,价格可查询分子人类学论坛置顶帖子。严实老师创业了,跟上海美吉生物一起做了源基因:&a href=&///?target=http%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&YooGene-一个遗传基因检测服务平台&i class=&icon-external&&&/i&&/a&。现在只提供24 Y-STR服务。不过严实老师的微信公众号说了,未来的重点肯定是测序,包括常染色体。&/p&&p&WeGene,999人民币,&a href=&///?target=https%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&WeGene - 个人遗传基因检测服务平台&i class=&icon-external&&&/i&&/a& 基于60W位点的SNP Array做Y单倍群和常染色体分析。下载原始数据后有一些第三方应用可以把玩。&/p&&p&利益相关:WeGene创始人&/p&
===更新===源基因推出SNP检测的服务,测Y上的1800个SNP,价格是999元。同时也推出了女性用户也能测的线粒体检测服务。这个是用二代测序对整个线粒体全长进行测序,价格是1200元。WeGene的价格和检测都保持没变,但在其平台上提供了K12b,K13等多…
10.28 已经标明了禁止转载,竟然还被『生物探索』这个公众号无耻抄袭了,没有注明出处。这个,能不能有点节操啊伙计们&br&&br&===================&br&&br&泻药。有错误或者偷懒的地方(看心情)慢慢更&br&&br&一句话:bgiseq500是远超预期的、有真正实战意义的国产测序仪(估计到广告法没有加上第一或者唯一之类的词但是其实大家懂的),是一款里程碑式的产品。&br&&br&先照例对老东家来一发吐槽。bgiseq500的官网 &a href=&///?target=http%3A//& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&BGISEQ500&i class=&icon-external&&&/i&&/a&。不加www无法解析,排版疑似ppt内完成然后截图上传成网页,jpg的边界超过div边框以至于文字被切掉一半,分辨率尴尬,jpg保存时质量值低到无法忍受(包括logo)(简直就是qq截图啊是不是啊就承认吧,哦好吧不是,全网页从头到尾就一张图截图截不出来),所有文字无法复制、被搜索……&br&&br&哎呀跑题了,还是说说BGISEQ-500这款测序仪本身吧。&br&&br&&ul&&li&&u&&b&定位&/b&&/u&:BGISeq-500(内部开发代号Zebra)从命名上就很微妙,看起来直接竞争对手就是illumina 家的NextSeq 500。之前也有两款国产测序仪,中科紫鑫BIGIS-I和华因康PSTAR-II,在这个贴里我觉得还是不要拿出来被嘲讽以及恶心老东家了。&br&&/li&&/ul&主要参数:&br&通量:&b&BGISeq-500&/b&: 8-200G,NextSeq 500:25G-120G&br&读长:BGISeq-500: 50SE/50PE/100SE/100PE,&b&NextSeq 500&/b&:75SE/75PE/150PE&br&质量:&b&BGISeq-500&/b&: Q30 bases & 85%,NextSeq 500:Q30 bases & 75%/80% (嘿嘿)&br&运行时间:BGISeq-500: ~24h,NextSeq 500:12-30h&br&&br&可以说是,两家500全方位正面刚!NextSeq 500的主要目标客户就是医院、检验所级别的中小型规模应用场景,有别于Hiseq定位于测序工厂,Miseq定位于实验室高精度快速的科研用途。通量可上可下,可以做人类全基因组测序,也可以做Nifty。从官方数据上看,两家500各领风骚,各有千秋。BGISeq-500 在通量上更灵活(FCL、FCS两种芯片高低通量搭配),而Illumina家再读长上更有优势。Illumina家的测序质量经过市场检验,虽然BGISeq官方给出Q30以上的碱基达到85%,但并未根据读长、PE/SE模式给出具体数据,所以看到真正的raw data之前,我对测序质量暂且不进行评论。运行时间相当,都在一天左右,对于要求快速产出的医学检验有非常大的吸引力。&br&&br&&ul&&li&&b&&u&技术&/u&&/b&:联合探针铆钉聚合技术(&b&cPAS&/b&,cPAL是CG家的SBL技术,L=&S是不是意味着改成SBS?但貌似又不完全是,官方貌似完全没有使用过SBS这个词)以及惊艳的DNA纳米球技术(&b&DNB&/b&)&/li&&/ul&官方公布的两个核心技术就是cPAS和DNB。之前猜测BGISeq-500是基于边合成边测序(SBS)技术的(BGI向helicos购买了专利,可能与SBS有关?),然而现在公布的是cPAS,把CG家赖以生存的边连接边测序技术cPAL改了一个字到cPAS,是不是就算是SBS了呢?很玄妙。如果不是SBS而依然是SBL,怎么能做到100的读长而且运行时间这么短,我也很好奇,希望各位大神解毒。不排除前东家只是刻意在回避SBS这个词,即便是用了SBS,BGI应该也应该准备了足够对策(BGI近期的专利收购、illumina家的专利漏洞、我朝的专利壁垒什么的)。&br&&br&DNA Nano Ball纳米球技术,依然来自CG,但是头一次现场看到解释真是&b&非常惊艳!非常惊艳!非常惊艳&/b&!!一坨坨DNA落在纳米格里面,克服了illumina家扩增中造成的CG偏好性偏差之类的,看起来是非常美的技术。芯片密度达到光波衍射的极限,工业技术上也非常令人佩服。具体的不太懂,配一张美图(分辨率不在地,毕竟我是在『截图』画质的基础上又截了个图)。&br&&br&&img src=&/28eee84a0aa9c9b30a725c90_b.jpg& data-rawwidth=&3464& data-rawheight=&1084& class=&origin_image zh-lightbox-thumb& width=&3464& data-original=&/28eee84a0aa9c9b30a725c90_r.jpg&&&br&不过这个技术带来的另一个让人好奇的地方就是,怎么实现PE(双端测序)。每个孔里只有一种分子只出一种光信号,貌似是没法直接输出成对reads的。于是我非常浅薄地猜测,PE是在建库过程中实现的,大概方案可能类似与『 后口动物胚层反转』(请有生物学基础的同学脑补)。即是一个文库的需要测序的两端,通过连接连在一起(类似于illumina家的mate pair。中间可能放几个碱基做间隔),然后再一次测通。这样有一些问题:比较重要的是,一对paired-end reads的测序质量会有显著差异(如果动用了SBS的话,3'端测序质量是回显著下降的);如果要有特殊用途,像illumina家短文库读通的reads(比如文库长度250bp而两端各测150bp,其中大约有50bp重叠区域被测了两次,相当于直接构建了一条长度250bp的read)不可实现。BGISeq-500的PE实现方式想象图(帕金森画技请欣赏)(有其他答案补充说是MDA技术,会放到BGISeq-500官网,MAD==Multiple displacement amplification?常用于单细胞测序的多重置换扩增?有待确认):&br&&br&&img src=&/edae0463cca6a83b514f0ae26d150c88_b.jpg& data-rawwidth=&800& data-rawheight=&469& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/edae0463cca6a83b514f0ae26d150c88_r.jpg&&&ul&&li&&b&&u&价位&/u&&/b&:大概是良心机器(咳咳需售后维护),猜测是无比良心的试剂,不管是BGISeq真牛比,还是不那么牛但能倒逼无良的illumina家降价,总之大家肯定是有福了。&br&&/li&&/ul&官方声称仪器成本比同行低三分之一(不知道是仪器售价还是成本还是运行起来以后的成本),个人基因组(没有说深度?默认30x好了)价格(还是成本?)6699,甚至低于x ten的8000左右。后续维护成本不知道如何(嘿嘿毕竟是第一台机器,不稳定什么的应该是预期以内的事情),但实际成本一定会大杀无节操的、对试剂任性定价的illumina的嚣张气焰。&br&&br&总之,老东家威武。希望你大大以后出国见客户,可以带着高铁,核电,以及测序仪。
10.28 已经标明了禁止转载,竟然还被『生物探索』这个公众号无耻抄袭了,没有注明出处。这个,能不能有点节操啊伙计们 =================== 泻药。有错误或者偷懒的地方(看心情)慢慢更 一句话:bgiseq500是远超预期的、有真正实战意义的国产测序仪(估计…
7月21日更新:&br&&br&感谢&a href=&/people/alexis-voinov& class=&internal&&Alexis Voinov&/a&指出原文中谬误之处。对于测序方法的部分我原先的理解不够深刻,以致可能误导了大家,非常不好意思。&br&&br&商用二代测序的方法(method)有不少名字,例如pyrosequencing、Ion semiconductor sequencing等等都是商业称谓,但是如果从生化的角度上大体都可归入SBS和/或SBL(取决于使用聚合酶还是连接酶)。答主原先将半导体测序与SBS、SBL并列的方法显然是有错的。&br&&br&-------------------------------------------&br&7月20日更新:&br&&br&原本的回答主要是针对题主特别关注的“PCR与测序仪之间的关系”而做的补充,没想到被推荐,显得文不对题。现在简要介绍一下DNA测序的基本逻辑。&br&&br&测序仪的原理到底如何,这个问题实在是太广,详细展开只怕要专门写一本书。我试着从基本逻辑的层面上为大家阐释一下DNA测序的目的和实现手段;具体每一种方法的详细原理稍后再为大家列出一些补充资料。&br&&br&首先,神马是测序呢?顾名思义,测序(sequencing)就是测量出一段序列的意思。广义的测序不仅仅包括了DNA的测序,还包括蛋白、RNA等等别的物质构成的序列。你可能会问,我有一串黑白珍珠项链,数一下顺序算不算测序呢?嘛……答主认为是算的(骗谁啊)。待我慢慢道来:&br&&br&&img src=&/debfd542b2c312e22c170da84e784bdf_b.jpg& data-rawwidth=&800& data-rawheight=&800& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/debfd542b2c312e22c170da84e784bdf_r.jpg&&&br&这是一串黑白珍珠项链,我们仔细观察,会发现这中间包括两种基本单元:黑珍珠和白珍珠。要搞明白它的序列要怎样去测呢?答案很简单:用肉眼看(坑爹呐),因为这是简单经济的方法。对于这串项链的序列我们可以作如下的表示:&br&WWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWB&br&WWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBR(连接环)BBWWB……&br&&br&您别笑,其实这个过程与DNA测序如出一辙——它们的目的是一样的,只是对DNA进行测序,要求我们去观察一个物理尺度远小于这串项链的长长的分子,由四种基本单元组成(连接了ATCG四种碱基的核苷酸),表示一下就是:&br&……GAGCGGATAACAATTTCACACAGG……&br&&br&这个分子有多小呢?构成这个分子的每个最小单位(核苷酸)只有大约0.34纳米。它有多长呢?以我们的人类基因组为例,一个染色体里面的DNA序列动辄有一两亿个碱基对。(似乎比数项链复杂很多呢)&br&&img src=&/3cb6a3b2ef272e51e196d24f92f9ae64_b.jpg& data-rawwidth=&276& data-rawheight=&379& class=&content_image& width=&276&&(图中A的大小是0.1纳米)&br&&br&但这还没完,这条长长的分子还会扭曲折叠在一起(想象一下口袋里面团成一团的耳机线),这样细微而复杂的结构,想通过传统的光学手段进行直接观测是几乎没有希望的(远小于可见光的波长)。那电镜可不可以呢?且不说当年的电镜技术,就算是到了今天,心血来潮看个局部还行,用来测序根本不具备可操作性。&br&&br&所以在当时来看,DNA测序完全是Mission Impossible!(说了半天什么都没说啊摔)&br&&br&Against all odds, 生物学家们终于想到了用来测序DNA分子的办法,而且不止一种。&br&&br&最早实现的方法就是双脱氧终止反应法(所谓的Sanger测序)。这种方法是怎么 测序的呢?也是用肉眼看!没错,Sanger先生在70年代就成功地将DNA序列碱基差异带来的微弱信号放大到了肉眼可见的级别,堪称信号放大的奇迹。&br&&br&&b&我们继续以珍珠项链为例:&br&&br&假设我是瞎子,而每个珍珠摸上去都一模一样,我该如何弄清楚珍珠项链的顺序呢?好在我很幸运地拥有一个项链复制机(DNA聚合酶)可以帮我复制珍珠项链,只不过复制出来的颜色是反着的。而我又有一包穿孔的黑珍珠和一包穿孔的白珍珠可以为机器提供复制的原材料。现在我能不能搞清楚珍珠项链的顺序了呢?Sanger先生的办法是这样的:&br&&/b&&ul&&li&&b&把白色的穿孔珍珠中间挑出一小部分,把一侧的孔给堵住,做成一侧有孔的白色珍珠。若是复制机在本来该串白色珍珠的地方串到一个一侧有孔的白色珍珠,就会停下来不再继续。&br&&/b&&/li&&li&&b&把模板珍珠项链、黑白穿孔珍珠和一侧有孔的白色珍珠全部提供给复制机,机器就会不断复制出不完整的反色项链。&br&&/b&&/li&&/ul&&img src=&/4ecb5e52c3d5e5a0fc017e9c6c7b9261_b.png& data-rawwidth=&10000& data-rawheight=&1772& class=&origin_image zh-lightbox-thumb& width=&10000& data-original=&/4ecb5e52c3d5e5a0fc017e9c6c7b9261_r.png&&&b&&br&(原来的模板项链)&br&&br&&/b&&img src=&/cdcdef7d749e72daeae158_b.png& data-rawwidth=&10000& data-rawheight=&2598& class=&origin_image zh-lightbox-thumb& width=&10000& data-original=&/cdcdef7d749e72daeae158_r.png&&&br&&img src=&/aa4be45dbda8ab7fb0415f_b.png& data-rawwidth=&10000& data-rawheight=&2598& class=&origin_image zh-lightbox-thumb& width=&10000& data-original=&/aa4be45dbda8ab7fb0415f_r.png&&&br&&img src=&/167c17ebce9d8dfff253de_b.png& data-rawwidth=&10000& data-rawheight=&2598& class=&origin_image zh-lightbox-thumb& width=&10000& data-original=&/167c17ebce9d8dfff253de_r.png&&&br&&img src=&/f29ff5288aea66a6d4faf_b.png& data-rawwidth=&10000& data-rawheight=&2598& class=&origin_image zh-lightbox-thumb& width=&10000& data-original=&/f29ff5288aea66a6d4faf_r.png&&&br&&b&(项链复制机复制出几种不同的反色项链)&br&&br&&/b&&ul&&li&&b&这样我得到了很多不完整的项链片段,它们有两个共同点:一端都一样,另一端都是白色的。我数一下这些片段的长度,可以得到这样的信息:&br&&/b&&/li&&ul&&li&&b&W&/b&&/li&&li&&b&???W&/b&&/li&&li&&b&??????W&/b&&/li&&li&&b&?????????W&/b&&/li&&li&&b&……&/b&&/li&&/ul&&li&&b&仔细分析,这些信息已经够我推测出原本的项链排列是:B??B??B??B…了,考虑到这个项链只有黑白两色,我可以不用换堵黑色珍珠的孔再做一遍实验就可以得知原本的项链是BWWBWWBWWB…的序列了。&/b&&/li&&/ul&&b&&br&Sanger法进行DNA测序也是一样的,无非是拥有四种颜色的珍珠项链,具体方法大家脑洞一下即可。&/b&&br&&br&至于上面所说的“数数”的过程是通过电泳(electrophoresis)的方式实现的。简单来说就是在一个“泳池”里面让DNA片段“赛跑”,片段越长“跑”得越慢,去一个合适的时间,不用等所有片段都“跑”到终点,停下来显像,根据看到“条带”的位置就可以反过来推测相应DNA片段的长度了。&br&&br&至于怎么让DNA“跑”起来嘛,因为DNA分子带有一定的电性,给“泳池”加上一个恒定方向的电场就可以了。&br&&br&&b&Sanger测序的具体方法可以参见&a href=&/people/wang-long-teng-54-17& class=&internal&&王龙腾&/a&的回答,写得很具体。&/b&&br&&br&----------------------------------------------&br&&br&至于今天现代的生物学mín家gōng们是如何进行DNA测序的,有很多商业解决方案。&br&&br&&b&生化测序按照代际来分:&br&&/b&&ul&&li&&b&一代测序(Sanger测序法,本质上都和上面数珍珠项链的方法是一样的)&/b&&/li&&li&&b&二代测序,普遍具有高通量的特点。&/b&&/li&&ul&&li&&b&SBL(Sequence by Ligation):SOLiD、华大Revolucity(前CG)等等&/b&&/li&&li&&b&SBS(Sequence by Synthesis):illumina 全系列(前SOLEXA)、华大BGI-Seq 500(未量产)、&/b&&b&Ion Torrent PGM、Ion Proton(TM)、&/b&&b&Roche 454等等&/b&&/li&&/ul&&li&&b&三代测序,普遍具有单分子、近乎实时的特点。&/b&&/li&&ul&&li&&b&SMRT(TM):PacBio旗下测序仪&/b&&/li&&li&&b&Nanopore(未商用):Oxford Nanopore MinION(u盘大小测序仪,刚有原型机,可惜准确率太低)、Genia(George Church大神力荐,已被Roche$125MM重金收购,希望不要被毁掉),还有illumina自家的三代测序技术目前还很神秘。&/b&&/li&&/ul&&/ul&&br&说到二代测序的原理无外乎是分为如下几个步骤:&br&&ol&&li&将待测序DNA片段化,经过特定的处理以符合相应测序平台的输入要求,此过程称为&b&建库&/b&。&/li&&li&上样,(在机器内)通过特殊的PCR反应过程将待测片段原位(in situ)扩增。&/li&&li&(在机器内)通过对DNA反应过程进行变量控制(时间、空间),并捕捉此过程中释放出的相应的(因扩增而变得可观测的)信号。这些信号可以是荧光信号(illumina、454、华大CG等)或是释放质子所引致的局部酸碱变化(Ion Torrent)。&br&&/li&&li&计算机采集数据,并进行组装(将片段还原成长序列)。&/li&&/ol&顺便说一句,二代测序又被成为NGS(Next Generation Sequencing,次世代测序),十年前被用于区分一代测序。鉴于现在二代测序已经广泛使用而一代测序濒临淘汰,很多人将NGS重新解释为“Now Generation Sequencing”。&br&&br&&br&&b&三代测序&a href=&/people/zhu-yifan-72-22& class=&internal&&朱一凡&/a&已经大致讲了,可惜只提到了nanopore测序,并不全面。&/b&&br&&br&实际上目前唯一已经商用的三代测序技术是PacBio的SMRT(TM)技术:不同于nanopore的直线穿过,SMRT将DNA分子连成环后不断测序以解决准确率低的问题。具体方法非常精彩,限于篇幅有限不再多说,有兴趣的同学可以自己去查找资料。&br&&br&&br&除此之外还有另辟蹊径的,例如使用MALDI-TOF,实际上是一个质谱……&br&&img src=&/f6ab49aa84bc419c1c6b_b.jpg& data-rawwidth=&820& data-rawheight=&820& class=&origin_image zh-lightbox-thumb& width=&820& data-original=&/f6ab49aa84bc419c1c6b_r.jpg&&(快速、低成本但是应用范围太窄)&br&&br&以及一些脑洞大开的方法,例如上次在MIT和大牛Joe Jacobson聊天的时候他随手扔给我一个“重复单分子杂交核酸测序(Nucleotide sequencing via repetitive single molecule hybridization)”的专利,说这玩意可以让重测序低至1美元。。&br&&img src=&/226c9e9db19b687eb14f_b.png& data-rawwidth=&1212& data-rawheight=&974& class=&origin_image zh-lightbox-thumb& width=&1212& data-original=&/226c9e9db19b687eb14f_r.png&&本质上是通过在一块CMOS板子上排列所有可能的n-mer DNA做adaptor,再把目标序列打成极小片段通过杂交获取信号后再用数学方法运算而实现。我管这种方法叫做“数学测序”……&br&&br&具体原理嘛也不详述了,链接如下自己看吧:&br&&a href=&///?target=http%3A//patft.uspto.gov/netacgi/nph-Parser%3FSect1%3DPTO2%26Sect2%3DHITOFF%26p%3D1%26u%3D%252Fnetahtml%252FPTO%252Fsearch-bool.html%26r%3D8%26f%3DG%26l%3D50%26co1%3DAND%26d%3DPTXT%26s1%3D%2522Jacobson%2C%2520Joseph%%3Dsequencing%26OS%3D%2522Jacobson%2C%2520Joseph%AND%2520sequencing%26RS%3D%2522Jacobson%2C%2520Joseph%AND%2520sequencing& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&United States Patent: 7604941&i class=&icon-external&&&/i&&/a&&br&&br&&br&&br&写到这觉得也讲差不多了,索性多扯两句时事。&br&&br&总之呢,这年头人才辈出。&br&&br&国外的技术创新可谓源源不断,前面提到那位Joe Jacobson大神原本是搞物理的。他发明了e-ink,没错就是kindle上那个e-ink,那时候他还是本科生……不久后他的公司Gen9率先搞出高通量DNA合成技术……基因技术玩的就是跨界!(智商受到碾压)&br&&br&好在咱国内起步不低,答主的老东家华大基因通过海外收购+研发的方法也整出了自己的高通量测序技术,不管有人怎么冷嘲热讽,始终是零的突破,汪老师魄力可见一斑。最近听说谢晓亮老师的测序仪也开始准备产业化了,答主觉得无论如何也值得期待。(感谢&a href=&/people/alexis-voinov& class=&internal&&Alexis Voinov&/a&的提醒,谢小亮老师现在应该还是在做二代测序)&br&&br&生物或许又是一个我国可以与美帝平起平坐的行业,而这其中首当其冲就是测序技术。搞不定测序技术的国产化,很多应用始终要受制于人,相信很多搞生物的小伙伴们一定深有体会。11年华大买完测序仪illumina就给测序试剂坐地起价的事情至今还历历在目,不自己搞测序能行么?前阵子在知乎上看到不少人看不起华大收购CG,觉得没有核心技术干不过illumina云云……答主特别想说,你行你上吧。&br&&br&&br&&br&&b&以下是原答案&/b&&br&-----------------------------------------------&br&&br&楼上很多答案都深入浅出的阐(bān)明(yùn)了目前几种主流的、未成为主流的、抑或是已经被淘汰的测序技术及其原理,但是总觉有哪里不对。长期潜水的我忍不住来补充两句。&br&&br&&br&首先,实名反对&a href=&/people/jamesr& class=&internal&&jamesr&/a&的答案。&br&&blockquote&Sanger测序可以看成扩增长度随机的PCR反应+毛细管电泳&br&&/blockquote&PCR(&u&P&/u&olymerase &u&C&/u&hain &u&R&/u&eaction)反应的目的恰恰是从混合的DNA样品中以几何级数复制&b&起始及结束位置均固定&/b&的任意DNA片段以便后续研究,这个过程第一次实现了(in vitro的)“&b&扩增&/b&”,这也是PCR的伟大之处。而例如Sanger测序中用到的仅仅是通过一段的引物对DNA进行&b&复制&/b&;而利用聚合酶来进行DNA的复制(in vitro)早已有之但根本不能被称作是PCR反应。&br&&br&&br&接下来我们进入正题。&br&&br&题主问了两个问题:&br&&ol&&li&测序技术和PCR有关系么?&br&&/li&&li&PCR技术的发明是如何对测序产生促进作用的?&br&&/li&&/ol&&br&&br&我们先说第二个问题:&br&&br&这个问题本身无解,因为,&br&&br&&b&DNA测序技术早于PCR技术。&/b&&br&&b&DNA测序技术早于PCR技术。&/b&&br&&b&DNA测序技术早于PCR技术。&/b&&br&&br&重要的话要说三遍。&br&&br&人们往往因为PCR技术的基础与应用广泛而想当然的认为“高大上”的测序技术应当是前者基础上技术发展的产物。个人认为这是分子生物学行业内最广泛存在的误区之一,很多资深的行业者也会产生这种幻觉。&br&&br&准确来说,恰恰是最初的DNA测序技术促进了PCR技术的发展。&br&&br&&br&接下来说第一个问题:&br&&br&答案显而易见:有关系,关系很大。&br&&br&这里一定要提及另一个大多数答主忽略的方面:DNA合成技术。&br&&br&上世纪40年代开始,科学界形成了DNA为遗传物质载体的共识,在随后的50年代,又由于DNA双螺旋结构的解析而确定了接下来分子生物学的发展方向:搞明白DNA怎么运作。&br&&br&所以顺理成章地,人们开始研究如何测量DNA序列的碱基排布。这种测量由间接观测开始(linkage mapping),直至70年代第一次通过Sanger测序(双脱氧终止反应+跑胶)实现直接观测而进入正轨。这20年的时间内人们想尽一切办法弄清楚DNA分子的性质,而研究其性质最好的方法就是:人工合成。&br&&br&DNA合成技术随着DNA测序技术的发展而突飞猛进,由50年代对于两个核苷酸连接的试验性探索直至80年代初期ABI第一次实现商业化、相对较长的DNA单链化学合成。&br&&br&而PCR技术恰恰就出现在1983年,这是为什么捏?&br&&br&因为……因为PCR需要引物啊(摔),引物是合成出来的啊。引物对于PCR的重要性不言而喻,因而大规模的PCR应用需要两个前提:&br&&ul&&li&对于模板序列的了解(依赖于DNA测序技术)&br&&/li&&li&准确、批量的生产引物(依赖于DNA合成技术)&/li&&/ul&&b&可以说,PCR的出现使得基因研究终于驶上了快车道,随后的高通量测序技术又倒逼PCR技术的进化,两者是相互依存而又相互促进的辩证关系(答主没上过大学,马列毛概学得不好表打我)&/b&&br&&br&&br&&b&不过归根结底,没有测序技术的出现是不可能有PCR这种应用的。&/b&&br&&br&p.s.懒得查资料凭记忆写的,如有谬误望不吝指教。&br&&br&利益不相关:现在貌似都流行利益相关啊?答主想了很长时间,最后很悲桑地发现,咱既不是生产测序仪的又不是研发PCR技术的,就是个使用者,利益相关个毛线啊。。
7月21日更新: 感谢指出原文中谬误之处。对于测序方法的部分我原先的理解不够深刻,以致可能误导了大家,非常不好意思。 商用二代测序的方法(method)有不少名字,例如pyrosequencing、Ion semiconductor sequencing等等都是商业称谓,但是如…
买了,等了之前通知的60天,刚好在规定时间内按时出了结果,昨晚看了下,可以写体验报告了。&br&&br&&b& 一,寄样本等结果的体验&/b&&br&&br&&br&首先,收集唾液的步骤很多人都在网上po过就不再熬述了,总体就是感觉很简单易用 (记得当时从拱北到深圳的顺丰也够快),但是可能是做这一行的感受;对于普通消费者来说,唾液采集时的指导应该更详细一点。后来发生个别几个用户收集的唾液量和浓度未达标又要花时间重新收集唾液也说明这方面的说明书可以写长一点。( 当时我自己送完样后也有点担心自己之前里那两天都是吃的鸡鸭鱼肉,口腔唾液尽管之前有漱口还是感觉万一有少量动物DNA混入唾液会影响结果?会不会之前两天都吃素会好点?毕竟植物DNA同源性低?也可能是过于小心多虑了:) 。但是有更详尽的解释毕竟更好,可以随检测套件除了简版的使用方法外,再加入一个详尽版的采样答疑。简繁说明都有,供不同性格的人群使用:))&br&&br&1绑定成功2收到样本3样本质检4开始检测
&br&&br&这前四步看进度都是一两天内结束,就是最后一步等待时间最长,相信我们这些尝鲜的人都还是有些耐心的,毕竟第一波都是“票友”。K2同学之前的“尊贵指数”报告中我们也看出wegene的这款产品折合单个位点价格最低,性价比最高。而且我这种没经过重复取样的最终还是在之前通知的60天之内拿到了结果。考虑到这是他们本产品的第一批,期间在批量上样实验生产流程上听说遇到一些没有估计到的困难,最终加班加点周末都不休息还是让我们顺利按时拿到了详尽(貌似在祖源方面较23andme还有升级)且基于中国人基因组的检测结果。&br&&br&(当然,以后的速度相信磨合试验结束后应该会大大加快,毕竟普通消费者一般等待超过两周便有可能会失去耐心。。)&br&&br&&br&&br&&b&
二,祖源分析&/b&&br&&br&&br&Wegene 60多万个位点的芯片出了200多项的检测结果(本来按报告 祖源分析 | 运动基因 | 营养代谢 |
健康风险 | 遗传性疾病 | 遗传特征 | 药物反应
这七个大类的项目相加计算是292项,但是后来发现有的项目会因为同属两个不同大类被重复计算,这样来看wegene网站上介绍的 “200多项” 这个说法是有道理的),基本逐项查看了下发现每项检测的SNP位点少的只有一个,多的话有的项目会有二三十多个位点信息,平均起来每项一般都有5个点大概这样的情况。这样看来也就解读了一千多个点,如果详细的祖源报告涉及Y染色体和线粒体DNA分别需要1000个位点来看的话(笔者为基因组学/表观遗传学/生物信息学背景,不太懂分子人类学,这里只是估计),那60万个位点的有效解读利用率也还是相当有限;相信后续版本升级后还有很多提高的潜能。当然,wegene还会发布帮助解读的“白皮书”,以及在三个月后提供用户全部位点的下载,这点也是相当赞的,对于圈内票友来说,基于丰富的各种在线基因组数据库和文献资料,自己分析自己的基因组,这点的吸引力无疑是巨大的。这种开源开放的精神,也为票友在分析自己基因组之余,开发第三方分析应用apps提供了便利。用户即使对基因组学和生物信息学不了解,也可以保存自己这60万个位点的信息供日后第三方应用来分析。&br&&br&对于应用的检测结果,笔者打算先从最早出来分析结果的“祖源分析”谈起。祖源检测还是很有意思的,开始去测wegene也是主要看中检测项目多性价比高,祖源开始觉得会不感兴趣(也是因为之前对结合了考古人类学和现代分子生物学的“分子人类学”了解的少,认为中国人的血统比欧美人单一纯粹,顶多生成有些少数民族成分的报告。加之以前祖父文革&破四旧&把家里族谱带头烧了。。对这些也就不那么感冒。。)。但是检测结果一出来发现笔者的Y染色体基因型父系祖源竟然是比较少见的Q1(其实也不少,即使占比只占汉族的2-5%也有几千万号人。。)而不是汉族占百分之七十多的O(O3)[发呆] 一查资料虽知只是条Y的 haplotype 时间久远,但先祖作为约3000年前进入东亚播撒文明的周人姬姓后裔分封改姓王应该是做实了的。。(西周倗伯墓等的分子人类学考古发现,新石器时代的遗迹里Y染色体都是O类单倍群,到大约3000年前时Q单倍群突然出现..前些年跟葡萄室友吹水说我这个 wang 姓在汉语里是 king 的意思,但也有可能是少数民族归化后改姓汉族大姓,室友说后者可能性更大搞得我也觉得几率上貌似更有道理。。顺便攀下亲,据研究(路边社二手贩子博客)表明曲阜孔子后人和欧洲很多王室的Y也是这条最后走出非洲频率比较低的Q。。 )好了这里就言归正传不得瑟我们老王家这条神秘的Q了。。[糗大了]这跟其他分析(比如药物代谢反应,运动胖瘦体质,疾病易感度)比其实实际意义不大,也就以后大家互相测过的人知道了互相吹捧调侃几句[憨笑] (比如 &a data-hash=&aed9& href=&///people/aed9& class=&member_mention& data-editable=&true& data-title=&@陈钢& data-tip=&p$b$aed9& data-hovercard=&p$b$aed9&&@陈钢&/a& 陈可汗, &a data-hash=&d9bfe1af31f6cf19856bc& href=&///people/d9bfe1af31f6cf19856bc& class=&member_mention& data-editable=&true& data-title=&@夜神K2& data-tip=&p$b$d9bfe1af31f6cf19856bc& data-hovercard=&p$b$d9bfe1af31f6cf19856bc&&@夜神K2&/a& 棒子康之类lol)发展的细了可以用来认亲戚编家谱增强家族自豪感凝聚力,但也要警惕从娱乐认祖变为希特勒那样的阴谋家宣扬种族优秀论之流分裂族群。。。。(另,某神最后归为R1也是很神奇的,不过跟其姓氏为&昭武九姓&的历史纪录倒也完全匹配[发呆])&br&&br&顺便说一句,负责wegene祖源分析的貌似从他们论坛上看是 年轻但在该领域大名鼎鼎paper等身的王传超(&a href=&///?target=http%3A///view/2563960.htm& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&王传超_百度百科&i class=&icon-external&&&/i&&/a&, 不过看网上一份他的CV15年后是要在德国马普所做两年postdoc的怎么又加盟了wegene了?远程办公?),所以wegene的祖源分析还是信得过的,且据说Y和mtDNA的分形做的都比23andme目前精细更多。(比如可能23andme只给分析到R1b1的分支,wegene会给到R1b1a2a1b1b2a2这么精细。[此处只是打个长度的比方,个人信息已隐去])&br&&br&&br&&b&
三,其他分析&/b&&br&&br&&br&除了几天前出来的祖源信息,这次一下出来剩余的200+项信息,有种短时间看不过来的感觉。有些位点感觉点太少预测能力有待提高,但是有的还是挺靠谱的,有些即使位点少我也觉得靠谱,比如多动症这个lol 这个小时候就被坐实了 不过还好,将近85%的人这个位点的基因型都跟我一样。&br&&br&言归正传,其实第三部分才是我们做基因检测的主要目的,wegene在这部分里有 运动基因 | 营养代谢 |
健康风险 | 遗传性疾病 | 遗传特征 | 药物反应
这六个大类的项目200多小项, 其中还有一个单独列出的“热门研究 - 痛风 (Gout)” (这个很热门吗?。。为什么单独放出来?。。囧)&br&&br&对于每项研究,都有详细研究项目内容或症状说明(对于疾病项),

我要回帖

更多关于 二代测序原理 的文章

 

随机推荐