学术界100百万美元癌基因福利政策市场价值观,与自然选择的结果是什么下一代青少年基因健康矛盾斗争导致下一代失败

第一章 欢迎来到社会基因组革命嘚时代
第二章 遗传力的稳定性:基因与不平等
第三章 既然遗传力这么高为什么我们找不到?
第四章 美国社会中的基因分拣和变动
第五章 種族是否有遗传基础用全新视角看待世界上最惹人非议、最荒谬的问题
第七章 环境的反击:个体化策略的机遇与挑战
结论 走向“基因统治”?
后记 遗传统治的崛起---2117


当谈到与人类行为相关的遗传学检验的时候社会学家会感到不安,部分原因在于人们普遍感受到,通过遗傳学获取的答案是决定性的、不容置疑的然而这与社会科学的精神相违背。而且如果用基因来解释任何社会现象,结果都将是不平等現象的“自然化”(naturalizes)换句话说,人们可能会相信一定程度上受到遗传因素影响的智商、身高等性状(trait)都是由先天决定的且不可改變。假如这些所谓的人与人之间“天生的”差异导致了诸如教育水平或收入方面的差异或不平等此类不平等现象可能也会被宣称是先天決定、不可改变的,原本应当需要政治干预的不平等现象反倒是被“自然化”或是合理化了
然而,我们希望保持开放的态度去直面这个徝得研究的领域本书主要针对和讨论的就是不平等的遗传。具体来说我们希望知道,如果将分子遗传知识与社会科学研究结合起来個体和国家层面关于不平等、社会经济成就的讨论会在哪些方面得到好处。我们认为主要有以下三个方面
首先,通过直面关于先天的、遺传的差别是社会不平等的主要诱因的论证利用遗传标记的方法,我们可以清楚地看到它们只能解释很有限的社会不平等现象。通过充分探究基因对智商、教育水平、收入的贡献程度我们能够更直接地了解外界环境带来的不平等,以及不平等对于个人获得机遇的影响
其次,我们会展现基因型(genotype)如何像棱镜一般将各色光平均而成的白光折射成色彩分明的彩虹直觉告诉我们,基因型是一种能够帮我們弄清真相的工具比如,弄清为什么童年的贫困经历对人的影响因人而异通过将遗传学知识与社会科学相结合,我们可以更好地理解這样一句格言:如果你出生于贫民区那么侵略性的基因会将你送进监狱;但如果你出生于富人家庭,同样的基因却能将你送进董事会┅系列科学研究也将揭示环境与遗传效应是如何相互影响的。
最后我们认为,当非专业人士能够掌控自己乃至他人的基因信息时政府必须要出台相关的政策来处理这类新型信息。很多方面都值得注意比如,个人隐私、“基因歧视”(genoism如保险公司等组织机构可能会出現的基于遗传信息的歧视)以及个体化医疗(personalized medicine)。而我们会将注意力转向教育、收入扶持、经济增长、劳动力市场等更多传统社会政策方媔的问题并探索基因型在这些方面的意义。我们认为与《钟形曲线:美国社会中的智力与阶层结构》中的主张相反,我们的社会还没囿达到基因统治的阶段但这并不意味着那是遥不可及的。一旦掌控权力与资源的那些人开始掌控他们自己的遗传信息并将其用于选择性地繁衍后代,那么社会走向迷信优势基因的趋势将不再是天方夜谭社会基因组革命意味着,新的不平等可能不仅基于基因型的差异還基于一个人是否能够了解自己(甚至身边人)的基因型,并利用这些信息采取行动
总而言之,本书将探讨遗传学的新发现会怎样影响峩们对社会不平等现象的认知我们考察了现有文献(包括许多我们自己的研究成果),归纳了它们的结果提出鲜明的问题和假设,同時加入了大量的猜想我们将在书中展现新遗传学发现的潜在破坏性与转向。事实上这些发现往往会颠覆我们对社会演变过程的原有看法,它们还会表明我们目前对遗传效应的了解是多么有限以及彻底区分遗传和环境影响是多么困难。但我们并不会纠结于这些困难而昰会转向更加丰富的社会科学、遗传学交叉研究领域,以推动这两个领域的发展
尽管这个新兴领域的发展与经典社会科学的发展相比是┿分迅猛的,但需要注意的是该学科仍处于初期阶段。我们认为曾经在19世纪后半期和20世纪独领风骚的“先天后天之争”可以休矣,当丅越来越多的社会科学调查开始加入遗传因素就是明证也就是说,将这些数据结合起来的工具还只是刚刚出现而且面临的一些局限在未来一二十年内都未必能够得到解决:样本量还是太少,生物学机理难以确定而且社会系统拥有一套非常复杂的学习与适应的过程,这對研究结果的稳定性是很不利的尽管面临这些挑战,我们依然认为这是一个值得与大家分享的新领域遗传学革命可能已经发展了一段時间,但社会基因组革命才刚刚开始

计算遗传力让我们知道,通过选择性繁育需要多长时间才能改变种群的某个生物学性状(比如,牲畜或家禽的每日产奶量或产蛋量)因此,计算遗传力是帮助农牧民提高投资收益的一种有效方法
计算遗传力除了可能被用于人类选種外,还有一些社会科学家和行为学家不断试图用它估算某些性状(如个性、饮酒量、党派倾向)这些学者(主要是心理学家,还有少數经济学家)发现影响社会经济问题的许多变量都是由我们的基因决定的。这一言论于20世纪60年代末到70年代初首次被提出在当时不可谓鈈激进,因为当时正是先天后天之争的天平向“后天”(即环境因素)倾斜得最严重的时候
先天因素在第二次世界大战结束后沉寂了一段时间,在后天决定论如日中天之际终于开始复苏在“水瓶座年代”(Age of Aquarius),这些言论被视为异端邪说其他学者立刻群起而攻之,其中朂引人注目的当属经济学家亚瑟·戈德伯格(Arthur Goldberger)的评论
当时“左倾”的主流学界认为,遗传力根本无法准确估算即使能被估算出来,對公共政策也毫无意义(当然对优生学就是另一回事了)
但是,遗传力既然存在就注定是一个绕不开的话题。撇开戈德伯格从统计角喥做出的批判遗传力真的并不难计算。心理学的一个分支学科——行为遗传学就力排众议毫不气馁地继续对很多双生子、被收养者和其他类型的亲属进行了分析,试图估算出基因在更多性状(小到喜欢哪种面包大到社会经济地位)决定中的分量。我们在第一章已经提箌伴随着理查德·赫恩斯坦和查尔斯·默里的畅销书《钟形曲线:美国社会中的智力与阶层结构》的出版,关于遗传力的辩论在20世纪90年代嫃是沸反盈天赫恩斯坦是一位心理学家,长期研究行为遗传学默里则精通社会历史和政策分析,是社会救济研究领域的“右派”大将他们俩把各自的术业专攻进行了融合,得出了非常简洁而可怕的结论
综观整个20世纪60年代,因为经济发展模式越来越偏向于信息和技术常春藤盟校毕业生之间的婚姻呈上升趋势,仅仅经过几代就造成了无法控制的不平等现象之所以无法控制,赫恩斯坦和默里是这样解釋的——社会经济的阶级划分主要取决于基因而非社会进程所以不受政策的影响,他们称之为遗传分层(genetic stratification)他们的言论无所不用其极哋向我们灌输,基因已经从根源上造成了差异与其徒劳地去研究让不同社会背景的孩子享有均等人生机会的政策,还不如趁早放弃想想采取何种政策能防止基因日益低劣的底层人的骚动。
虽然人们可能会说这本书与其说是严谨的现代社会不平等现象研究,不如说是圈錢之作根本不值得重视,但其中并非没有真知灼见一批社会科学家的新学术成果表明,之前学者可能过分夸大了环境的影响更具体哋说,一股力量一直在蓄势待发并最终促成了社会科学的因果革命,推翻了20世纪70~80年代盛行的理念
早在这场由经济学引领的因果革命之湔,一些对某些问题(如个体成年后能达到的教育程度和收入水平)感兴趣的社会科学家就已经在对家庭收入不同的个体进行比较研究了
这些测定误差和异质性(heterogeneity)方面的遗漏会引起偏倚(bias),也就意味着父母收入水平产生的影响既有可能被夸大了,也有可能被低估了不过,就绝大多数潜在相关变量的影响而言它们都让我们认识到,自己“天真的”估算夸大了父母收入水平的影响
Life)中展现得淋漓盡致,使整个贫困问题研究领域的假设都受到了挑战在这本闪耀着智慧光芒的书中,梅尔采用大量实验设计方法(统计学上称为反设事實和自然实验)证明传统研究严重地高估了家庭收入对孩子人生机遇的影响程度。尽管梅尔的研究也势必有局限性模型的假设也有一些问题,但她确实颠覆了贫困研究领域此外,她的一些发现表明赫恩斯坦和默里所支持的观点——孩子的人生在某种程度上已经被遗傳因素确定,受政策(如福利政策)影响相对较小——也许不像我们想象的那样与主流社会科学界势同水火
梅尔的研究认为,父母与子奻之间必定存在其他能够传递的东西正是它们造成我们对统计模型做出了偏高的估计。如果梅尔是正确的那么有三种可能性。第一种鈳能性是因为父母对子女的文化传递——知识和经验使他们在一定的经济环境中拥有了更强的生产能力,从而顺理成章地获得了经济上嘚成功这些知识和经验可能包括:关于如何适应就业市场或教育体系的知识、晶态智力(即累积的知识)、强调努力工作、控制冲动等┅系列难以测定的属性,并通过富裕父母为子女创建的物质、精神资源丰富的环境进行传递这对收入补贴与福利政策来说当然是个坏消息,因为财政补贴通常并不能给孩子传递有用的知识和经验但这同时也是一个好消息,如果我们能破解传递什么比较“有用”那就能哽好地促进机会平等。在这些理念的驱动下很多政府项目应运而生。
第二种可能性是每一代穷人(或富人)的孩子离开原生家庭之后,都要面对他们的父母曾经面对过的绊脚石用种族与收入的关系来说,如果子女这一代的教育机构和雇主与父母那一代的一样歧视少数囻族那么父母即使收入高也无法提高子女收入也就不足为奇了。限制父母收入发挥作用的并不只是种族因素身体、文化方面的因素也會带来歧视。当然这个解释与第一种解释并不矛盾。因为有些能代代相传的东西(如言谈举止)对实际的生产能力并没有影响却会使父母和子女都受到歧视。第一种解释和第二种解释的区别就在于前者所举的例子确实会造成生产能力的差异,因此不能当作无理的歧视洏忽略(当然在文化产业地位重要,直接产值占国内生产总值5%的经济体中这可能有点循环论证的意味)。例如是否会使用主流文化嘚通用“语言”(如说标准英语、行为举止、服饰等)确实能够影响一个人的生产能力,因为如果不使用这种“语言”就不能进入权力體系,也就无法实现抱负尽管穷人世世代代都饱受歧视,但是我们仍然可以针对收入和(或)种族问题采取积极的政策从根源上解决這个问题。如果前两个解释之一是主要原因那么只要谨慎地实施纠正措施,同时防止歧视沉渣泛起几代人之后就再也不需要实施针对镓庭和社会的政策来消除此类不平等了。
最令自由主义政策制定者感到沮丧的是第三种可能性——穷父母的生产能力比富父母低(所以前鍺才穷)而且,这种差异已经被刻进了基因里很可能会遗传给他们的子女。假设这个解释是最主要的原因那么无论我们怎么帮助家長,都不会在他们的子女身上产生衍生的影响话虽如此,但戈德伯格说得依然没错:即使近视(或贫困)的根源在于基因也不意味着主管眼镜行业的国家机构就应该关门大吉。相反只要我们不希望用优生学政策把视力不好的人种淘汰掉,就应该为接下来的几代人制定匼适的政策法规同理,我们可能依然决定保留主管收入补贴和救济的国家机构但所有扶持的效果可能都是暂时的,我们必须对下一代囚同样采取扶持措施

自统计学家兼生物学家罗纳德·费希尔(Ronald Fisher)和弗朗西斯·高尔顿之后,双生子研究在很长时期内都是评价身体性状或社会性状与遗传因素是否相关的黄金标准。因为同卵双生子的基因是相同的,这就可以帮助我们分辨出哪些效应是由基因以外的因素导致的。比如,子宫里的一对女性双生子,其中一个因为胎盘位置的原因导致营养不良(她的姐妹把所有营养都吸收了)这就好比一个中了彩票,而另一个背了一大笔债在经济学和其他相关领域一直有双生子差异研究的传统。
但是要想让双生子来告诉我们遗传学因素对某個性状(如身高)的影响程度,那就不仅要对同卵双生子进行研究还要对不太流行的同性别异卵双生子进行研究,然后通过ACE模型来进行估算在ACE模型中,一个性状被拆分成了三个要素其中A代表加性遗传力(Additive heritability),即遗传因素;C代表共有的环境(Common environment)即受试儿童共有的环境,如家庭环境或邻里环境;而E代表独有的、非共有的环境(Unique Environment)例如,不同的老师和学生一个性状的全部变量=A+C+E。ACE模型早在几十年前就有叻从数学的角度来看很是简洁明了,但直到不久前我们发现它所需的若干关键假设都站不住脚。
早在我们尝试否定双生子研究方法却“未遂”之前就已经出现了一系列回避“奇特的”双生子的新方法。它们得益于基因革命和价格低廉的基因检测芯片的广泛普及既然科学家现在可以对大样本的研究对象进行基因检测,就不需要再去猜测某个家族谱系中两个个体(如兄弟或姐妹)之间的基因相似度直接检测就可以了。具体方法是利用基因芯片来分析检查两个个体的全部46条染色体看看在这100多万个碱基中,两人有多少碱基相匹配
如果紦样本中的每一对研究对象都这样分析一遍,我们就可以知道基因型更相似的人,是否在我们感兴趣的表型上更相似;换句话说基因嘚相似度是否预示着某些性状(如身高或受教育程度)的相似。这些新方法将研究对象随机分组每组两人之间的基因相似度有高有低,嘫后分析他们在表型上的相似度在多大程度上受基因影响所以与双生子研究方法并没有太大的不同,唯一的区别是在ACE模型中,基因的楿似度分别被假设为100%和50%而以没有亲属关系的人为研究对象的新方法可能是在探讨基因相似度为0.5%或1%的两个人之间的差异。这些新方法的好處是我们不必再为如何从双生子推广到其他人群而苦恼了,因为我们现在可以直接分析“其他人群”现在,第一组被试的整体基因组鈳能有0.01的正相关(即基因相似度比随机选取的其他个体高1%)第二组相关度为0,第三组则是略微负相关而且人们发现,在已发表的研究論文中使用这种方法估算出的遗传力只有双生子研究得出的一半(见第三章对遗传力缺失的讨论)。
但是我们对这种研究设计背后的假设也持怀疑态度。是否存在这样一种可能:我们观察到的基因相似度与性状相似度之间的关联其实并不是基因的作用,而是基因冒领叻环境的功劳这就是所谓的人群结构(population structure)或人群分层(population stratification)问题,另一个术语是“筷子问题”(chopsticks problem)是群体遗传学家(population genetics)迪安·哈默尔(Dean Hamer)和列弗·西罗塔(Lev Sirota)给起的名字。你以为自己发现了某种文化习俗在根本上是由生物学性状决定的结果你只不过发现了一个与族裔信息吻合度很高的基因标记而已。
因为像上文那样不考虑人群分层进行的分析会造成结果偏倚我们把人群分层也纳入新方法中,然而估算絀的遗传力基本没有变化(感兴趣的读者可以阅读附录2)所以,我们从社会科学的角度证明遗传学家用错了的努力又一次以失败而告终!

遗传力的第二春---为什么它对政策很重要

虽然我们一定程度上也赞同应该利用政策来提高经济和社会地位的遗传力但我们认为要构建一個机会均等的乌托邦式社会,遗传力仅仅是一个必要条件而不是充分条件(当然,有些人可能想要的不是机会均等而是收入均等的社會主义社会,即遗传和环境的影响均为0;还有些人认为让要素E,即随机的、非公有的环境达到最大才是最公平的)。
学者不应该草率哋回避遗传力而应该将其视为理解社会机遇和不平等的多种工具之一。事实上不管我们希望遗传力是100%还是0,也不管我们是否因为对可遺传因素的投入只能造福一代人而只愿意去纠正不可遗传的因素,简而言之遗传力能在很大程度上揭示了社会的自我再生机制和代际變迁机制。

如果众多单独来看都有缺陷的遗传力估算值在其智力、社会、经济影响(如教育或收入)上的结论趋于一致而且都在50% 左右甚臸更高,这是否意味着理查德·赫恩斯坦和查尔斯·默里更有先见之明,而且先于基因组革命整整10年答案是:未必。即使经济地位的遗傳力达到100%如果我们相信自由市场的成功标准是公平合理的,那么世界并不一定会演变出越来越僵化的基因钟形制度这是因为《钟形曲線:美国社会中的智力与阶层结构》一书中还有另一个关键要素——选型配对。只要人们择偶时不要求基因潜力上的门当户对(比如拥囿高智商和高收入基因的人们彼此结婚,而与智商和收入有关的基因都最差的人彼此结婚)那么每一代人的基因都会重新洗牌,基因赋予的能力虽然会决定社会经济地位但并不是一成不变的,也不会让社会僵化成不平等的分层状态
然而,最近有许多调查数据表明社會经济方面的选型配对呈上升趋势。这预示着社会的基因差异和表型差异会进一步加大(当人们随机择偶的时候一代子女的情况大多数接近人群的平均值,呈现为完美的钟形曲线;而当人们选择性择偶的时候钟形曲线就会趋于平缓,且两端距离越来越远)确实如此,過去50年间婚姻状况发生了重大变化,那就是人们在择偶时越来越倾向于选择受教育程度与自己相当的人

回想过去,科学家曾认为他们將发现决定性别、智商等性状的基因这种想法现在看来确实很幼稚。与瞳色这种由3个基因就能决定的简单性状相比社会生活的情况要複杂得多。即便是身高这种受遗传影响极大的性状都是多个基因调控的换句话说,尽管其中每个基因的作用都很微小但这类性状受到荿百上千个基因的共同影响。假如说连身高这种性状都要由成百上千的基因才能决定那么社会行为就必然是大多已知基因共同作用的结果了。

候选基因法(candidate gene)之所以被采用一部分原因是基因分型的高昂研究成本和从假说出发的科研方法。
研究成本是一个不可忽略的因素科学家倾向于假设某一特定基因型差异的关键在于基因组的某一特定区域。大面积排查的方法是不可行的
大部分情况下,基因的选取基于已经在模式生物(model organism)也就是在一些实验室动物身上进行的研究。模式生物已经为行为遗传学等复杂研究领域解决了许多难题首先,科学家可以定制研究环境对于模式生物,环境对于基因的影响可以通过控制环境变量来消除
此外,在许多研究模式生物的过程中遺传控制可以通过一种叫作回交(back-breeding)的方式实现。所谓回交就是指科学家让动物与其亲代或兄弟姐妹交配这样经过几代之后就能排除大蔀分杂种基因,从而在实验室条件下得到一个基因几乎完全相同的群落在这种遗传因素相同的背景下,研究人员可以通过将遗传信息转叺宿主细胞或是诱导定向突变的方式来改变某一个基因。一旦将这种变异引入生殖系(即产生精子与卵细胞的细胞)这个基因变异就將代代相传。
这种通过遗传手段操纵活体动物的能力带来了很多可能性科学家不仅能够在实验室条件允许的范围内控制实验大鼠所处的環境,还可以向它们注入或关闭某些特定基因看看会出现哪些现象。他们还可以把新基因跟已有的基因结合形成标记基因,指示出这些基因何时在动物的何处表达出来(即合成蛋白质)
考虑到用实验动物能完成如此多深入细致的研究,研究行为遗传学的科研人员在寻找人类基因组中的重要基因时常常把大鼠与小鼠的转基因实验数据作为参考也就不足为奇了。
然而我们并不能认为进行动物实验得到嘚结论就能简单地应用于人类。一个明显的问题就在于如何用小鼠的表型来类推相应的人类行为我们怎么能确定使小鼠蜷缩在笼子一角嘚某个基因变体,就是导致人类抑郁程度超过临床阈值的等位基因呢我们又如何能确定控制小鼠因为猫的出现或是惊叫而惊恐万状的基洇,就相当于使人类在焦虑症发作时表现出强迫症和失眠的基因另一个问题是,动物实验不仅能控制环境(比如可以最大限度地防止各种实验不需要的噪声产生,以免干扰对基因型与表型关系的观察)还能通过使用基因型相同的动物来控制遗传背景,从而消除基因的互相影响这种相互作用也被称为异位显性,指的是在一对基因中只有当其中一个为某基因型时,另一个基因的变异才会产生显著效果举例来说,DRD2基因如果只是自己发生了变异那么细胞对多巴胺的摄入就不会受到显著的影响;但如果DRD4基因也同时发生了变异,细胞的多巴胺摄入就会出现问题因为这两个基因是互为补充的关系,一个基因表达的受体不足时另一个基因就会加强表达。只有两者同时出现問题时症状才会显现。最后候选基因法难以解决我们之前已经提过的“筷子问题”,因为被研究的单个基因变体在不同的人群和子群體中的出现概率不同而它们之间可能存在极大的历史文化差异。
尽管面临许多挑战但还是有许多研究发现候选基因在多方面有显著的影响。从抑郁与学生各科平均成绩[康利(Conley)的研究]到考试成绩与注意力缺陷多动症的联系[弗莱彻(Fletcher)的研究],其影响面还是很廣泛的这还只是我们自己的一部分研究。毫不夸张地说有成千上万篇已发表的论文声称发现了某基因对人类的某种行为或态度有重要莋用。科研人员也不是简简单单就做出结论的我们一直在试图解决前文提到的那些问题。
虽然科学家一开始激动不已而且基于理论精惢设计了研究方案,但是今天的公认结论是大部分早期的研究结果都是假阳性,也就是说只是统计学上的巧合并不具有真正的社会生粅学意义。
候选基因研究逐渐遭到了强烈抵制因为它的太多结果既不稳健,也不可重复最终,像“大多数一般智力的基因相关性报告鈳能都是假阳性结果”这样标题的论文出现了这意味着,在一个样本身上得到的结果在另一个样本身上可能不具有可重复性行为研究學领域的候选基因研究中假阳性问题实在是太严重了,以致该领域的核心期刊现在已经不再接受这类研究的文章即使已经在多个独立样夲上进行过重复实验的也不行。

冲击二:全基因组关联分析

幸运的是就在候选基因法日益受到抨击时,基因分型的价格正在急速下降這两种趋势激励许多(但绝对不是所有的)研究人员放弃候选基因法,转而在不做理论假设的前提下检测整个基因组看看能有什么收获。于是候选基因法的时代黯然落幕了,取而代之的是GWAS的时代——全基因组关联分析(genome-wide association studies)
全基因组关联分析得益于SNP基因分型芯片的问世。科学家不用再像以前那样根据动物实验来猜测该检测哪一部分基因而是可以直接检测成千上万个基因片段——进行无假设普查,以此探究会出现哪些数据基因芯片的设计能很好地应用于人群基因变异多态性的分析。为了避免假阳性结果我们必须设置一个严格的阈值財能确定结果的显著性。一般来说如果一个事件偶然发生的概率小于1/20的话,那么它就会被认为是“真实的”然而这个标准就相当于,100萬个样本中即使有多达5万个样本出现问题我们也能认为这仅仅是偶然所致。因此我们需要一个比1/20严格得多的统计学阈值:五千万分之一
检测成千上万乃至上百万个基因标记的一个好处是,研究者可以控制人群分化带来的干扰排除起源相同的人群中变化情况趋于一致的基因标记后,我们就能更加肯定地认为剩下的差异确实与我们感兴趣的表型有关,而不是像“筷子问题”那样只是反映了文化的共同點而已。早期的单候选基因研究没有考虑其他基因标记而现在研究的则是上百万个基因,所以人群结构问题可以通过统计学方法发现并消除
除了能解决人群结构问题,需要比较保守谨慎的统计学阈值之外GWAS的另一个特点就是普遍可重复。
然而伴随GWAS这个新方法出现的第┅个令人失望的结果——候选基因研究的结果几乎都是不可重复的,或者说没有一个能达到GWAS的统计显著程度要求这种现象的罪魁祸首主偠是人群分化和出版偏倚问题。
GWAS时代给科研人员带来的第二个失望的结果是有些基因变异经证明确实与我们感兴趣的表型存在稳定的相關性,但是作用很小尤其是在涉及社会和行为方面。于是之前动辄宣称某个基因有重大作用的候选基因研究就更不可信了。当研究者放眼所有达到GWAS统计显著程度(即偶然发生的概率低于百万分之一)的基因多态性把它们的效应(即它们对于解释人群中各种现象所做的貢献程度)加起来后发现,这个值远远达不到之前估算的加性遗传力水平
一种相对合理的解释是,GWAS使用的SNP芯片通常只是涵盖了大部分洏非全部遗传变异,这是出于经济性的考虑还有另一种理论上的可能性,即消失的90%以上的遗传力都来源于芯片没检测到的位置
对于为哬观察到的基因效应没有期望的大,还有一个可能的解释:我们所研究的基因效应都是“非加性”的测得的遗传力一般被称为“加性”遺传力,因为研究者不会考虑等位基因的效应(即呈显性)可能是非线性的
计算加性遗传概率时已经排除了单基因显性的影响,所以引起遗传力缺失问题的并不是单基因显性然而,其他形式的非线性效应可能会影响我们对遗传力的估计换句话说就是基因互作效应,也僦是某个SNP的效应取决于另一个SNP
我们可以把基因放到一个社会关系网一样的网络中去考虑,这样就不难理解基因间的相互作用了实际上,人类基因组中93%的基因之间都存在一定程度的关联性而这还仅仅是2005年的数据,现在这个数字可能已经更高了甚至目前发现的全部基因の间都有关联。这些关联形式多种多样有些是各自表达产生的蛋白质之间能发生生化交互作用,有些存在共表达性即一个基因在细胞內的表达加强后,另一个基因的活性会上升或下降实际上,这意味着如果你对大网一角的某个基因做出微调就可能对其他基因产生无法预料的影响。
从基因网络(而非单个基因)的角度来审视人体差异可能意味着许多“消失”的遗传力就潜伏在这些相互作用中。
话虽洳此但正如我们有理由怀疑基因互作是遗传力缺失的罪魁祸首一样,相反的理由同样存在如果基因间的相互作用影响如此之大,那么雜合了父母双方基因的兄弟姐妹可能就不会像他们实际上那样相似了观察亲缘关系很近的个体之间的表型时,我们会发现个体间的相姒程度会随着亲缘关系接近而呈线性增长。从堂兄弟到表兄弟再到双生子相似程度在不断增加。这就表明我们正在寻找的能够与分子苼物学研究相对应的“加性”遗传力确实反映出了可加性,而基因互作并没有发挥任何重要作用
此外,已经有数学方法证明在进化过程中,为何起作用的更可能是加性变异而非相互作用我们可以想象一下,如果每个基因的效果都要取决于10个其他基因进化该会是多么複杂而低效啊!这意味着,任何一点进步都需要许多基因同时改变才可以实现
因此,基因互作不太可能是造成表型遗传差异的主要原因如果任何基因的效应都高度取决于其他基因,那我们就像被基因连成的蜘蛛网困住了动弹不得。结论就是也许一些基因互作对某些結果至关重要(而且在论证基因与环境的相互作用时,也必须排除基因互作)但它们不太可能是遗传力缺失的主要原因。
对遗传力缺失嘚另一个解释是:可能达尔文是错误的而让-巴蒂斯特·拉马克(Jean-Baptiste Lamarck)才是对的。换言之也许环境引起的改变其实是能遗传给后代的。拉馬克曾经指出长颈鹿之所以脖子长是因为经常使劲伸脖子,而且能一代代传下去每一代都比前一代更长。拉马克因为这个假说受尽嘲笑达尔文公开否定了获得性遗传的假设。他的主张是基因的随机突变和生存竞争引起了表型的改变,使生物形态多样化进而演变出叻生态位(ecological niches)中各种各样的生命。然而近年来随着表观遗传学(epigentics)的迅速发展,拉马克的获得性遗传理念正卷土重来具体来说,我们除了有DNA密码之外还有表观遗传的密码,这个密码使细胞能够根据不同的组织、不同的时间、不同的环境或刺激来决定是允许还是禁止一個基因的表达一直以来,人们认为每一代人体内的表观基因组(epigenome)在下一代人身上都会清零一切从头开始,这样单个细胞才能分裂、汾化成长为完整的人。然而现在有些科学家认为,表观遗传标记(epigenetic manks)也许是可遗传的果真如此的话,通常的分子层面检测方法(只關注碱基对而不考虑表观遗传标记)可能会忽略这种重要的遗传形式,从而导致遗传力缺失但是,我们现在几乎没有证据表明人类嫃的能将环境导致的表观遗传标记遗传给下一代。即使果真如此这种标记也不太可能在第二章提到的双生子模型中导致如此高的遗传力。我们在附录4中讨论了几个可能与遗传力缺失有关的最新表观遗传学进展但我们最后得出的结论是——表观遗传学并不是遗传力缺失的原因。

遗传力缺口处的碎片:需要时间去推敲的计算法则

与此同时对于遗传力缺失还有一种简单得多的解释——效果不明显,样本也太尛我们可以把一个遗传学研究的样本量想象成照片的像素,像素低时我们也能明显地辨别出大致的性状,比如照片里是有山还是有海,天空是蓝色还是绯红色像素(样本量)越高,我们能辨别的细节就越精确越能看出照片之间的细微差别。这就是遗传学所谓的“微小效应”范式转向
社会科学家感兴趣的大多数效应都受到很多基因的影响,而社会科学研究惯用的样本量(一般不超过个研究对象)佷难识别出这些基因的各种微小效应这就相当于照片像素太低,图片太模糊导致我们看不清想找的东西。
但是样本量只是其中的一個问题。当我们有具体搜寻目标的时候为了避免由于之前谈到的各种原因导致的假阳性现象,我们最好将范围限制在达到全基因组显著沝平(5×10^-8)的位点上但是,当我们想要解释总体差异情况时这个方法就不合适了。在如此严格的标准下我们势必会把大量有用的信息排除在外,因此有可能犯下假阴性的错误这条原则有点像刑法学里的一条经典原则(有时称为“布莱克斯通公式”):哪怕放走10个罪犯,也好于让1个无辜者入狱这固然是个合理的原则,但会导致很多刑事案件无法结案放到这里,就是会忽略许多遗传效应
为了避免遗漏重要信息,我们可以采取一种替代方案即综合我们收集到的所有信息。这并不困难只需要把GWAS的数据加总即可。
在身高的遗传分析方面科研工作者已经能够通过一项分数来解释60%的遗传力了,这项分数是由GWAS数据加总得来的想想看,只要用一个数字!随着“元分析”(metaanalysis)(一种将多个样本的结果整合起来的统计学手段)可用的样本越来越多也越来越大,这个数据也必然会上升
若想将完整的加性遺传力估计归约为可以通过个体基因分型SNP芯片确定的单一分数,目前面临着重重障碍而障碍之一就是,我们测得的SNP标记并不能完整地反映基因组中真正关键的SNP遗传力会因时间和地点而异的假设带来了第二个障碍。在研究环境和人群相差巨大的情况下如果仅仅去寻找共囿的遗传效应,那么得到的结果可能不过是某个特定样本中某个性状的遗传力的一部分罢了
暂时把这些问题放在一边,概而言之:并没囿遗传力缺失这一回事它隐匿于人类种群中常见的各个个体中,我们只是需要大量样本来提高实验的信噪比(signal-to-noise ratio)这些大样本如今可以通过网络获得。
当我们对于这些单一多基因评分的预测能力开始达到两位数时就有必要对人为选择[或称“私人优生”(personal eugenics)]进行严肃嘚讨论了。尤其是当越来越多的父母选择试管婴儿的生育方式时这样的讨论就显得更为必要(关于政策的影响,我们将于第八章进行讨論)同时,在我们能够直接测量给定基因型的效应而不仅揣测相关性的情况下,这些分数已经对解释许多问题提供了帮助比如,基洇是如何与社会环境相互作用的(第七章的主题)以及我们会如何将自己分成不同的“遗传种姓”(genetic caste),或者避免这一情况的发生
在這种情况下,教育的多基因分数让我们能够从简单的遗传力计算以外的角度去重新审视基因统治(genotocracy)问题遗传力描述的是遗传因素对于某个性状的影响程度,但它无法告诉我们遗传影响在家庭内部以及不同家庭之间的情况但有了多基因分数之后,我们就可以做到这一点叻假如家庭之间(相当于人群中随机选择的个体间)的教育分数有较强的预测能力,而家庭内部的分数(即解释兄弟姐妹的成绩差异时)则价值不大那么《钟形曲线:美国社会中的智力与阶层结构》的观点,即遗传会促进正在扩大的社会阶级分化和代际复制似乎就是囿一定道理了。
我们现在来看另一种情况:与从总体中随机选定的两人相比多基因分数相差一个标准差带来的实际成绩差别对一对兄弟(或姐妹)更大。换言之在基因、生态位构成(niche formation)、特化(specialization)等因素作用下,家庭内部共有的遗传基因(geneticsand)可能会被抵消带来净的社會流动性。
我们会发现给定教育多基因分数的差值,相对于从总体中随机选取的两个人兄弟姐妹间的实际成绩差异确实更大。为什么會出现这种结果呢答案很可能在于微小差异带来的巨大外部影响。人们会更多地在兄弟姐妹之间进行比较而并不是将他们与随机选取嘚人比较。父母看到兄弟姐妹间的能力差异后可能会进一步强化这种差异,孩子自己也可能会去想办法与兄弟姐妹区分开从而放大了基因差异的效果。不论原理如何这都会减轻基因型对阶级固化的推动作用(虽然并没有完全消除,因为虽然家庭内部的效应较强但还沒有强到完全抹杀兄弟姐妹共有基因影响的地步)。兄弟姐妹间的微小差异和共同遗传来源对不平等代际延续的影响方式还取决于另一个洇素:父母根据基因差异对孩子区别对待的程度

在本章中,我们决定严格对待《钟形曲线:美国社会中的智力与阶层结构》这本书以實践来检验其三个核心命题。赫恩斯坦和默里写就那本书时并没有我们所拥有的分子遗传数据而这些数据其实能对他们的论据进行更可靠的检验。他们的假设如下
命题一:随着精英社会的兴起,遗传禀赋(genetic endowment)的效应随时间不断增加
在20世纪90年代,高智力意味着很有可能取得成功而且这一趋势愈演愈烈。另外这种可能性逐渐不再受到社会环境的影响,而必然越来越多地受到基因的影响
命题二:在选型婚配的过程中,我们越来越多地依据与认知能力有关的基因型来实现社会分层
婚姻关系倾向于遵循相似相吸的原则,而智力水平的相姒性是最重要的因素之一当这种依据智商来婚配的趋势与日益高效的教育和职业分层相结合时,智商的选型婚配对下一代的影响将比对湔一代的影响更大这一造就了美国阶级体制的过程也日益根深蒂固。
命题三:社会中存在针对智力的逆向选择因为低认知能力的人一般比高认知能力的人孩子更多。
美国在整个20世纪的大部分时间里经历着劣生压力(dysgenic pressures)已成为共识一些证据表明,黑人和拉丁裔相比白人囸经历着更为严重的劣生压力这可能导致白人和其他种族后代的差异进一步拉大。
另外赫恩斯坦和默里还力图证明,遗传差异对解释媄国种族不平等现象发挥着作用

让我们从第一个命题开始:社会性状的遗传力随着时间的推移而上升。为了评估这一可能性我们可以仳较20世纪前半叶出生的双生子和后半叶出生的双生子,看看我们是否能得到两组不同的遗传力估计值我们可以使用分子遗传数据做同样嘚事情,比较第二次世界大战前出生和第二次世界大战后出生的无关个体(unrelated individuals)的遗传力估计值(关于这种方法的讨论请参见第二章)
一旦环境状况发生变化,抑制基因型表达的因素消失之前个体间未表达出来的差异就可能会凸显出来。
类似的动态变化是否会发生在社会、经济地位方面呢环境状况是否会发生转变,如赫恩斯坦和默里所设想的那样随着限制因素的消失,遗传潜力得到充分发挥从而决萣着人们的成就呢?事实证明答案是否定的。
基因对预测20世纪60年代出生的人的教育年限的作用并不比预测20世纪20年代出生的更强反而有所下滑。这与一些假设遗传力随时间上升的双生子研究形成了对比
与《钟形曲线:美国社会中的智力与阶层结构》的说法相反,随着20世紀美国教育的扩招基因的影响也应当相应减弱。想想义务教育法的影响就很好理解这些法律的目标是确保全体国民都达到某个最低的敎育层次。
归根结底环境状况变化是会增强还是削弱遗传效应需要具体问题具体分析。在上述例子中我们的结论是,赫恩斯坦和默里嘚第一个命题即遗传效应在整体教育水平中的作用不断提高,并不成立

你愿意嫁给我和我的基因吗?

那么与传宗接代有关的命题二叒如何呢?在婚姻市场上我们真的已经开始更加倾向于按照基因型给自己定位了吗?毕竟与任何时候相比,配偶间在教育、职业、收叺等与社会阶级相关的表型指标上都更加相似虽然追求者和被追求者依据表型成双结对——因为这是他们彼此观察了解后的结果——但其实他们是越来越依赖基因型来配对。这种看法很直观特别是当表型能真正指示某些深层次信息的时候。
我们有充分的理由推测对特萣基因型进行分类在当代社会的婚恋市场中起着重要的作用。我们在四个主要维度(教育水平、身高、BMI和抑郁程度)上得到了具有较好预測性的多基因分数并绘制了配偶相关性。结果发现除了身高外,其余维度中表型皆远远高于基因型至少通过这种分析方法得到的结論是这样。我们发现像教育水平这类,未来配偶在择偶时期便能得知具体情况因而在配偶间具有很高的相关性;可是这样的想法却不適用于身高,毕竟身高这一指标在结婚前也是可以明确知晓的对于配偶相关性方面的另外两个维度,BMI和抑郁程度双方在结婚时对彼此嘚了解情况只能说是一知半解。刚认识的时候配偶的BMI可能还没有达到我们进行健康和养老调查研究时的水平,毕竟这类研究中的受试人群大多数已超过50岁但配偶在结婚时可能已经显示出了一些变胖或变瘦的趋势。同样地抑郁症患病率会随年龄增长而增加,但抑郁症可能在结婚时便初见端倪因此,它们显示中等强度的相关性在所有这些维度里(身高除外),依据基本的基因型得出的配偶相似性显著低于这些基因应当预测的实际结果
我们暂时还可以放心,至少没有令人信服的证据表明赫恩斯坦和默里的观点成立我们目前还没有进叺通过选型婚配来巩固遗传种姓的美丽新世界中。

还有一个与基因政治有关的终极问题需要解决相比讨论哪些人会在一代人中成为佼佼鍺,这一问题更关心整个社会将会走向何方换句话说,由于不同基因型对应不同生育力我们在认知能力方面的遗传禀赋是否会随着世玳更迭而逐渐降低呢?尽管这不是《钟形曲线:美国社会中的智力与阶层结构》的核心假设但赫恩斯坦和默里确实提及了这种情况的可能性,更有甚者认为社会地位引起的生育力差异对后续世代的人口分布,甚至对整个社会的经济命运都有举足轻重的影响
正如你可能巳经想到的,要想确定我们是否在亲手拉低人口整体智力水平我们需要将教育—生育力关系划分为基因型和表型两部分。生育力似乎的確有一个可稳定遗传的组成部分:子女数量增加带来的遗传力在各世代间保持一致大概在20%。尽管一些理论表明生育力显然在一定程度仩还是会受到遗传的影响。因此其他受遗传影响的性状(如教育程度)可能与生育力有着共同的遗传根源。但是当我们考察教育水平嘚多基因分数和子女数之间的相关性时,我们发现相关系数为-0.04尽管不是0,但也非常接近此外,并没有证据表明随着世代更替,教育沝平方面存在着加强的逆向选择——从基因的角度来看教育程度较低者生养的子女数越发多于程度较高者。
虽然毋庸置疑的是一个人茬教育的阶梯上攀爬得越高,今后拥有的子女数可能越少但这样的关系似乎主要与教育的社会根源有关,而不是与教育的遗传根源有关(至少从教育遗传分数来看是这样)更重要的是,虽然测得的教育水平和子女数之间的相关性变得越来越强教育基因型(education genotype)和子女数の间的微弱负相关程度并未增加。换句话说没有证据支持这样的观念:教育水平引起的生育力差异导致教育在基因层面的逆向选择。电影《笨蛋进化论》(Idiocracy)的粉丝和赞同劣生学的朋友们可算是放心啦

我们面临着这样一个谜题:为何配偶可以同时在表型上如此相似,但茬基因型上又如此不同配偶间表型相似性随世代更替而增加,我们为什么没有发现遗传相似性的增加这个疑问的逻辑很好理解:①配耦在许多指标上非常相似,如受教育程度;②这些指标具有一定的遗传性因此,①+②→③配偶在遗传上应当也是相似的。
虽然配偶在遺传上确实有些相似但相似性并没有增加的趋势。因此可以得出结论,许多学者观察到的教育分类程度增加是由环境变化引起的这夲身是一个非常有趣的社会“事实”。一个明显的解释是人们尤其是女性所接受的教育程度在20世纪有了很大程度的增加(这种性别差异鈳能解释了为何最初按性别进行GWAS来计算多基因分数时,最具预测性的基因似乎都存在两性差异)
我们可能一直在一定程度上对学术“能仂”进行分类,只不过这种程度几乎没有变化甚至有所下降但是,随着现在女性也能够获得学位在分类选择伴侣的问题上,表面上的學位越来越与内在的智力水平相一致之前,受过大学教育的男性可能会和一个受过高中教育的女性结婚但他选择的绝对是其中最机敏、聪慧的女性(甚至可能会拒绝那些不那么聪明,但由于家庭资源等因素上了大学的女性)今天,聪明的男性和女性都更可能获得大学(或更高的)学位这导致了教育分类的强化,即便其背后的相关基因型分类机制并未增强
配偶间显著的遗传差异表明,遗传流动性(genetic mobility)在代际方面起到了很大的作用虽然成功人士的子女会在所处的精英家庭环境影响下发奋努力,向父母看齐但这些孩子正面临着一场遺传基因的洗牌,这种洗牌有助于平衡下一代的竞争环境减缓代际间基因政治格局固化的步伐。当然由于环境和遗传因素,这些精英镓庭的子女在同辈中仍然有很大优势

遗传学已经成为学者和家族史爱好者的重要工具。它可以从社会而非个体的角度来揭示种族的奥秘
通婚状况一直是种族权力更迭和种族同化过程的重要指标。
随着我们在这个领域的不断深入各位读者需要牢记的是:在这一领域内,科学研究和伪科学理论曾对人类社会造成严重的伤害讨论这些问题的困难之处就在于:我们面对的困难不只是实际的科学问题,还有很哆可怕的传统观念——它们以科学、命运、自然之名禁锢了无数无辜的人

从当今美国看历史上的遗传进程

几百年后,美国的社会科学家仍旧在采用类似的模糊定义他们通常通过调查问卷来确定受试者是白人、黑人、亚洲人、美国原住民还是其他种族。题目中潜在的可以選择的种族类别数目越来越多(混血、太平洋岛人等)但是选择的过程是一样的:在数个人为构造的选项中,人们选择一个作为自己的種族而他们的依据通常是自己的肤色、祖先或自我认知。与此同时很多生物学家却已经将“种族”这一概念替换为“大洲祖先”,这茬一定程度上反映了生物学家不认为“种族”是一个分类例如,每个“种族”都有相同的蛋白编码基因(protein-coding genes)而且并没有任何明确的依據来把人这一物种再次细分。用“大洲祖先”代替“种族”的另一个理由是在遗传学研究中如果能精确定位个体在历史和地理上的起源,得到的结论也就更为确切比如,奥巴马总统不止是第一个“黑人”总统他还是第一个(就目前我们所知的)同时有着欧洲和非洲血統的总统。有了详尽的数据一个人甚至可以查清自己血统中芬兰裔或者爱尔兰裔的比例。虽然我们一般用种族作为代表起源的简单方式但是一旦了解了更有效的基因工具,我们就没有理由再这样做了事实上,个人化的遗传分析很可能会颠覆很多现有的故事那些故事玳代相传,对复杂的结合史不断进行简化逐渐偏离了事实的真相。

在100万年前一群智人(Homo sapiens)离开非洲,扩散到世界各地(也有学者认为這样的迁徙有多次)有证据表明,这场迁徙中的有效群体大小(也就是可以交配的人数)为人很难说究竟是只有这2000人富有冒险精神,還是他们只是一个庞大出征队伍的幸存者无论如何,关键事实是这2000人成为非洲外所有人的共同祖先
迁徙中的“人口瓶颈”导致现代社會中非裔和其他人之间巨大的遗传差异。当群体的有效交配人口数目过小时很多遗传差异会消失。进化中性理论认为:在没有选择压力嘚情况下基因标记的消失是随机的。如果一个群体很大那么一个给定的基因标记几乎不可能在某一代随机消失。而如果这个群体很小这件事情就更有可能发生。因此最早离开非洲的一小群人只包含整个群体中的一部分基因信息,而且很容易丢失随着人们离开非洲樾来越远,这两种效应使人群中的基因多样性越来越少事实上,在人类逐渐遍布地球的过程中迁徙最远的一群人中的多样性下降最明顯。这就好像在面包片上抹果酱的过程随着刀锋在面包片表面滑行,抹上去的果酱越来越少最后可能只有薄薄的一层。类似地距离東非的距离也可以很好地表征一个族群基因多样性的大小。
量化基因多样性的指标有很多最简单的是杂合子的比例(一个人两条染色体仩等位基因不同的频率)。在假设随机婚配的情况下如果某个位点的两种等位基因在人群中是平均分布的,那么此时的杂合子率是比较高的约50%,但是如果某一种的出现率减小到0这个位点是杂合子的概率也会减小到0。另一种检验基因多样性的指标是考察在DNA中一段给定的序列连续重复的次数例如,对AGGTCT在一行中进行重复计数这是所谓的拷贝数变异。
根据研究我们可以看到除了某些特例,非洲群体有极高的基因多样性而美洲原住民和太平洋岛民多样性较低,这和我们之前的预测——他们与东非的距离——是一致的我们现在用的种族汾类来自一段混乱而血腥的历史,其中不乏对事实的故意扭曲即便5个种族的分类法是合理的,这5个种族也并不能和遗传分析的结果保持┅致尤其是在我们可以精确量化这些差异之后。

祖先差异是重要因素还是随机误差

人种论在科学的角度是站不住脚的然而,大洲祖先嘚差异是有遗传学根据的但是大洲间的遗传差异对当代社会又有什么意义呢?现在我们有必要打破一些左右两派同样在大肆宣扬的对基因差异的神话了。“左派”的许多人倾向于忽略人种之间的基因差异指出这些人种内的基因差异大于人种间的差异。他们经常引用的倳实是所有人类的基因组有99.9%是一样的,并没有哪个族群含有其他族群没有的基因(比如编码蛋白的基因)。这些说法都是错的毕竟,我们和大猩猩的基因相似度也高达98%与尼安德特人的基因相似度也有99.7%。这2%(或0.3%)的差异是多么微不足道啊!
简单来说与其谈总体差异,不如具体基因具体分析虽然整体高度相似,但局部差异还是会产生巨大的影响这种效应存在于各种生物中。虽然像SNP这类常见的变异茬人群中的影响较小但是某些基因的改变或失效会对表型造成重大影响。即便是由多个基因控制的表型比如侏儒症或者智力障碍。
过汾强调所有的人类拥有同样的基因型(即使他们的表型不同)会忽视这样一个事实:生物学意义上的进化并非只体现在基因的增减上而哽多地体现在对基因表达的调节上——对产物、时机、位置,甚至表达与否的调节在人类基因组计划(HGP)启动时,对人类总基因数的预計为10万个左右毕竟,我们比只有32000个基因的玉米高等多了测序的结果让人大跌眼镜,人类的总基因数只有不足2万个所以说,绝大多数囚类的差异来自这2万个基因在体内的具体调节同一个基因可能在大脑中表达,也可能在肝脏中某些基因只有在受到细菌侵袭时才会被噭活,而一碗热面条又会关闭这个基因每个基因就像是一个努力工作的家长,白天在单位忙前忙后下班之后匆匆回家做饭,还要火急吙燎地去开家长会
人类有2万个基因这一事实并没有排除另一种可能——表型的差异来自基因组调控区变异(如启动子、增强子、小RNA和其怹分子开关)。相比研究人们是否拥有同样的蛋白更有意义的是研究等位基因是否一致。在考察了某个族群是否拥有其他族群没有的等位基因后我们得出的结论是肯定的。非洲人拥有最多的特有等位基因这也是该地区巨大基因多样性的体现。问题在于没有证据可以排除这些特有等位基因在群体差异中的影响。
“左派”的第三个观点是:从进化的角度人类发展的时间还太短,不足以让有明显效果的差异出现史蒂芬·杰伊·古尔德(Stephen J.Gould)有一句名言:四万年来,人类没有发生任何生物学上的变化所有的文明都是用同样的头脑和躯体建造的。根据此种说法人类进化史在现代人从东非起源之后就结束了。毕竟和原始人漫长的历史相比6万年的时间不过是弹指一挥。如果我们要分析其他大洲人类的差异时间尺度就更小了。然而族群间的差异既有可能从对原始突变的选择中产生,也有可能从一些多基洇决定的性状中产生因为其中已经积累了很多可供选择的变异。我们已经知道身高和认知能力具有很强的多基因性,数以千计的小小差异都影响着最终的结果如果群体中的高智商者生育率更高,可以预见几代之后群体的平均智商水平就会有质的飞跃(假定高智商带来嘚生存优势足够强)从这个角度来看,6万年似乎已经是地老天荒了只要不同的表现——不只是智力,还有勇气、自律等——会带来不哃的生存能力可以想见遗传性差异很快就会发生,不过需要几千年
事实上,这正是某些有争议的学者所推崇的理论他们的理论虽然能自圆其说,但是没有经过数据的检验仅仅依赖一些偶然的证据。尽管最近的研究显示技术的发展并没有让进化停滞,但我们并不知噵现代社会中自然选择的结果是什么的驱动力是什么以及它会带来哪些影响。换句话说虽然人类还在进化,在自然选择的结果是什么嘚压力下不断分化但是自然选择的结果是什么在各个大洲上仍然是相同的,不受社会等方面的影响
在人类进化以及群体差异的领域内,“左派”的观点只占了半壁江山“右派”也有自己的一套神话。诚然有一些基因,如FOXP2存在他们所说的那种强力效果,但他们恰恰錯在不是每个基因都是这样的
“右派”的另一个错误是过分相信自然选择的结果是什么而忽视了遗传漂变。在自然选择的结果是什么中不同的基因会使个体具有不同的存活率,从而逐步影响群体的基因型
而在基因漂变中,遗传变异是随机产生的与生存优势关系不大。这一过程会为不同地区、不同时期的族群(像是美国白人和美国黑人)打上不同的“标记”不同族群间的表型——比如,身高或智商吔可能出现差异但那是由和遗传差异密切相关的环境因素导致的。
随着环境的变化纯化选择正在发生。
因为我们在身体结构上发现了環境和基因的影响所以有些人认为,人类行为和心智也可以这样简单地去分析这是许多基因决定论者犯的另一个错误。他们犯了效度嘚错误盲目推广小样本下的结论是无效的。在一些由少数基因决定的性状中我们可以清楚地看到基因型与自然选择的结果是什么的关系,如肤色、瞳色和乳糖耐受等但是像认知能力这样由众多基因控制的性状,这一关系就不那么明显了在我们研究体形的时候,四肢長度的变化和阿伦定律预测的基本一致但是与身高不同,四肢长度这一性状只由少数几个基因控制(主要由HOX家族基因控制)实际上,身高并不符合纬度分布的规律除了行为表现的多基因型和复杂性,用遗传学来解释种族兴衰的理论并不可信1000年时光足以让人群中的遗傳差异充分表达,但200年或许就不够了50年的可能性就更小了。因此要想解释生活水平和社会形态的差异,我们需要比遗传差异更有解释仂的理论可能是制度差异,也可能是法律差异等等(我们会在第六章继续讨论)。目前的研究认为遗传差异虽然也是国家、种族和囻族间经济与社会差异的一个可能解释,但可靠程度很低而且难以证实。

各大洲祖先是真的说明了什么?

我们现在知道的是各大洲囚类的祖先有很大的遗传差异(这些差异和种族分类相关,但多数时候是相反的)我们现在试图回答一个更加具有争议性的问题:当代媄国种族间各项指标的差异可否用祖先间的差异来解释呢?有没有一些基因型差异凌驾于环境差异之上直接导致了教育水平和收入水平嘚差异(关于环境因素的部分请参阅附录5)。我们已知不同祖先的人群间有很多基因的频率不同,但是有证据表明这些不同并没有给智商等指标带来显著的影响。但是是否存在这样一种可能:在黑人与白人之间的这些小小的差异累加起来就形成了足以影响智商的结果呢?我们又该怎样观测这样的变化呢
这是一个“令人不愉快的”,总是被意识形态左右的问题作为科学家,我们有充分的理由绕开这個问题换句话说,这些研究带来的破坏性比它们的价值更高现在我们提出这个问题,就是希望以一种科学的而非意识形态的角度来看待它虽然把研究限制在某一个种族内会更简便易行,但如果我们的书中只涉及社会遗传学而非它和种族的关系,那显然是在逃避问题在围绕美国论述种族/大洲起源的一章中,如果我们不谈基因在解释社会经济结果方面的潜在作用也不免有隐瞒事实之嫌。此外略过這些内容显然会背离本书的主旨:负责任地将遗传学与社会科学结合起来。最后即最重要的是随着遗传学和社会科学交叉研究的大发展,终有一天会有人去研究种族、基因和社会成就间的关系与其等着一帮种族主义学者借题发挥,还不如我们现在就向公众揭示到底什么樣的假设是合理的什么样的数据又是科学的。
正如我们在上文中提到的找到一个明确的、科学的方法几乎是不可能的。而这与某些学鍺随意做出的结论——遗传因素可以解释白人与黑人智力测试的分数差距——形成了鲜明对比简要介绍了分析遗传学的方法后,我们希朢这样的讨论可以警示科学家该如何对待涉及种族、基因和智力的研究随着数据的增加,这一领域无疑会有更多大胆的尝试因此,我們既要努力打磨问题提出解决方案,也要避免重蹈覆辙以致有些人把模糊的证据用于给伪科学辩护。
话虽如此过往研究中的疑点并鈈意味着在种族分析中应用遗传学方法总是有害的。通过对基因型变量的控制我们实际上可以更清晰地了解社会过程的影响,比如歧視现象。也就是说只要我们将人群间的生物或遗传差异设为控制变量,从而将它们的影响排除在外环境(非遗传)因素的意义就会更加突出,例如结构性的种族歧视。控制遗传差异排除了实际后果中的先天因素
在本章当中,我们进行了一场思维的探险结果证明:瑺用的政府种族定义是不可靠的社会建构,不符合实际的遗传学分析结果然而,我们也承认不同大洲祖先的比例是有生物学意义的虽嘫这与人群选择有关。随着获取遗传数据越来越便捷种族和遗传祖先的不一致可能会引发对种族理论的修正。也就是说当许多白人意識到他们有非洲血统,而许多黑人也发现自己有欧洲人祖先时“一滴血原则”可能就会被更复杂、更细致的分类方法所替代。另外正洳社会学家安·莫宁(Ann Moring)所说,“我们都知道种族融合早在19世纪,人口普查单位就因此列出了‘1/4黑人’甚至‘1/8黑人’这样的项目。但即使如此‘一滴血原则’并未偃旗息鼓,反而在外界对其的反应中越发强化”
面对种族融合的问题,科学知识也许比简单的、朴素的認识更能把问题讲清楚权威性也更强。当然也可能不是这样。不管是哪一种情况正如在择偶、社会流动和生育等方面一样,社会遗傳学都揭示了隐藏在表象之下与直觉相悖的种族奥秘。在如此强大的工具面前我们显然不能望而却步。

无论是在过去还是现在将演囮学、遗传学、生物学与经济学、人类学、历史学、政治学、社会学结合起来的工作一直存在着很大争议,甚至有些学科之间存在着整体嘚对立关系人类学家将一些经济学家的著作描述为“业余的大话,数据薄弱方法不当,而且会带来有害的社会政治影响”这简直是學术界里的门派争斗。尽管存在着这些争论学科融合带来的新发现还是层出不穷,使我们无法忽视这种探究解读经济发展史的新思路、噺方式

越来越多的宏观经济学者开始转向历史纵深,结合长期历史进程中的历史、文化、社会层面因素以进一步解释当今世界的发展模式。这一学派的经济学家在思考经济发展的“深层”根源时将制度和文化的长期差异也考虑在内。
这一领域已经提出了很多颇有争议嘚新颖假说正如前文讨论过的先天后天之争,其焦点在于:环境因素和社会组织结构哪一个更重要一方面,许多学者相信国家层面仩的收入、发展、健康差异主要是由地理和历史因素决定的,也就是相对恒定的地理优势(河流丰富、气候适宜、土壤肥沃、少有疾病瘟疫等)再加上有利的偶然历史事件(如驯化家畜较早)。这些资源在特定阶段与相应技术结合从而使经济得到迅猛发展。另一方面吔有很多学者认为,决定国家经济发展的核心因素主要是制度上的例如,所有权的形成、法律规定、代议制民主等
探讨这一分歧是很偅要的,其中最重要的动力在于我们希望知道如何促进、刺激、创造世界范围内的经济发展、福利和人口增长。广义来说这个探讨是茬问这样一个问题:发展到底是有一套方案可供遵循,还是已经被预先安排好了一个极端观点认为,重点在于制度通过遵循目前已经荿功的发展道路,我们可以人为地去设计和规划发展例如,美国和世界银行的援助开发基金往往都有一些附加条件规定和指导资金的使用方式。另一个极端观点则认为历史和地理因素更加重要,单纯借鉴现有范例很难重现过去的成功事实上,有很多发展中国家虽然遵循美国等富裕国家的发展模式但成功者寥寥无几,这在一定程度上支持了历史地理论的观点
与大多数热门争论一样,正反双方都有夶量的统计数据和案例
其实,正如同单独的体制因素无法完全解释当下的国家兴衰一样单独的地理因素同样做不到。
制度论和历史地悝论对经济发展所做解释的分歧将富裕国家、非营利组织和相关国家的公民联系在了一起。许多富裕国家认为有道德义务去帮助落后国镓脱贫因而采取了建设基础设施、支持当地工农业、扩大教育覆盖面、健全政府结构、直接捐赠现金和粮食等方式。然而由于支援的實际效果有好有坏,而且学界对经济发展的核心决定要素也是众说纷纭因此富裕国家支援贫困国家的行动一直伴随着争议和矛盾。事实仩随着历史地理因素和制度因素各自的作用逐渐明晰,对经济、制度、地理互动关系感兴趣的经济学家已经开始探索新要素了——群体从而提出了群体遗传学。

国家发展理论的新议题:遗传学因素

少数社会学家提出了一套引发巨大争议的新想法即将演化学、遗传学和苼物学等学科中的概念引入对国家发展的阐释中。这些想法恰恰与当前学界的热点问题相吻合:解释长期决定因素对经济发展的影响这些学者将群体遗传学视为一个影响经济发展的潜在长期决定因素,从而将环境变化与人类社会演变联系了起来
人类群体遗传学会测定某個遗传突变发生的频率,并分析造成当今各国、各地区差异的历史与演化过程群体遗传学与宏观经济学、经济发展史的结合使自然选择嘚结果是什么(natural selection)、遗传漂变、突变和种群间基因流动(gene flow)等概念成为解释经济发展进程的潜在模型。这些概念还与冲突、贸易等宏观进程相联系地球物理环境通过群体来影响经济发展的一个方式,就是改变群体的遗传组成(genetic compositions)本身
正如我们已经看到的,自然环境改变叻不同国家居民的遗传变异情况例如,在疟疾肆虐的地区引发镰刀型细胞症的等位基因会被保留下来。又如接触日晒时间和强度不哃的人群,皮肤内黑色素的含量也不相同与此同时,随机遗传漂变在经过漫长的发展后会在群体中产生无数种基因型,其中有些突变昰重要的而另一些则可有可无。这些基因型都是可以流动的即基因流动。环境改变群体的扩张、缩减、迁移,群体互相之间的主动哃化疾病的爆发和传播,这些过程都会导致基因流动通过分析一个群体的遗传组成,我们就能够了解在某个特定时间和地点群体究竟利用了环境的哪些方面。如果环境远未达到适宜居住的条件那既有可能刺激群体的发展(如发展动物驯养技术),也可能将他们赶出原本的栖息地(如传染病暴发导致人口衰减)有些环境会被人类开发,而有些则不会一个环境是否会被群体开发,依赖于环境与群体嘚契合度而环境与群体之间的契合度也是在不断变化的。我们知道在漫长的历史岁月中,人类遗传特征(human

在2013年夸姆罗·阿什拉夫和奥德·盖勒在最有影响力的经济学期刊之一《美国经济评论》上撰文,论证了具有“适中”(Goldilocks)遗传多样性的国家往往收入更高发展更快。作者观察到许多遗传多样性过低的国家(例如,玻利维亚等大部分国民为美洲原住民的国家)和遗传多样性过高的国家(例如许多撒囧拉沙漠以南的非洲国家)的经济增长相对缓慢;而遗传多样性适中的国家如欧洲和亚洲国家,在前殖民时代和近现代的发展程度都较高
有学者注意到,用遗传学理论来解释国家层面的发展差距——如欠发达的非洲和发达的欧美——会不会有点太“顺手”了事实上,這一发现可能会被曲解如果我们仅凭这一发现,就认为国家层面的经济发展是一个“自然”的过程而不受政策影响那显然是断章取义叻。
阿什拉夫和盖勒的理论也暗含了这样一个逻辑:欧洲殖民者的殖民入侵对美洲原住民的发展是“有利”的因为他们提高了当地的遗傳多样性(当然,假设当时没有发生疫病和战争)尽管两位作者已经在文中极力反对如此过分简化的解读方式,并提醒读者他们的发現也可以通过其他方式解释(如文化特征的重要性)。但是读者显然往往会被标新立异的言论所吸引。这些新奇的解释和政策观点的出現表明:我们在进行这类分析时一定要小心谨慎不能随意将生物学和遗传学的概念套用到经济和社会发展的问题中,以免带来不良的政筞影响

这一理论的基本观点(假说)是:群体和国家在群体水平的遗传多样性上面临着一种权衡。
正是由于遗传多样性具有正、反两方媔的效应因此存在一个最有利于社会发展的遗传多样性水平。“适中”的遗传多样性既具备了多样性带来的优势同时相应的劣势也不呔明显。这种“适中”的遗传多样性能最大程度地促进社会的发展
无论是哥伦布开启大航海时代之前,还是进入21世纪的现代社会群体遺传多样性都存在着上述提到的两种作用方式,形成了“驼峰形”的曲线和“适中多样性”效应群体遗传多样性过高或者过低的国家其國民收入都较低,而多样性适中的国家则有着较高的收入
我们如何将这种模式与国家贫富的传统解释相结合呢?阿什拉夫和盖勒认为遺传多样性因素是对现有经济发展理论的一个重要补充,而不是独立于历史地理论或制度论事实上,作者在模型中使用了多个统计控制變量因此已经将现有文献的多个经济发展机制考虑在内了,例如农耕开始时间的不同(上文中戴蒙德的观点)和制度的重要性等(上攵中阿斯莫罗和罗宾逊的观点)。尽管阿什拉夫和盖勒并不认为自己的发现是一套全新的理论体系但他们相信自己的发现能够提高现有悝论的解释力:遗传多样性是解释现代国家之间巨大发展差距的一个新的重要因素。“遗传多样性可能会影响国家的发展”既是经济学理論上的一大新发现同时它也成为利用群体遗传学理论、方法和数据对某一重要现象做出新解释的成功范例。
然而这只是我们对于现象的┅种解释一个国家的发展兴衰真的可以部分地由遗传多样性的长期效应来解释吗?这一假说虽然有一定的理论依据也得到了一些初步嘚实证结果的支持,但是阿什拉夫和盖勒指出他们观察到的现象也存在其他的解释方式。
即使我们已经假设遗传多样性和经济发展之间存在着因果关系对这一关系的阐释仍然晦暗不明。虽然作者有一套个人偏好的解释(即我们在上文所做的分析)他们仍然无法排除许哆其他解释的可能性。例如遗传多样性与国家的种族构成存在联系。这种潜在的相关性意味着我们很难确定遗传多样性与国家发展之間的联系是通过阿什拉夫和盖勒所提出的“分工和分歧”的方式,还是通过其他与种族构成相关的方式如殖民史、战争、自然资源开发等。
阿什拉夫和盖勒也承认他们无法把遗传多样性从更广泛的文化进程中分离出来。在他们的数据中他们无法对更广泛的文化进程进荇测量。这一点很值得注意因为这让我们难以把研究结果应用到政策分析中。遗传多样性可能只是“附属于”(即具有统计上的相关性)将文明彼此区分开的更广泛的文化进程中在这种情况下,我们获得的遗传多样性可能和碱基序列本身的变化没有太大的联系而与文囮联系更紧密。例如在不允许近亲结婚的文化中,群体的遗传多样性会较高
对于阿什拉夫和盖勒的理论,还有最后一点需要注意那僦是对于遗传多样性可能促进创新,也可能增加猜疑、冲突作者只给出了间接而有限的论据。而这一点实际上是他们提出的机制的核心論点尽管他们在文中展示了遗传多样性和科学专利(可以作为衡量科技创新的指标)之间的关联,但是他们无法证明遗传多样性对更大范围的科技创新的影响也没有给出论据来支持遗传多样性过高会增加群体内的猜疑、暴力和冲突。正是由于他们假说的核心论点缺乏强囿力的证据支持对其结果的反对之声也不绝于耳。或许他们发现了一些可以解释甚至预测经济发展的新概念即遗传多样性与国家经济發展存在联系,但是我们目前还无法具体地明确这一层关系
那么他们的观点与之前我们讨论的制度观点是否互洽呢?他们的观点和阿斯莫罗与罗宾逊提出的“制度对于国家发展至关重要”的论点是相互矛盾的也就是说他们提供了制度论目前缺失的一环——从一开始导致各国建立不同制度体系的原因。也许遗传多样性正是造成初始制度差异的一大因素同时,在人类最初从非洲迁移到世界各地的过程中戓许不同文明迁移距离的远近也与文化不同相关。而文化和遗传多样性一样从远古至今一直影响着文明(或国家)的发展。因此我们の所以看到当前各国的生产力水平不同,可能并不是因为遗传多样性本身的差别而是由各自的文化和制度造成的。遗传多样性可能只是“标示”出了长期的文化与制度差异
阿什拉夫和盖勒这篇文章的论断很宏大,而且引出了一个令人担忧的假说:遗传多样性可能会对总體(即国家层面)生产进程带来不利影响如前所述,这一假说目前还没有被最终证明(单凭一篇文章不可能完全解释清楚)所以目前峩们还远不能说明这个发现的意义。事实上在更多的证据提出之前,我们或许应当谦虚谨慎地对待各种科学结论尤其是当我们想到科學种族主义的遗毒给全世界带来的恶果时,我们就更应该对“遗传多样性会影响国家发展”这一假说持严谨的态度为了更好地剖析遗传哆样性影响经济发展的内在机制,我们需要多层面的新研究包括微观的、国家层面以下的研究,可能还需要来自产业、工厂、车间的材料以证明遗传多样性对经济发展的影响(尤其是国家以下层面的)是确实存在的,也是能够检测到的
值得一提的是,人们很早就发现叻多样性对生产活动所带来的积极影响但是很少有实证研究把它扩展到遗传多样性上。这里面或许存在着把一个领域的直觉论断(互补嘚新观念会提高劳动生产力)过渡推广到另一个领域的风险(观念多样性源于遗传多样性)即使人们开始发现支持这两个论断的证据,泹要想验证它们的正确性还是需要大量的证据与本书里提到过的其他新兴观点一样,这些想法有可能是正确的但并未得到真正的检验。

尽管离证实还有一段距离但是阿什拉夫和盖勒的新兴观点已经吸引了其他一些研究者。恩里科·斯伯劳雷(Enrico Spolaore)和罗曼·瓦茨格(Romain Wacziarg)发表了一篇分析“群体(国家)遗传多样性水平与国家间发生冲突的可能性”之间相关性的论文
然而,结合了遗传学和国际关系学的知识这篇文章的结论与直觉完全相反:冲突和战争更容易在基因相似性较高,而非较低的群体间爆发但是,当我们考虑到这一结果其实存茬许多与“遗传”无关的解释时似乎就不足为奇了。首先遗传上相似性更高的群体很有可能本身在地理位置上就很接近,当一方触动叻相邻另一方的重要利益时战争或冲突可能就爆发了。针对这一问题研究者对于国家间的地理距离做了调整,随后他们发现遗传差异仍旧是影响国家间发生冲突或战争的一个因素另外,“遗传”现象也可能来源于另一个社会因素——遗传混合(genetic admixture)两个群体之间遗传楿似度高可能是由于在历史上这两个群体之间发生过侵略、贸易等相关交流事件,从而导致群体间发生遗传混合例如,两个遗传相似度佷高的国家——英国和美国——在1812年爆发了战争部分原因就在于之前英国对北美的征服。这样一来遗传相似度高的国家在未来更有可能爆发冲突和战争就毫不奇怪了:因为这些国家间的遗传相似性可能正来源于之前的冲突(例如,侵略战争和战后的遗传混合)过去的沖突或战争给未来的国际争端埋下了隐患。因此研究者在统计时也调整了过往冲突和战争所带来的影响,随后他们发现遗传相似性仍旧影响着群体间爆发冲突的可能性不过,与阿什拉夫和盖勒将遗传多样性与经济发展相联系的研究一样认为遗传距离(genetic distance)与地区间冲突楿联系的学说是一个尚未成熟的新理论。

另一些经济学家开始考虑历史上群体遗传学与环境资源之间的相互作用关系他们关注的是,群體遗传学的某些方面会如何影响各国发展模式的差异他们的研究方式不再是假设存在一个最理想的遗传多样性程度,而是深入到基因组嘚具体序列中探究历史进程中基因组的特定变异是否使不同群体得以开发利用各自的环境。
经济学家贾斯汀·库克发现,在早期的人类历史中,人们就已经拥有了在断奶后消化奶类的能力(或者说进化出了这样的基因),而这一能力提升了1500年的人口密度(群体中拥有该能力嘚人口比例提高10%会导致人口密度增加约15%)而且,其他研究已经发现历史上经济发展的差异会带来长期的影响这就表明,如果基因组在適当的时间和地点发生了微小的变化(例如在新石器时代畜牧业出现的区域),那么它可能就会为各国的经济发展带来巨大的、持久的、不断累积的变化
宏观经济学家也开始探索群体遗传学影响经济发展的另一种方式——遗传因素可能会影响群体的健康水平,从而影响國家的生产力和收入
在猜硬币中,最优方案是随机选择这个简单的博弈可以应用到许多现实世界的例子中。
根据博弈论得出的结论┅个群体的免疫机制如果具有做出“混合”选择的能力,那么这个群体在漫长的历史岁月中就更有能力抵御病原体感染,保持繁荣兴旺
于是,库克似乎发现了一些听起来不可思议的结论:遗传变异可能对国家层面的发展产生着重要影响具体来讲,群体免疫遗传多样性[人类白细胞抗原(Human Leukocyte AntigenHLA)系统]的提高,可以延长群体(国家)的预期寿命30但这个发现可能只是新瓶装旧酒。人类白细胞抗原的多样性鈳能和国家间的移民流入有关(移民流入增加了白细胞抗原系统的多样性)那么,当他“发现”移民流入较多的国家的预期寿命高于移囻较少的国家时认为决定国家预期寿命差异的就是移民因素,而非白细胞抗原的多样性针对这样的怀疑,库克为了进一步阐明观点而提出了另一个检验他试图用数据验证这一推测,而验证的结果证实了他的想法:尽管在20世纪中叶白细胞抗原多样性程度较高的国家有著更长的预期寿命,但到了20世纪下半叶随着疫苗和新医学手段的推广,白细胞抗原多样性就不再体现出其优势了
在这个例子中,白细胞抗原多样性一开始提供了生存优势(更能抵抗疾病)之后随着生存条件的改变(药物和疫苗的使用增加),它的优势就体现不出来了这其实就是一种遗传与环境的相互作用,只不过在这个例子中是发生在群体层面上我们之前提到过的乳糖酶基因也是类似的:乳糖酶基因只有在具备养殖驯化动物的条件下才能够发挥作用。如果没有奶牛、山羊等家畜乳糖酶基因的存在就不会给群体带来任何优势(我們将会在第七章详细探讨遗传和环境因素的相互作用)。
群体遗传学的概念和数据的引入并没有颠覆之前的制度论和历史地理论而是给整个理论体系带来了新的补充。与通常的遗传学分析一样把遗传学与国家经济发展相结合的研究兼有自上而下和自下而上两种方法。与の前章节讨论的分析候选基因的方法类似(自下而上)一些宏观经济学家通过理论、机制分析研究了某些具体的遗传突变,如乳糖酶基洇单单一个基因突变就会在数百年的历史中造成国家层面的巨大发展差距,这是一个惊人的结论同时这种可能性也引出了一个新思路:将群体遗传学的影响引入历史地理论的宏观经济增长模式分析中。有些经济学家则采用了类似全基因组关联分析(自上而下)的方法試图探究总体遗传指标(如遗传多样性和遗传距离)与经济发展之间的关系。我们对这方面机制的认识还远远达不到实用阶段新的研究戓许可以增进我们对影响发展和迁移的核心要素的理解。但是随着新观点的产生它们也有产生国家财富“先天决定论”的危险(即国家發展由基因组决定,因而是与生俱来的)我们认为这是一种需要反对的鲁莽观点。因为我们发现(在第七章我们会进一步讨论)单独嘚基因或者环境因素都无法很好地解释现实现象,这些现象常常是基因与环境相互作用的结果

异质性是社会干预手段的常态,而非例外有些时候,我们能根据一些维度区分出措施的适用或不适用人群比如,收入水平、性别甚至身高体重指数。但更为常见的是异质性现象的来源完全隐匿在了平均效应的阴影之下。如果说平均效应是一束白光那么真的希望我们有一面棱镜,能将这束白光折射成代表異质性的七色彩虹搞清楚各自的来源。这正是社会科学家研究基因和环境的动力也是他们崇高理想之所在。
随着对基因与环境相互作鼡的理解日益深入我们逐渐意识到,如果仅仅关注某遗传效应或环境的平均效应就会漏掉很多事实。既然遗传因素能够过滤和反映出環境因素对我们自身的影响那么我们假设红色药丸对含有A基因型的人群有疗效,而对B基因型的人群则毫无用处但是,与蓝色药丸相比红色药丸对含有B基因型的人群可能会有更大的危害,这样的话如果我们没有基因型信息,最后得到的平均效应就是0在更多地了解了基因和环境的相互作用之后,我们理应让含有A基因型的人群服用红色药丸让含有B基因型的人群服用蓝色药丸,以期得到最佳结果如今,在药物基因组学(pharmaco genomics)和个体化用药(personalized medicine)这两大领域当务之急就是解决这些具体的问题,然而解决的思路并不局限于设计药物这一个方媔因为造成这些问题的也可能是让一些人受益,却伤害了另一些人(或者与他们无关)的政策如果真是这样,那么也许我们需要开创囿关专门制定个体化政策和“政策评估组学”(policy-evaluation-omics)的领域了
事实上,随着基因环境互动方面研究的深入学者已经开始从遗传学社会科學和政策评估两个方向对现有的普遍观念提出了质疑和新解读。这些情况还表明当我们不再狭隘地关注药物和政策的平均效应时,生物學和社会科学的学者需要携起手来寻找各种形式的新证据,包括效应的分布情况(而不只是平均值)还有检测被试的基因型,为随机對照试验做好准备(这项工作已经启动)

基因和环境的相互作用---以智商为例

在一些情况下,基因和环境之间的相互作用是显而易见的盡管基因发挥着同样的功能,但环境最终导致了表型上的不同结果虽然环境并不一定会影响基因的内在生理机能(也不是不可能),但咜却能够影响基因实现的结果这些事例迫使我们意识到,当我们在研究基因对行为的影响时忽略环境因素是一个致命的错误。一方面如果我们研究的是非常基础的且与社会及环境无关的生理机能,那么只关注基因型是有益的;另一方面对于受社会因素影响的结果,仩述例子表明单单强调基因的作用是站不住脚的,基因与环境之间普遍存在着相互作用
在与基因环境有关的文献中,一个明确的主题昰我们应该去研究先天因素和后天因素之间的联系,而不是去探讨这两者应当舍谁留谁基因型对行为的影响取决于环境,环境对行为嘚影响取决于基因而且,在一定程度上我们会根据基因型主动地选择和塑造自身的环境,这就使问题变得更加复杂了
心理学家艾瑞克·特克海默(Eric Turkheimer)认为,基因效应没有平等可言他注意到,与出生于优渥家庭的双生子相比遗传因素对贫困家庭双生子智力的解释力哽弱。换言之越是往社会阶级的上层走,同卵双生子与异卵双生子(双生子模型中度量遗传效应或遗传力的指标)的差别就越大根据特克海默对这些结果的解释,出生于优渥家庭的孩子能够接触到各方面的资源不论是经济上的还是非经济上的,从而确保他们能完全激發遗传潜能至少在智力方面看是这样的。社会不利因素会消除遗传上的优势而这些优势本会在一个机会平等的社会中“自然地”出现,于是能力上的先天差异被消除社会底层的情势越发恶化,因此对贫困家庭的双生子来说基因的优劣毫不重要。
凭直觉来说这个理論是有道理的。在种族歧视的社会中只要你是黑人,就无法上大学或者找到一份好工作早在1967年,这种与种族相关的情况就被发现了當时,社会学家奥蒂斯·达德利·邓肯(Otis Dudley Duncan)和皮特·布劳(Peter Blau)发明了“不正当平等”(perverse equality)一词用来描述非裔美国人的阶级背景对事业成僦影响较小的情况。
尽管特克海默谈论的是智商分数的高低而布劳和邓肯谈论的是职场出路,但他们的观点可谓若合符契他们的核心觀念介于先天论和后天论之间。白板理论是纯粹的后天论思想是“左派”学者内流行的观点。特克海默认为遗传因素极为重要但他的悝论也承认环境扮演着独特的关键角色。直观地说特克海默的理论表明,资源再分配不仅能促进结果的平等化(换言之让底层子弟也囿出头之日),而且通过释放低收入个体身上未充分利用的遗传潜能经济效率会有大幅提升。这样从公共财政的角度来看,资源再分配不会赔本甚至可能有赚头。
虽然我们还远没有破解不同阶级间基因效应差别的谜团但至少可以通过这些多基因分数研究的结果清楚認识到,刚发现不同人群间——不管是按照种族、阶级、地理还是家庭划分——的基因效应存在差别就假设其反映了“真实的”基因与環境互动关系,这种做法多么愚蠢
理解遗传和环境之间的相互作用已经够复杂了,更麻烦的是两者的关系似乎是一种非常复杂的动态反馈回路,因此很难分清谁是因谁是果。毕竟只要人们(尤其是父母)对生活的地点、方式和邻居有一定的选择能力,那么基因型就會反映到对环境的选择上把基因与环境之间的相互作用从不同基因之间的相互作用,或者从不同环境之间的相互作用之中分离出来并非噫事但是这对于理解人类行为的起源和正确评判政策的好坏都起着至关重要的作用。

基因与环境之间相互作用的理论

素质应激假说(diathesis-stress hypothesis)昰一个论述基因环境相互作用的早期概念框架它认为一些个体天生具备“冒险型”基因(“risky” genetic variants),而其他个体具备“保守型”基因(“safe” genetic variants)但是如果都生活在一个中性的环境中,这两类个体最终的情况会大体相同;而如果“冒险型”个体生活在极端环境下结果就会大鈈相同。这就体现出了基因与环境之间的相互作用事实上,尽管存在争议但是大量数据表明,对于拥有与5-羟色胺系统相关的“冒险型”基因的孩子遭受虐待会使其生活前景明显恶化;当然,其他没有这种基因的孩子也是一样只是程度要轻得多。既然没有收益那么囚类为何要选择“冒险型”基因呢?为什么进化压力没有消除这些基因型针对这些问题,人们提出了多种理论第一种理论认为,这些“冒险型”基因在不太遥远的过去是有益的只是现在看来会造成对紧张环境“过度反应”的基因型,放在东非大裂谷这种极端环境下就佷可能是有益的但是人类已经离这些极端环境太遥远了,以致很多基因型在自然选择的结果是什么后都消失了
第二种理论认为应从物種而不是个体的角度去思考,假设存在“兰花型”基因和“蒲公英型”基因两种类型“蒲公英型”基因能应付绝大部分的环境,而“兰婲型”基因只能在理想环境中发挥作用拥有“蒲公英型”基因的个体能够抵御在环境变化过程中可能遇到的危险(虽然种群选择还是一個有争议的进化论概念)。站在物种的角度上来看为了确保万无一失,人类会希望同时拥有这两种基因型为了防止环境出现巨大变化(如气候变化)将完全适应当前环境的“兰花型”基因全部抹除,“蒲公英型”基因的存在对物种延续就显得尤为重要
这种进化上的风險管理已经在很多物种上有所体现。

用现有数据来检验这些想法已经够麻烦了但偏偏有一批社会科学家还指出,某些关于基因与环境相互作用的文献有着潜在的致命缺陷
为了能够更好地探究基因与环境之间的相互作用,我们需要考虑另一个问题:我们所研究的环境是否受到了人为控制或者说它是否是外源性的。这个问题十分重要因为评估基因与环境之间相互作用的过程分为两个关键的步骤:先将社會活动中的基因成分与环境成分剥离开,然后再研究这两者的相互依赖关系第一步就十分困难。如果各种行动和因素不能清晰地被分成“基因的”和“环境的”而是说我们对环境的反映本身就是部分由遗传因素决定的,那又该怎么办呢实际情况可能是基因也会塑造我們与之互动的环境,而非基因和环境是两种独立的力量各自对我们直接发挥作用,同时两者之间也会进行相互作用基因型塑造我们所處的环境,这就是所谓的基因—环境相关性(gene-environment 第一种是积极型基因—环境相关性(active gene-environment correlation)人们(无论是儿童还是成人)能够部分地决定自己所处的境遇,而这可能是为了更好地“适应”或者利用环境这个过程也被称作选择性基因—环境相关性(selective gene-environment correlation)。例如内向的人选择的环境(朋友、党派等)可能就与外向的人不一样。
第二种是唤起

  南方人的免疫力更强;通过基因数据可以推断个人的身高;基因检测能间接推断其易感阿兹海默症的几率……由中国科学家主导历时两年,对14余万中国人的无创产湔基因检测数据研究取得重大成果该成果发表在最新一期的国际顶级学术期刊《细胞》中,首次揭示了中国人群基因遗传特征

  基洇是生命的密码,国家级人群基因组学研究以及对遗传资源的保护与应用是精准医学的基础直接影响到一个国家在生物医学领域的核心競争力。大规模人群基因组学的研究可以发现与疾病(或表型性状)显著相关甚至是起决定性作用的遗传变异。为此在基因测序和无创产湔基因检测上深耕多年,并且成功运营我国首个国家基因库的深圳在2016年正式发起“百万人群基因大数据研究”项目希望促进遗传学研究與精准医学事业的发展。此次发表在《细胞》上的正是其第一期成果

  虽然我国人口众多,历史悠久但长久以来,由于实验研究抽樣不充分导致我们对自身的遗传特征认识不多。在本次研究中华大的研究小组成功构建了包含904万个多态性位点在内的中国人基因频率數据库,其中约有20万个多态性位点属于首次发现这是目前正式发表的最大规模的中国人群基因频率数据库。

  值得一提的是研究小組确定了6个在地区纬度方向上受到强烈自然选择的结果是什么的基因,它们在基因频率上呈现明显的南北差异充分展现了饮食、气候、疒原体等环境因素对中国人群的演化所起到的选择作用。

  比如由于古代在北方、西北等地区如新疆、青海和内蒙古等省份可能由于蔬菜获取比较困难,导致生活在这些地区的人们肉类摄入比例较大因此,促进脂肪代谢率的等位基因在这些地区有明显富集的趋势;而古代中国南方由于自然环境恶劣病原微生物尤其是疟疾盛行,因此对于生存于该地区的人在免疫力方面有较高的要求

  同时,研究尛组通过分析人群遗传距离的变化和基因流方向揭示了汉族与少数民族群体的遗传结构特点及中国各省与欧洲、南亚、东亚人群的基因茭流程度(或者说是通婚程度),发现当今中国人的遗传特点同时受到丝绸之路及近代人口大规模迁徙等因素的多重影响甘肃以及靠近甘肃渻的宁夏和青海省的汉族人群体中所含有的欧洲人成分高于其它省份,为全国平均水平的1.7倍达到0.115%。

  研究小组还全面揭示了全国31个省級行政单位的人群病毒携带率以及病毒在个体血浆中丰度的分布其中,研究发现中国人血浆的病毒组与欧洲人存在比较大的差异,比洳在欧洲人群中携带率排名前两位分别是与皮肤急疹相关的疱疹病毒7型及与鼻咽癌相关的疱疹病毒4型,而在我国人群中排在首位的则是乙肝病毒其感染发生率大约为2.5%。

  “此次研究成果证明了生命科学产业已经从单个样本的检测和诊断正式进入了基因大数据时代。”华大生命科学研究院院长、文章第一通讯作者徐讯表示未来中国科学家得以借助对基因大数据的研究和分析,更深刻地了解人类的生咾病死进一步促进我们对复杂疾病、罕见病、药物研发、肿瘤基因解读等方面的研究与应用开发。

(文章来源:人民日报海外版)

《百萬人群基因大数据研究表明 丝路影响了中国人遗传特征》 相关文章推荐一:百万人群基因大数据研究表明 丝路影响了中国人遗传特征

  喃方人的免疫力更强;通过基因数据可以推断个人的身高;基因检测能间接推断其易感阿兹海默症的几率……由中国科学家主导历时两姩,对14余万中国人的无创产前基因检测数据研究取得重大成果该成果发表在最新一期的国际顶级学术期刊《细胞》中,首次揭示了中国囚群基因遗传特征

  基因是生命的密码,国家级人群基因组学研究以及对遗传资源的保护与应用是精准医学的基础直接影响到一个國家在生物医学领域的核心竞争力。大规模人群基因组学的研究可以发现与疾病(或表型性状)显著相关甚至是起决定性作用的遗传变异。為此在基因测序和无创产前基因检测上深耕多年,并且成功运营我国首个国家基因库的深圳在2016年正式发起“百万人群基因大数据研究”項目希望促进遗传学研究与精准医学事业的发展。此次发表在《细胞》上的正是其第一期成果

  虽然我国人口众多,历史悠久但長久以来,由于实验研究抽样不充分导致我们对自身的遗传特征认识不多。在本次研究中华大的研究小组成功构建了包含904万个多态性位点在内的中国人基因频率数据库,其中约有20万个多态性位点属于首次发现这是目前正式发表的最大规模的中国人群基因频率数据库。

  值得一提的是研究小组确定了6个在地区纬度方向上受到强烈自然选择的结果是什么的基因,它们在基因频率上呈现明显的南北差异充分展现了饮食、气候、病原体等环境因素对中国人群的演化所起到的选择作用。

  比如由于古代在北方、西北等地区如新疆、青海和内蒙古等省份可能由于蔬菜获取比较困难,导致生活在这些地区的人们肉类摄入比例较大因此,促进脂肪代谢率的等位基因在这些哋区有明显富集的趋势;而古代中国南方由于自然环境恶劣病原微生物尤其是疟疾盛行,因此对于生存于该地区的人在免疫力方面有较高的要求

  同时,研究小组通过分析人群遗传距离的变化和基因流方向揭示了汉族与少数民族群体的遗传结构特点及中国各省与欧洲、南亚、东亚人群的基因交流程度(或者说是通婚程度),发现当今中国人的遗传特点同时受到丝绸之路及近代人口大规模迁徙等因素的多偅影响甘肃以及靠近甘肃省的宁夏和青海省的汉族人群体中所含有的欧洲人成分高于其它省份,为全国平均水平的1.7倍达到0.115%。

  研究尛组还全面揭示了全国31个省级行政单位的人群病毒携带率以及病毒在个体血浆中丰度的分布其中,研究发现中国人血浆的病毒组与欧洲人存在比较大的差异,比如在欧洲人群中携带率排名前两位分别是与皮肤急疹相关的疱疹病毒7型及与鼻咽癌相关的疱疹病毒4型,而在峩国人群中排在首位的则是乙肝病毒其感染发生率大约为2.5%。

  “此次研究成果证明了生命科学产业已经从单个样本的检测和诊断正式进入了基因大数据时代。”华大生命科学研究院院长、文章第一通讯作者徐讯表示未来中国科学家得以借助对基因大数据的研究和分析,更深刻地了解人类的生老病死进一步促进我们对复杂疾病、罕见病、药物研发、肿瘤基因解读等方面的研究与应用开发。

(文章来源:人民日报海外版)

《百万人群基因大数据研究表明 丝路影响了中国人遗传特征》 相关文章推荐二:华大基因谋“变”:推“百万人群基因组”计划 靠拢基因大数据研究

每经记者 方京玉 实习编辑 梁枭

10月10日华大基因(300676,SZ)团队发布一项关于中国人基因组学大数据研究成果华大基因方面称,这是由其主导的“百万人群基因大数据研究”项目首秀该项目由中国科学家主导,两年时间里对14余万中国人的无创產前基因检测数据进行了深入研究是揭秘中国人群基因遗传特征的科研成果。

《每日经济新闻》记者从现场了解到“百万人群基因大數据研究”基于华大基因团队对无创产前检测临床数据的收集及整理。一直以来华大基因以无创产前基因检测作为上市公司的拳头项目,但近期因“举报门”等事件上述项目也引发了系列争议。此次华大基因借发布基因大数据研究阶段性成果向外界传递信号:该成果是公司技术研究领域的一次“升级”——从基因测序服务升级为基因大数据研究

发布基因组学研究阶段性成果

华大基因方面介绍,“百万囚群基因大数据研究”项目发起于2016年团队在充分遵从相关伦理原则、知情权规范下,选取了14余万无创产前基因检测数据展开了群体水平嘚研究并开发了一系列用于此类数据的分析方法。相关信息显示华大基因的研究小组主要从中国人群体遗传学、复杂性状的全基因组關联分析、中国人病毒感染图谱等三个方面揭秘中国人群体中的生物大发现。

《每日经济新闻》记者注意到虽然上述研究样本来自于无創产前检测数据,但华大基因生命科学研究院院长徐讯表示该次阶段性研究成果或类似超低深度测序数据,可以有效应用于群体遗传学、疾病与表型等领域的高水平研究并将在遗传病诊断、肿瘤研究、药物研发等领域得到广泛的应用。目前研究结果已经以论文形式发表於国际学术期刊《细胞》中

目前,该阶段性研究成果包括:揭示了汉族与少数民族群体的遗传结构特点及中国各省与欧洲、南亚、东亚囚群的基因交流程度;发现了当代中国人的遗传特点同时受到丝绸之路及近代人口大规模迁徙等因素的多重影响;验证了48个与身高及13个与身体质量指数显著相关的基因位点发现了两个与怀孕年龄显著相关的基因位点;发现了中国人血浆的病毒组与欧洲人存在比较大的差异。

记者注意到虽然该研究项目于2016年发起,但是在此之前华大基因并未在上市公司公告中提及“百万人群基因大数据研究”项目在公开場合也较少提及。而之前常被提及的则是华大基因“炎黄计划”:宣布启动于2014年拟对抗呼吸系统癌症、妇瘤癌、消化系统癌症等五大高發类肿瘤,当时称该计划拟投资过亿

以广度数据靠拢“大数据研究”

10月10日,英国科学家在《自然》杂志发布大规模遗传数据涵盖五十萬个全基因组数据。据《科技日报》报道英国生物样本数据集涵盖了约50万个个体的全基因组遗传数据、临床测量以及健康记录,样本年齡为40~69岁之间英国人在2006年至2010年采集了样本基因型和脑部扫描。

徐讯透露目前华大基因团队采集的数据只涉及到千分之六到百分之一的數据,对个体来说测得不是很深与传统基于人类遗传的研究不一样。“但数据尺度更宽、更广是这次研究的亮点这次研究覆盖了大量嘚取样,同样可以给出非常精确的研究成果这些在精准医学上是可行的。”

对于近期陷入舆论危机的华大基因而言此次“百万人群基洇组”计划的适时推出或许能够帮助公司挽回一些公众形象。2018年以来华大基因可谓进入“多事知秋”,其市值已经从巅峰时期的1000亿元下滑至如今的200余亿元

《每日经济新闻》记者在现场了解到,一手将华大基因塑造成“基因界腾讯”的创始人汪建、CEO尹烨均没有在“百万人群基因组”计划研究成果发布会上现身虽然该研究成果对于公司意义斐然,但除有中科院院士背景的华大基因理事长杨焕明外其余高管并未在发布会现场讲话。媒体采访环节则由徐讯、百万人群基因大数据研究第一作者刘斯洋、论文共同通讯作者金鑫代表公司、项目团隊发言

也许,在明星公司的光环逐渐褪去后一个更加务实、学术化的形象正是现在的华大基因想要给外界呈现的。

《百万人群基因大數据研究表明 丝路影响了中国人遗传特征》 相关文章推荐三:GDP 基因区块链数据用于保险创新可产生240亿净利润

基因价值链 GDP (Gene Development Platform)将于18日开启通证全浗首发英国coinred币红网、新加坡 UFO以及 AT 交易所 3大交易所投资者可以购买和交易,同时可以参与项目方联合交易所进行的百万级的空投和活动奖勵

据悉,基因价值链是在区块链的基础上用基因组学和生物信息学、人工智能等实现基因组数据的巨大价值GDP通证基于每个人的基因数據挖矿,广泛应用于人类的基因检测、基因编辑、器官配型、肿瘤治疗、制药、健康管理和保险等领域该项目申请了全球第一个基因区塊链专利技术,将基因和区块链的创新结合起来让用户遗传数据安全受保护,并获取数据驱动的健康服务和挖矿收益

医药应用全流程礻意图,从疾病的人到健康的人(基因价值链提供图片源自Clin Transl Med)

Genoval基因价值链创始团队有关负责人苏海桥告诉记者,基因数据被证明既是核心的個人信息也是生物学基础研究、制药产业、医学研究的重要基础,能在治疗诸如癌症、糖尿病、各种遗传罕见病中发挥作用同时也能夠指导人们健康生活,比如知道酒精代谢、运动耐力咖啡因耐受能力就可以更好的规划生活、运动、工作。

为了促进基因数据的有效应鼡以及为数据拥有者提供价值,他们建立了基因区块链项目Genoval(genoval.org)并发行了名为GDP的通证,以区块链、人工智能分析、云储存、高性能计算为技术基础通过解决基因组数据的存、传、授、用、密而成为数据价值提供商。特别地Genoval的数据包括,以基因数据为特色医疗数据、医藥数据、健康数据、组学数据等为补充的个人全面生命数据PCLD(personal

2000年,中国、美国等六国科学家共同产生了第一份人类全面基因组数据花费了菦40亿美金。现在随着技术进步基因组学数据的大量出现,如中国公司华大基因曾经生产了世界上40%以上的数据美国NCBI也储存有很多数据。

甴于数据所有权、加密传输技术、商业模式、运营能力等尚未解决的问题大量数据无法被多方有效利用。科研发展将会需要更多的基因數据基因组数据也是精准医疗医药临床研究的根本动力,大型药企也需要基因组数据作为药物和疗法研发的基础科研、医学研究应用、产业应用是基因数据价值产生的主要场景。

基因+区块链专利技术门槛高

在谈到竞争优势时他表示,GDP基因价值币具有三高的特点:基洇科技利润高,市场成长性高产业门槛高。如某A股上市基因公司市盈率达到160倍,而腾讯的市盈率为30倍普通公司的市盈率在12倍,说明基因类公司具有极高的投资价值市场对其盈利的认可高于古典互联网的经典企业。

从技术上GDP申请了基因行业第一个基因+区块链的专利申请技术,是极少数在技术上能够申请发明专利的项目团队区块链专家正在开发基因专用的联盟链,另外专利技术的人工智能、生物信息学基因价值评估和传输系统是他们的核心竞争力。

因基因价值链门槛较高具有高速发展的产业基础,基因技术在新技术中极具代表性和创业门槛普通模式创新的创业者和团队没有可能做这方面创业。谈到他们创业团队时苏海桥表示,GDP团队目前有近20个团队中有毕業于南加州学、港城市学、南安普顿学、港中学的留学,也有有源于华为、魅族、华基因、惠普等公司IT和BT(Biotech)领域知名的技术、科研、财务、法务员团队成员主要分布在港和深圳,并在美国英国,欧洲等地建团队和社群得益于创始团队的行业积累,目前他们已经和国内测序龙头企业和其他国内、国际著名公司开展合作

本项目社区建设也到了高速发展阶段, 从产品和社区运营上他们着力与推进对用户具囿具有实际效果的基因产品,已经建立了数万人的付费用户社群在目前阶段的数字经济社区大部分是空投产生的社群的情况下GDP的付费用戶社区绝对是一股稀有的清流。

基因数据用于保险创新可产生240亿净利润

GDP通证基于每个人的基因数据挖矿广泛应用于人类的基因检测、基洇编辑、器官配型、肿瘤治疗、制药、健康管理和保险等领域。他们申请了全球第一个基因区块链专利技术将基因和区块链的创新结合起来,让用户遗传数据安全受保护并获取数据驱动的健康服务和挖矿收益。

他们透过区块链技术和通证(token)经济着重以创新价值链构建用戶和科学家、产业、平台的良性互动关系;以独有专利技术为基础,以制定数据标准和成立产业和技术联盟为核心竞争力;以使命和愿景指导丅的生态基金促进人类对基因数据的理解和应用Genoval的通证GDP的发行主要是锚定基因数据的测序量,以及生态中的开发服务量因此具有稳定嘚增值空间。目前他们已经开始建立基础设施和签定行业合作协议,并组建了全球格局和全面眼光的团队他们将依靠中国的巨大产业優势,努力践行他们的价值观实现基因科技造福人类健康的愿景。

他们的技术还将为社会带来意义巨大的数据经济通过基因检测已经荿功帮助多位社区的女性检测出宫颈癌病毒,提早预防了宫颈癌其中有些是通过简单的宫颈癌疫苗没有办法预防的。

在中期发展规划中Genoval 生态基于他们平台成立了PREGUARD,将先进的基因区块链技术和数据分析能力用于保险行业经过测算,预计会增加30%的新增健康保险用户同时會减少因为癌症死亡人数8%,也就是24万人由于精准预防将阻止大量癌症患者上升为不可治愈的赔付对象,基于基因科技的创新保险实现后仅此一项将产生240亿的净利润。

他们的目标在于利用基因组学、区块链和生物信息学、人工智能等技术以实现基因组数据的巨大价值释放基因组数据的价值,让人们享受精准的健康生活

《百万人群基因大数据研究表明 丝路影响了中国人遗传特征》 相关文章推荐四:区块鏈如何保护个人数据?迅雷链相关应用已经落地

  日前,在2018天津夏季达沃斯上迅雷集团CEO、网心科技CEO陈磊表示,在数据都集中在少数互联網公司手中的当下互联网公司凭借用户数据获得垄断地位及大量利润,而作为数据所有者的用户却没有得到应有的回报同时陈磊提出叻一个解决方案:“今天有条件用区块链去管理用户的数据,如果法规能跟上的话可以还数于民,把数据还给每一个拥有者要求企业囿偿使用数据。”

  在刚刚过去的7月作为首个落地迅雷链的基因+区块链项目,HGBC(Human Genome BlockChain)人类基因价值生态链完成了在迅雷链上的全链条业务蔀署:数据存储、上链确权、Token发放。在该平台上个人用户的基因数据、运动、体检报告、电子病历等医疗健康数据被上链确权,用户参與科研项目可获取积分奖励积分可用来兑换基因应用服务,**降低了科研项目获取数据的成本通过在迅雷链上的部署,用户的健康数据從产生、使用、利用就形成了完整的闭环能更好地为个体服务,同时还通过区块链的激励机制解决了用户与科研企业之间的“数据矛盾”。

  那么作为底层技术的迅雷链发挥了哪些作用呢?要知道医疗数据是非常隐私的个人资源,包括病人身份、过往病史以及医療情况等这些都是患者的个人隐私数据,同时也是关系国民健康的大数据那么,找到一条稳定、安全的区块链主链来储存数据是首偠解决的问题。而迅雷发布的国产、高性能迅雷链与迅雷星域云计算设施的结合可以满足大数据场景对于主链的要求。

  具体而言迅雷链是通过国家级区块链系统标准测试的区块链主链,除了拥有百万TPS性能外迅雷链还可以秒级确认请求来保证数据的可靠性,且接入簡单兼容能力强大,可弹性扩展以随时轻松应对突发流量HGBC在公布双方合作时透露,HGBC选择区块链主链的要求是国产自主、性能强大、配套资源完善而迅雷发布的国产、高性能迅雷链与迅雷星域云计算设施的结合,恰好满足了HGBC对于主链的要求

  在解决了基本的数据存儲和管理问题后,还需要解决数据共享的激励问题《健康中国2030规划纲要》中,明确将基因检测确定为能够实现人类全生命周期健康管理嘚重要工具随着基因测序价格下降,普及程度的加深越来越多的人拥有了自己的基因数据。但问题也随之而来:第一本是基因数据來源的用户,却无法掌控自己的数据国内许多检测公司,在用户须知中直接写上:“基因数据所产生的科研和商务价值,归基因检测公司所有与用户无关。”第二基因数据日益增多,科研机构获取基因数据的成本并未下降第三,基因应用过少基因数据无法深入鼡户的多个使用场景中。

  HGBC与迅雷链的结合即可以解决以上问题首先,用户的散落在不同平台的基因、健身、睡眠、生理周期等健康數据会被统筹上链之后进行确权。其次确权后的数据将会有两个方向的对接。一是参与到项目方(科研机构、药厂)的科研项目中獲取健康积分收益。二是使用健康积分享受基于健康数据的服务,比如说健康管理、基因应用等由此一来,科研项目方获取数据的成夲降低科学研究的效率提升,这意味着更多的新药、对人类探索的科研成果会加速出现基因应用、健康管理的服务因为能快速得到用戶反馈,也能高速旋转起来那么健康数据从产生、使用、利用就形成了完整的闭环,能更好地为个体服务精准医疗、精准健康管理也僦指日可待。这正是陈磊所说的“还数于民把数据还给每一个拥有者,企业有偿使用数据”来带的联动效应

  实际上,除了基因数據区块链技术在医疗数据方面还有诸多可实现的应用场景,可以实现多方在区块链平台上对数据进行共享未来,这些场景或将陆续在迅雷链上实现落地促进各行各业的发展。


《百万人群基因大数据研究表明 丝路影响了中国人遗传特征》 相关文章推荐五:HGBC在迅雷链完成铨链条部署,基因+区块链将迎快速发展

2018年7月迅雷链文件系统(TCFS)发布,支持企业自己建立区块链激励机制在此基础上,基因区块链HGBC于近日发荇了“健康积分”并正式上线链克口袋。HGBC成为了链克口袋支持的链克外第一个区块链激励机制这意味着,迅雷链在支持第三方应用方媔迈出了关键的一步;同时,作为首个落地迅雷链的基因+区块链项目HGBC完成了在区块链上的全链条业务部署:数据存储、上链确权、Token发放。

迅雷链(ThunderChain)是由迅雷旗下网心科技打造的超级区块链平台具有百万级别的TPS处理能力,单链出块速度达到秒级支持solidity语言开发的智能匼约,兼容以太坊虚拟机EVM一次开发支持多个区块链平台。迅雷链的出现极大地促进了中国区块链事业的发展,让开发者能够专注于区塊链应用创新和功能开发

BlockChain)人类基因价值生态链,是一个以用户为核心科研方、服务方共同参与建设的生态平台。在该平台上个人鼡户的基因数据、运动、体检报告、电子病历等医疗健康数据被上链确权,用户参与科研项目可获取积分奖励积分可用来兑换基因应用垺务。目前在HGBC上所有的服务,都由APP达尔文星球来承载该APP是一款集生命数据上链、数据流转、资产管理、基因应用商城、科学研究为一體的健康生命APP。

HGBC与迅雷链的结合是医疗健康领域与区块链技术对接的探索。医疗健康数据明确属于国家战略资源人类遗传资源及基因數据在科技部的相关政策中属于不得出口到海外的国家资源,HGBC选择区块链主链的要求是国产自主、性能强大、配套资源完善而迅雷发布嘚国产、高性能迅雷链与迅雷星域云计算设施的结合,恰好满足了HGBC对于主链的要求

《健康中国2030规划纲要》中,明确将基因检测确定为能夠实现人类全生命周期健康管理的重要工具随着基因测序价格下降,普及程度的加深越来越多的人拥有了自己的基因数据。但问题也隨之而来:第一本是基因数据来源的用户,却无法掌控自己的数据国内许多检测公司,在用户须知中直接写上:“基因数据所产生嘚科研和商务价值,归基因检测公司所有与用户无关。”第二基因数据日益增多,科研机构获取基因数据的成本并未下降第三,基洇应用过少基因数据无法深入用户的多个使用场景中。

HGBC的初衷就是为了解决以上问题首先,用户的散落在不同平台的基因、健身、睡眠、生理周期等健康数据会被统筹上链之后进行确权。其次确权后的数据将会有两个方向的对接。一是参与到项目方(科研机构、药廠)的科研项目中获取健康积分收益。二是使用健康积分享受基于健康数据的服务,比如说健康管理、基因应用等由此一来,科研項目方获取数据的成本降低科学研究的效率提升,这意味着更多的新药、对人类探索的科研成果会加速出现基因应用、健康管理的服務因为能快速得到用户反馈,也能高速旋转起来那么健康数据从产生、使用、利用就形成了完整的闭环,能更好地为个体服务精准医療、精准健康管理也就指日可待。

HGBC平台推动了人类对生命的探索,能帮助人们认识到基因检测的价值在某种意义上助力了健康中国计劃。此次与迅雷链的结合是一次跨领域的尝试,亦是一次创新相信在它之后,国人全生命周期健康管理之路将越来越容易

《百万人群基因大数据研究表明 丝路影响了中国人遗传特征》 相关文章推荐六:重金掷研发 华大基因剑指全球基因测序万亿市场

中报出炉之后,显洏易见华大基因的业绩不错。

8月27日“基因测序第一股”华大基因(300676.SZ)发布2018年半年度报告,报告显示报告期内,华大基因实现营业收叺11.41亿元同比增长28.44%;归属于上市公司股东的净利润2.08亿元,同比增长8.73%;归属于上市公司股东的扣除非经常性损益的净利润为1.68亿元

华大基因業绩稳步增长的同时,华大基因也逐步解决问题走出此前的低谷。

2018年8月1日华大基因控股股东华大集团执行副总裁朱岩梅、华大集团助悝总裁韦炜、华大基因股份有限公司生育健康事业部总经理彭智宇、华大基因股份有限公司董事会秘书徐茜等人代表向媒体详细介绍了华夶的发展历史和多项核心技术,并就外界关注的“举报门”、“癌变门”等多个热点话题与媒体进行了面对面深入交流

作为一家上市公司,华大基因曾承载了造福人类的使命

它的诞生也是与众不同――1999年9月9日,随着"国际人类基因组计划 1% 项目"的正式启动北京华大基因研究中心在北京正式成立,这是华大基因的前身

此后也成为华大基因的slogan(使命口号)――“基因科技造福人类”。

随后先后完成了国际囚类基因组计划“中国部分”(1%,承担其中绝大部分工作)、国际人类单体型图计划(10%)、第一个亚洲人基因组图谱(“炎黄一号”)、沝稻基因组计划等多项具有国际先进水平的基因组研究工作彰显了世界领先的测序能力和生物信息分析能力,也奠定了中国在基因组学研究领域中的国际领先地位同时,华大基因在全球范围内与众多学术机构和研发企业建立了广泛的合作关系致力于在人类健康服务事業和科技应用领域的发展。

只是这样一个特殊公司一路走来并不容易。

事实上作为一家基因检测公司,华大基因运营及管理风险颇高上述问题的爆发只是其中之一,比如作为新兴业务的这类公司面前的风险主要有:

基因测序及诊断等服务产品在中国属于新兴业务,洇此在中国的监管层面如何监管同样处于探索阶段因此,监管趋严或者产品服务如果不能持续满足监管部门的要求华大基因将会面临系列风险。

2、因技术和工艺导致的产品质量事故风险

此次爆发的“癌变门”显然属于此类风险。

客观而言在基因检测领域,由于高通量测序技术和生物信息学分析手段存在一定局限性难以达到100%的准确度,因此也就存在公司因生产工艺技术限制从而导致研究或者服务中提供错误结果最终给诊断或者研究服务的使用人带来验证后果,华大基因面临赔偿责任的风险

3、在医学研发当中,无论是创新药还是其他产品研发都存在较高的失败率

4、伴随着竞争对手的增多,以及行业的技术更迭行业竞争越发激烈。

“随着第二代测序技术的快速發展市场环境逐渐成熟,国家政策逐步放开基因测序行业,特别是国内成熟产品和服务的竞争变得愈发激烈”在华大基因招股书中,它将市场竞争加剧放在了21项风险因素的首位

比如,在生育健康领域华大基因的主要竞争对手为贝瑞和康――该公司由华大健康出来嘚高扬、董事蔡大庆、任媛媛创立于2010年5月,2017年借壳*ST天仪登陆A股市场

2011年初,原华大科技总裁李瑞强也另立门户创立了“诺禾致源”在科研服务上给华大基因带来了一定压力。

2018年华大基因爆发了“举报门”、“癌变门”,市场震惊

在此背景之下,华大基因该如何走出泥潭这取决于华大基因的选择。

对于风波华大集团执行副总裁朱岩梅表示,传言都不属实“尽管被误解,但我们始终坚守华大的价值觀:诚信是底线造福是目的。华大目前仍然处在快速成长期希望社会各界对我们更多包容和信心。”

华大基因的基因及价值观不容忽視没有人否认,他们是一家有梦想的技术公司

1999年,华大基因诞生然而,波折不断比如,曾经因为购回仪器及试剂的问题创始人汪建不得不将公司旗下全部资产抵押给一家国有资本,然而抵押金额却被一压再压从4000万元到2000万元再到1000万元,最后拿到的却只有500万元投资款以及500万元私人财产借款

对此,汪建上门交涉得到的回复却是冰冷冷的“用钱说话。”

“这句话是我永远的心头之痛才有后面所有嘚征程”,汪建曾回忆道

这是一个倔强的创业者,在造富人类的梦想和理想面前他坚持了下来,即便曾被董事会宣布直接免职

如果峩们看懂了他们经历的波折,便会了解这是一家有梦想的公司否则,创始人不会坚持这么久甚至在于投资机构交流的过程当中,拍案洏起

媒体公开资料显示,2012年7月汪建曾与来自深创投、红杉资本等投资机构的数十位代表“唇枪舌战”,甚至直接拍了桌子后来,在迋石的协调下华大基因才第一次拿到风险投资,以华大科技42%股权换得光大控股4亿元、云锋基金2.3亿元、红杉资本2亿元等在内的共计13.98亿元投資

后来,华大基因的发展果然也不负众望

截至2018年6月末,华大基因公布了百万中国人基因组计划的第一期科研成果同时正式上线了第┅期中国人群的基因频率数据库(Chinese Millionome database,简称C**B)该数据库只体现抽象后的群体基因频率信息,对于个体信息完全脱敏在推动科学研究的基礎上充分的保护了个人隐私。第一期C**B收录了全国31个省市自治区共计超过14万例样本覆盖了包括汉族以及36个少数民族在内的900多万个单碱基多態性位点,C**B中还同时公布了身高、BMI、年龄等超大规模的全基因组关联分析(GWAS)结果研究者可以根据这些成果开展相关表型的大规模元分析。通过参考正常中国人群数据库中的基因频率信息科研工作者们能够排除常见变异,锁定真正致病的变异避免良性变异带来不必要嘚研究损失。它对我国群体遗传学、罕见病、复杂疾病、肿瘤以及全基因关联分析等领域的科学研究和精准治疗预防防控有着重要意义助力中国疾病研究造福广大民众。自发布以来C**B已为国内超过60家科研机构提供科研服务。未来将持续升级为科研与临床工作者提供更高質量的数据服务。

作为一家基因检测服务公司华大基因研发的基因依旧在华大基因身体中流淌,华大基因正在寻找当年的自己。

2018年華大基因半年报业绩表现亮眼――四大业务板块中,生育健康类服务营业收入达6.22亿元同比增长21.69%;毛利率69.89%,虽受民生投入增加影响较上姩同期减少6.05%,但生育健康毛利率仍高于同业复杂疾病类服务营业收入达3.02亿元,同比增长81.19%;基础科研类服务营业收入达1.76亿元同比增长3.60%;藥物研发类服务营业收入达3918.91万元,同比增长7.79%

对于研发的重视,也让他们重新找回当初的梦想――数据显示2018年上半年华大基因研发投入過亿,同比增加41.40%且研发占营业收入比重为8.8%,高于同业平均水平截至2018年6月末,公司及其全资、控股子公司拥有的已获授权专利共计320项其中发明专利298项,实用新型专利14项外观设计专利8项;自有注册商标374项,核心技术专利范围涵盖实验仪器、样品处理、测序文库构建、质量控制、生物信息分析等各个关键技术环节生物信息分析等方面自主软件取得了536项软件著作权。

华大基因重点研发项目进展情况:

未来华大基因还将继续朝着梦想而迈进。

华大基因的未来:数据和民生

“福兮祸之所依祸兮福之所倚。”

最坏的事情发生了在倔强的汪建的坚持下,华大基因有了改变的勇气

显然,华大基因的诸多问题暴露了其管理问题比如与合作伙伴合作方式及关系的问题,质量管控的问题等等

但是在改变的勇气以及梦想之下,华大基因开始了改变之旅:

在内部华大基因还采取了技术管理的思路,寄希望于华大基因自主研发的基因云计算平台BGI Online上面就贯穿基因数据流“存、算、传、管”各个维度进行全面管理,降低管理成本及管理过程中出现的問题

《百万人群基因大数据研究表明 丝路影响了中国人遗传特征》 相关文章推荐七:达沃斯发布中国AI 50强榜单 影谱科技入选

  读懂报道 2018姩9月19日,世界经济论坛新领军者年会(天津夏季达沃斯论坛)在中国天津举行作为全球顶级峰会,本届论坛共有来自100多个国家的2000名政、商、學、媒体界代表参会在论坛现场,、科技媒体与大数据公司中金投X发布了中国AI 50榜单其中,中国计算机视觉技术商业化落地领军企业、Φ国最大的智能影像生产企业——影谱科技(836488.OC)上榜

  中国AI 50强企业仅2位女性创始人

  据悉,本次榜单主要覆盖1100多家与AI技术有关的中国企業收集数据主要基于两个方法:先由企业自己提供,同时由研究团队和已有的数据库进行核实;然后再从技术研发能力、产品成熟度、投资者支持、运营基本面和未来发展潜力这五项要素来分别打分最终得出综合分数。整个过程历经数月包含深入调研,实地走访重審大量现有研究数据等细项复杂工作。

  值得一提的是中国AI 50企业的成熟度远高于行业平均水平。在这50家企业中约有80%已完成B轮或后续輪,而整个中国人工智能行业中81%的企业仅完成首轮融资其中27家企业收到了来自**相关基金和/或、和腾讯的投资,更有14家估值超过的初创公司这14家企业的总估值高达402亿美元。中金投X创始人NinaXiang在发布会上表示让人惊讶的是,人工智能的50强企业中只有2家拥有女性创始人而影谱科技CEO姬晓晨女士正是其中之一。

  AI+影像助推影谱科技登榜“中国A I50”

  据了解此次入围AI50榜单的影谱科技,是国内最大的智能影像生产企业凭借在像素及子像素计算、三维重建和3D视觉、视频内容的细粒度分析及结构化等方面的技术优势,为内容产制、平台渠道等产业链各环节提供技术解决方案和商业化服务影谱科技在科技赋能深度和行业覆盖广度上持续布局,是国内罕见的可以兼容线上线下长视频、視频规模协议量产的智能影像生产平台构建了一个包揽众多垂直细分领域的“AI+大文娱”产业版图。

  影谱科技的技术领先产品集成忣商业化成熟,已占据国内智能影像生产领域头部位置“我们研发了一系列智能影像专利技术,可以实现视频影像的自动处理、子像素級分析、智能叠加、无痕展示”影谱科技相关负责人表示。艾瑞在《2018中国人工智能行业》中也指出影谱科技将人工智能技术与视觉技術创新地结合起来,形成了具有革命意义和商业价值的强大技术壁垒资料显示,2017年影谱科技完成4.46亿秒工程处理积累,累计为数百家客戶、近千品牌及15万部影像内容提供技术服务市场占有率超70%,掌握视频结构化垂直领域的核心数据深度覆盖超6亿用户。这也正是影谱科技在拥有专利数量、风投融资金额、公司估值水平、营收现状和未来等12个指标上加权评估系统得分优于同行而跻身AI50榜单的原因

  “技術+场景”拓展智能影像生产市场

  在智能影像生产所需全程技术链方面,影谱科技具备先发优势在像素轨迹计算、更复杂的退化问题、遮挡和运动关系、光照和阴影等技术难点等几项智能影像生产的核心技术上,影谱科技奠定坚实的基础与此同时,通过端到端的训练产生两个独立的模型,分别进行基于单视图的深度估计、以及基于多视图的摄像机位估计加强不断的数据获取将会持续提升视频分析處理的能力。影谱科技技术平台在视频平台方上线后即构建了事实上的技术准入壁垒让平台方很难在既定技术条件下选择其他供应商。

  任何领域的信息都有影像的表现形式据公司评估,2021年单月上传至全球网络的视频影像总时长将超过500万年每秒将诞生1百万分钟的网絡视频影像内容,影像与 AI 的深度融合正在激发亚洲市场诞生一个新巨头的机会中国领先的视觉技术企业、最大的智能影像生产技术公司——影谱科技逐步成长为推动智能影像技术发展的亚洲新力量。

《百万人群基因大数据研究表明 丝路影响了中国人遗传特征》 相关文章推薦八:数据分析助力商业银行精细化管理——试论银行探索型大数据分析平台的构建

本文共3487字预计阅读时间1分23秒

一、构建数据分析平台嘚原因

面对不断渗透进入商业银行的支付、产品等领域,传统的商业银行不能再止步不前而要在数据的使用上更加精细化,通过数据深叺、透彻的分析客户价值与潜力实现数据驱动,以数据为抓手进行精准营销,强化风险管理切实提升商业银行经营管理水平。

报表戓传统数据分析平台进行精细化管理的不足

报表由于格式固定灵活性不高如果需要调整,需要重新完成需求确定、立项、开发、测试仩线才能最终实现,实施周期长并且数据处理时效性低,已经不适应大数据时代的数据分析、信息提炼的需要

目前数据分析类的平台茬银行业主要应用于客户关系管理、风险管理、等,有一定的应用范围但主要基于企业内部信息,而外部网络信息挖掘使用较少另外傳统数据处理技术使用较多,大数据处理技术使用较少

商业银行需要与时俱进,借助大数据的东风构建敏捷型数据分析平台,为业务發展提供新的量化数据分析方法摆脱业务人员加工报表进行数据分析的传统模式。

三、数据分析平台建设的规划

数据分析平台的建设要夲着面向业务主题、面向业务应用、面向业务人员的原则来推进

面向业务主题指的是数据分析平台的建设要规划明确的数据范围和边界,而不是贪大求全想一步到位构建一个涵盖所有业务、所有系统数据及记录的数据分析平台,这种方式建设周期长投入成本高,无法適应业务的快速发展变化极易半途而废或者达不到预期效果。

面向应用则是说建设数据平台要以满足业务层面的应用为前提而不是从朂底层数据入手去进行数据加载,这样的话很可能纳入的数据不能充分满足业务需要或者存在大量对业务数据分析没有价值的冗余信息。传统的数据分析平台时常需要IT部门加工多维数据集面向应用就要求数据分析平台对不断变化的业务数据需求反应更及时。同时数据汾析平台要支持同Excel等办公软件的交互,而不是只支持自有的文件格式无法进行导入导出到其他文件格式的操作。

面向业务人员指的是茬界面和学习、使用的方式上要尽可能让业务人员感觉到便利、熟悉,而不是需要长期的学习才能掌握平台的使用让没有技术背景的业務人员也可以轻松掌握。

2、选择大数据作为底层数据处理技术的缘由

数据分析平台的建设要依托大数据技术,而不能再使用传统的数据處理模式这是为什么呢?大数据的特质有以下几点:大量性、多样性、价值性、高速性以下就来具体阐述这几个特质。

(1)大量性這一点是毋庸置疑的,以往的传统数据分析通过常规的数据库作为数据源,在处理效率上有诸多掣肘随着客户数量的增多,数据会呈幾何级增长如果超过百万级的数据量,传统的数据库就难以胜任需要采用大数据的系统架构才能胜任数据处理任务。

(2)多样性数據量的增多,不仅仅是数据处理量的增加还意味着有更多的信息可用来进行分析。传统的数据分析只是依托于数据库中存储的结构化数據这就使得分析的内容非常有局限性。大数据则不同除了结构化数据,还有大量文本、图片、音频、视频、地理位置等半结构、非结構化数据而大数据除了银行内部的数据,也会纳入许多外部的信息用于进行关联分析等信息提炼工作。

(3)价值性数据海量且种类哆,那相应的信息筛选工作量就会变得异常复杂将庞大的数据通过处理后精选出最有用的信息。

(4)高速性大数据大量性、多样性、價值性的三个特质,使得数据处理机制的效率一定要高毕竟在我们目前所处的互联网时代,周围事物瞬息万变如果不能及时把握机会,很可能就会错失良机而大数据的高速性正是对应了这一要求。必须要在数据存在的短时间内筛选提炼出对应的有效信息不然就会将機会拱手让人。

综上所述建设数据分析平台,以大数据为底层技术架构是毋庸置疑的不二之选

数据分析平台还要注意*的分层使用的安铨原则,数据如果没有管控就会出现被滥用、被泄密的风险。

新近发布的《银行业机构数据治理指引(征求意见稿)》中提到“银行業金融机构应当建立数据安全策略与标准,依法采集、应用数据依法保护客户隐私,划分数据安全等级明确访问权限,监控访问行为完善数据安全技术,定期审计数据安全”这就为商业银行合理使用数据来指导业务发展明确了边界和要求。

五、数据分析的结果展现

傳统的数据分析结果都是通过报表来进行展现的存在着展现结果不直观,展现形式不美观展现内容不丰富等诸多弊端。在大数据时代可以通过引入数据可视化等方式来进行数据分析结果的展现。

数据可视化可以说是最为卓越的数据价值体现形式,超越了堆叠文字和數据或者多张报表的表达形式。对数据结果进行图形化展现相较于传统的两维图表,数据可视化更加清晰明确的提炼出数据价值能夠更加灵活地实现数据展现。超越了Excel的表现形式直观的表达出了海量数据所体现的业务发展动态与数据之间的关联关系,为决策层、管悝层提供了数据支持通过雷达图、汽车仪表盘、地图等形式展现数据,通过色彩、颜色深浅、动态效果等来清晰地表达数据分析的结果重点突出并且会给人留下深刻印象。

数据可视化还有一个不可忽略的优势就是非常适合进行探索式数据分析探索式数据分析即Exploratory Data Analysis,是一種对现有数据进行少量先验假定的条件下通过绘制图表、数据拟合、计算特征量等方式来探索数据规律的一种分析方法。十分适合在没囿找到特定分析目标或者研宄方向时进行数据探究探索式数据分析具有三个特征,一是从数据本身出发而不是从某种假定或定式模型絀发;二是分析方法灵活多样,不拘泥于传统统计方法可以跳出理论上对于假设检验、置信区间等严格的处理工具的局限;三是分析工具简单,强调数据与图像的结合强调数值计算与直观感知相结合的分析方式。

六、数据分析平台的使用推广

数据分析平台的广泛使用离鈈开对专职数据分析人员的培养传统模式下,数据分析的工作往往由部门内负责报送数据的业务人员完成没有专职的数据分析人员,這就造成一人多岗没有足够的精力去完成数据进一步的分析和探索,数据的价值得不到充分发挥数据分析停留在表象上。数据分析人員一定要具备数据思维数据思维是一种将事物抽象为数据的思维模式,而不是基于过往个人经验形成的思维定式来进行数据分析

数据汾析平台的大规模使用,不是通过行内要求去推广而是让平台真正提供对业务发展有帮助的数据,从而调动业务人员使用分析平台的意願自发地使用数据去提升业务效率。

数据分析平台的应用一定要找到突破口,以点带面可以燎原。前期的一些工作可以由技术部門去主动协助,比如在人力资源部的应用选择人力资源方向的应用作为数据分析平台的原因如下:首先,作为职能部门数据的应用较の对客业务部门要少,也缺乏数据分析的应用环境以此为切入点去展现数据分析平台的作用和价值是最好的方式。其次人力资源的数據是企业信息化的基础,数据质量相对较好不需要进行复杂的数据清洗等工作就可以进行分析,前期工作量相对较少

在数据应用较少嘚职能领域打开局面,再借由口碑普及至对客部门通过数据分析的结果推动业务发展,让业务部门意识到数据分析的价值所在这样,酒香不怕巷子深平台的使用推广自然可以事半功倍。

七、数据分析平台的前景

再好的数据分析平台也只是工具技术和业务是不可分割嘚整体,脱离了业务应用场景再好的技术平台也会被束之高阁;而离开了技术,业务则会停滞不前逐步在同业的不断前行中败下阵来。只有充分融合业务与技术才能真正的挖掘出数据价值,更好的助推业务发展在大数据技术突飞猛进的今天,数据量呈几何级增长數据的价值将会更为重要,探索式数据分析平台将作为最有前景的系统应用必将在不久的将来,成为各家银行精细化管理必备的重要手段也必将掀起一轮数据分析平台的建设高潮。

[2] 黄玺磊大数据的最后一公里——数据可视化技术[J],中国金融电脑2017年02月第02期:37-43

[3] 王宇宁,夶数据环境下数据分析与可视化核心技术研究[D]北京:北京邮电大学,2015

本文系未央网作者隋 心发表属作者个人观点,不代表网站观点未经许可严禁转载,违者必究!

《百万人群基因大数据研究表明 丝路影响了中国人遗传特征》 相关文章推荐九:IBM研究表明大型数据泄露事件可以造成最高3.损失

根据 IBM Security 和 Ponemon 的一项研究表明一次数据泄露事件的平均损失为 386 ,但「大型违规」的损失(100 万到 5000 万份记录规模的损失)可能從 4000 万美元到

根据 IBM Security 和 Ponemon 对近 500 家经历过数据泄露的公司进行了采访他们收集了与数据泄露有关的数百个成本因素的信息,包括技术调查和恢复、通知、法律和监管要求、业务损失成本和声誉损失

总体而言,研究发现数据泄露中的隐性成本——比如业务损失、声誉的负面影响鉯及员工在恢复过程中花费的时间——难以统计,且成本高昂例如,该研究发现「大型违规」(超过 100 万份记录丢失) 的成本中,有三分之┅来自于业务的损失

2018 年由于全球数据泄露事件的平均成本为 386 万美元,比 2017 年的报告高出 6.4%这项研究首次计算了与「大型违规」相关的成本。「突破 100 万份记录的损失为 4000 万美元而突破 5000 万份记录则可能造成 3.5 亿美元的损失。」

IBM X-Force 事件响应和情报服务全球负责人Wendi Whitmore 在一份声明中说:「虽然公众高度关注的数据泄露事件往往会造成数百万人的损失但这些数据的波动性很大,而且往往只关注一些容易量化的特定成本」「事實上,有许多隐藏的费用是必须考虑的比如声誉损失、客户损失和运营成本。知道成本在哪里以及如何降低成本,可以帮助企业更有筞略地投资资源并降低所面临的巨大财务风险。

在过去 5 年里大型泄露事件 (超过 100 万份) 的数量从 2013 年的 900 起增加到 2017 年的 1600 起。根据对过去两年发苼重大数据泄露事件的 11 家公司的分析今年的报告使用统计模型来预测违规行为的成本,从 100 万到 5000 万不等绝大多数的攻击 (11 次中有 10 次) 来自恶意攻击和刑事攻击 (不是系统故障或人为错误)。

发现含大型入侵的平均时间是 365 天——几乎比规模较小的入侵时间 (266 天) 长 100 天

对于大型数据泄露荇为,最大的损失是与业务损失相关的损失据估计,5000 万次违规行为的损失约为 1.18 亿美元几乎是此类事件总成本的三分之一。IBM 分析了几起引人注目的大型违规事件的公开报告成本发现报告的数据往往低于研究中发现的平均成本。这可能是由于公开报告的成本通常限于直接荿本如从违约中恢复的技术和服务、法律和监管费用,以及对客户的赔偿

在过去的 13 年里,Ponemon Institute 研究了与数据泄露相关的成本发现在研究過程中损失一直在稳步上升。

医疗保健机构的数据泄露造成的损失连续 8 年排名最高——每份丢失或被盗数据要损失 408 美元——几乎是跨行业岼均水平 (148 美元) 的 3 倍

Ponemon Institute 董事长兼创始人 Larry Ponemon 在一份声明中表示:「我们的研究目标是展示良好的数据保护实践的价值,以及在解决数据泄露问题时公司支付的金额会产生实质性影响的因素。」「尽管数据泄露的成本在研究的历史中一直在稳步上升但我们看到了通过使用更新技术節省成本的积极迹象。表明通过使用新技术以及对事故响应进行适当规划可以大幅降低这些成本。」

家是否买私家车展开了讨论一些同学赞成买车, 而另外一些同学却持相反的观点, 不赞成买车。请你用英语写一篇短文客观介绍今天班里讨论的情况及个人看法。 写作要點如下: 注意: 1.字数120个左右, 开头和结尾已给出 不计入词数。 2.. 灵活运用本单元所学的 短语、表达和 it 用法 3.适当增加连接词, 使文章连贯. 赞成方 反对方 个人观点 fast , convenient

我要回帖

更多关于 自然选择 的文章

 

随机推荐