遗传学用到的科研设备的计算讲到什么程度

大学遗传学试卷―计算题_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
大学遗传学试卷―计算题
阅读已结束,下载文档到电脑
想免费下载更多文档?
定制HR最喜欢的简历
下载文档到电脑,方便使用
还剩15页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢答案:属于两个连锁群:F?A?E?D和C?G?B
C?G间的RF=20%
G?B间的RF=5%
C?B间的RF=25%
130、详细叙述Mc clintock以玉米为材料所进行的一项经典实验,确凿地证明了基因重组与同源染色体局部交换的关系。 答案:要求说明: ①所利用的材料具有哪些重要的遗传学及细胞学上的标记(有色淀粉与无色蜡质,异染色质结节,以及易位片段,均在第9染色体上)。
②写出杂交图式(基因型,表型及染色体结构示意图)。
③对后代染色体组成及性状关系的分析。
④实验结果分析后的结论:等位基因间的遗传交换是由于染色体片段的物质交换造成的。
131、假设在普通果蝇中有三个基因在某常染色体上的排列顺序为ABR,且A,B间的图距是30cM,B.R间是20cM,如果在无干涉的情况下个体预期产生的配子类型和比例是多少? 答案:①先求理论双交换值=0.2?0.3=0.06
②AbR和aBr配子各为0.06/2=0.03
③Abr和aBR配子各为(0.3?0.06)/2=0.12
④ABr和abR各为(0.2?0.06)/2=0.07
⑤ABR和abr各为[1?2(0.03+0.12+0.07)]/23=0.28
132、在果蝇中,b(黑体)vg(残翅)在第Ⅱ染色体上连锁,朱砂眼(cn 基因)与残翅连锁,对cn+bvg+/cnb+vg?cnbvg/cnbvg进行测交,结果如下: 子代表型(即配子基因型)
77 ①确定cn,b,vg三个基因在第Ⅱ染色体上的排列顺序。 ②画出染色体图。 ③用染色体线条图解说明(1)?(8)种配子基因型的由来。 答案:① b?vgRF=(92+70+86+77)/.25% 16.25cM
cn?vgRF=(6+9+86+77)/.9%
试卷答案 第 41 页 (共 97 页) 8.9cM
cn?bRF=(92+70+6+9)/.85% 8.85cM
16.25%+2?(6+9)/.25%+1.5%=17.75%
133、PKU是人类一种常染色体隐性遗传病,可根据致病基因与RFLP的连锁关系对胎儿进行诊断。请对下列家系的A个体作出诊断,并说明原理。(23,19为MSPI的酶切片段)
答案:A可能是有病个体23/23, ∵A的兄弟有病,说明他们的父母均各带有致病的基因,与23kb的DNA片段连锁。其中,父亲的二条23kb中一条有病,可记为23*/23,母亲23kb必有病。若二条23*结合,有1/4机会患病。
A也可能是23*/23,杂合正常个体,占1/4
另1/2分别为23*/19,23/19,表型均正常。
134、在下列家系中,发现了一种罕见的指甲?膝盖骨(nail-patella)综合征(黑色表示),家系中每个成员的ABO血型写在其下方:
试卷答案 第 42 页 (共 97 页) ①若这个家系中的祖父(I?1)不是nail-patella综合征基因的携带者,你认为该疾病是显性遗传还是隐性遗传?是伴性还是非伴性遗传? ②ABO血型基因与nail-patella综合征基因间是否连锁? ③如果你认为有连锁,画出个体I?1,I?2的两条同源染色体上的连锁基因图式。 ④根据你提出的连锁图式,指出什么样的子女是交换的产物? ⑤这两个基因间的重组率是多少? ⑥在这个家系中,男性个体是否可以发生交换? 答案:①属于常染色体显性遗传
⑤4/16=25%
⑥男人中Ⅱ?3,可以产生交换,其产物是Ⅲ-3
135、考虑下述杂交Hfr a?b?c?d?e?strs?F?a?b?c?d?e?strr时,不同时间取出培养液进行中断杂交,并用不同选择标记的平板选出重组子,其数据如下:每100个Hfr细胞中,strr重组子在4分钟之前没有看到。4分钟之后,b?strr被发现并增至40%,10分钟后发现a?str?并增至30%,16分钟的后发现e?strr并增至25%,28分钟的后发现c?strr并增至12%,36分钟之后发现d?strr,并增至8%。从上述数据中分析a、b、c、d、e5个基因的基因顺序。 答案:b_________a_________e_________c________d
8 136、两个T4噬菌体的rⅡ突变体双感染E.coli B菌株后,将它们的裂解液稀释为6?107后铺于E.coli B上产生16个噬菌斑;另一稀释为2?105后铺于E.coli k上产生12个噬菌斑。试计算这两个突变基因之间的重组值。 答案:①可知,E.coli B上实际长出:16?6?107,E.coli K上长出12?2?105
2?12?2?105?100%?0.5%
重组值?716?6?10这两个突变基因之间的重组值为0.5%。 137、rⅡA254?rⅡB82在E.coli K12(?)上有26个噬菌斑,而在E.coli B平板上有482个噬菌斑。如果实验中使用的噬菌体的量相同(即相同的稀释度),计算rⅡA254与rⅡB82之间的重组频率。 答案:①已知在E.coli K12(?)上能形成噬菌斑的表型为r?,而在E.codi B平板上可形成噬菌斑的表型为rⅡ。
②所以可知重组子为52(26?2)
③则重组频率为:52?100%?10.8%
482试卷答案 第 43 页 (共 97 页) 138、已知a,b,c,d,e为T4rⅡ的5个点突变,1,2,3,4,5为5个缺失突变,其相 互位置关系见下图。将5个点突变体与5个缺失突变体两两进行互补测验,结果见下表(?表示互补,?表示不互补)。试决定点突变a.b.c.d.e的顺序。 缺失突变互相关系:
互补测验结果:
a b c d e 1 ? + ? ? ? 2 ? + ? + + 3 + + + ? ? 4 + ? + ? ? 5 + + ? ? +
答案:顺序为:acdeb
139、已知4个E.coliHfr菌株在接合时有不同的转移顺序,它们转入F?受体中有不同的进入时间。如下所示: E.coliHfr菌株编号
arg?thy?met?thr
mal?met?thi?thr?try
phe?his?bio?azi?thr?thi
his?phe?arg?mal
45 请按时间建立图谱,并标明两个基因间的时间距离。 答案:
试卷答案 第 44 页 (共 97 页)
140、Doerman用T4病毒的两个品系感染E.coli,一个品系是小噬菌斑(m)、快速溶菌(r)和混浊噬菌斑(tu)突变体;另一个品系为这三个标记的野生型(+++)。它们同时感染的溶菌产物涂平板后得到不同基因型及数目如下表所示,请回答:①决定m?r,r?tu和m?tu的连锁距离;②决定m.tu.r的连锁关系;③在这个杂交中,并发系数是多少?它意味着什么? 基因型
噬菌斑数 m r tu
853 m + tu
520 + r tu
172 + + tu
965 答案:①m?r:(162+520+474+172)/%=12.84% r?tu:(853+162+172+965)/%=20.81% m?tu:(853+520+474+965)/%=27.19%
②这三个基因的关系为m?r?tu
双交换率:(162+172)/%=3.23% m?tu距离:27.19+2?3.23=33.65% ③并发系数?0.,说明没有干涉,也不存在负干涉。
0.1141、假设已收集了大量的(Gal?)细菌突变体,用互补方法或粗略作图法已知决定Gal表型的有三个紧密连锁的基因:gaLA,gaLB,gaLC。并已知它们都在bio基因之前转移。选用Hfrbio?gaL?strs与F?bio?gaL?strr接bio?strr重组子中不同gaL?的比例为:gaLA?为0.65,gaLB?为0.72,gaLC?为0.84,试确定它们与bio基因有关的顺序。 答案:①由于Gal表型由gaLA,gaLB,gaLC三个基因所决定,所以,基因型为bio?gaL?str?的F?的真实基因型有可能为:
试卷答案 第 45 页 (共 97 页)遗传学概率计算_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
遗传学概率计算
阅读已结束,下载文档到电脑
想免费下载更多文档?
定制HR最喜欢的简历
你可能喜欢遗传算法_百度百科
声明:百科词条人人可编辑,词条创建和修改均免费,绝不存在官方及代理商付费代编,请勿上当受骗。
遗传算法(Genetic Algorithm)是模拟论的自然选择和机理的生物进化过程的计算,是一种通过模拟自然进化过程搜索的方法。遗传算法是从代表问题可能潜在的解集的一个(population)开始的,而一个种群则由经过(gene)编码的一定数目的个体(individual)组成。每个个体实际上是(chromosome)带有特征的实体。染色体作为的主要载体,即多个基因的,其内部表现(即)是某种基因组合,它决定了个体的形状的外部表现,如黑头发的特征是由染色体中控制这一特征的某种基因组合决定的。因此,在一开始需要实现从到基因型的即工作。由于仿照基因编码的工作很复杂,我们往往进行简化,如编码,初代种群产生之后,按照适者生存和优胜劣汰的原理,逐代(generation)演化产生出越来越好的近似解,在每一代,根据问题域中个体的(fitness)大小选择(selection)个体,并借助于自然遗传学的遗传(genetic operators)进行组合交叉(crossover)和变异(mutation),产生出代表新的解集的种群。这个过程将导致种群像自然进化一样的后生代种群比前代更加适应于环境,末代种群中的最优个体经过(decoding),可以作为问题近似最优解。
  运算过程
遗传(Genetic )是一类借鉴生物界的进化规律(,遗传机制)演化而来的化搜索方法。它是由的J.Holland教授1975年首先提出,其主要特点是直接对结构对象进行操作,不存在求导和连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用化的寻优方法,能自动获取和优化的搜索,自适应地调整搜索方向,不需要确定的规则。遗传算法的这些性质,已被人们广泛地应用于优化、机器学习、信号处理、和人工生命等。它是现代有关中的。
对于一个求的优化问题(求也类同),一般可以描述为下列规划:式中x为决策,式2-1为式,式2-2、2-3为,U是基本空间,R是U的。满足约束条件的解X称为,R表示所有满足约束条件的解所组成的集合,称为可行解集合。
遗传算法也是计算机科学人工智能领域中用于解决最优化的一种搜索启发式算法,是进化算法的一种。这种启发式通常用来生成有用的解决方案来优化和搜索问题。进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择以及杂交等。遗传算法在适应度函数选择不当的情况下有可能收敛于局部最优[1]
,而不能达到全局最优。
遗传算法的过程如下:
a)初始化:设置进化代数计数器t=0,设置最大进化代数T,随机生成M个个体作为初始群体P(0)。
b)个体评价:计算群体P(t)中各个个体的。
c):将选择算子作用于群体。选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的评估基础上的。
d)交叉运算:将交叉算子作用于群体。遗传算法中起核心作用的就是交叉算子。
e):将变异算子作用于群体。即是对群体中的个体串的某些上的基因值作变动。
群体P(t)经过选择、交叉、之后得到下一代群体P(t+1)。
f)终止条件判断:若t=T,则以进化过程中所得到的具有最大个体作为输出,终止计算。
遗传算法特点
遗传算法是解决搜索问题的一种通用算法,对于各种通用问题都可以使用。的共同特征为:
① 首先组成一组候选解
② 依据某些适应性条件测算这些候选解的
③ 根据保留某些候选解,放弃其他候选解
④ 对保留的候选解进行某些操作,生成新的候选解。
在遗传算法中,上述几个特征以一种特殊的方式组合在一起:基于染色体群的并行搜索,带有猜测性质的选择操作、交换操作和突变操作。这种特殊的组合方式将遗传算法与其它搜索算法区别开来。
遗传算法还具有以下几方面的特点:
(1)遗传算法从问题解的串集开始搜索,而不是从单个解开始。这是遗传算法与传统优化算法的极大区别。传统优化算法是从单个初始值求最优解的;容易误入局部最优解。遗传算法从串集开始搜索,覆盖面大,利于全局择优。
(2)遗传算法同时处理群体中的多个个体,即对搜索空间中的多个解进行评估,减少了陷入局部最优解的风险,同时算法本身易于实现并行化。
(3)遗传算法基本上不用搜索空间的知识或其它,而仅用来评估个体,在此基础上进行。函数不仅不受的约束,而且其可以任意设定。这一特点使得遗传算法的应用范围大大扩展。
(4)遗传算法不是采用确定性规则,而是采用概率的变迁规则来他的搜索方向。
(5)具有自组织、自适应和自学习性。遗传算法利用进化过程获得的信息自行组织搜索时,大的个体具有较高的生存概率,并获得更适应的。
(6)此外,算法本身也可以采用动态自适应技术,在进化过程中自动调整算法控制参数和编码精度,比如使用模糊自适应法[2]
遗传算法现状
进入90年代,遗传算法迎来了兴盛发展时期,无论是理论研究还是应用研究都成了十分热门的课题。尤其是遗传算法的应用研究显得格外活跃,不但它的应用领域扩大,而且利用遗传算法进行优化和规则学习的能力也显著提高,同时产业应用方面的研究也在摸索之中。此外一些新的理论和方法在应用研究中亦得到了迅速的发展,这些无疑均给遗传算法增添了新的活力。遗传算法的应用研究已从初期的组合优化求解扩展到了许多更新、更工程化的应用方面。
随着应用领域的扩展,遗传算法的研究出现了几个引人注目的新动向:一是基于遗传算法的机器学习,这一新的研究课题把遗传算法从历来离散的搜索空间的优化搜索算法扩展到具有独特的规则生成功能的崭新的机器学习算法。这一新的学习机制对于解决中知识获取和知识优化精炼的瓶颈难题带来了希望。二是遗传算法正日益和、以及等其它智能计算方法相互渗透和结合,这对开拓21世纪中新的智能计算技术将具有重要的意义。三是的遗传算法的研究十分活跃。这一研究不仅对遗传算法本身的发展,而且对于新一代智能的研究都是十分重要的。四是遗传算法和另一个称为人工生命的崭新研究领域正不断渗透。所谓人工生命即是用自然界丰富多彩的生命现象,其中生物的自适应、进化和免疫等现象是人工生命的重要研究对象,而遗传算法在这方面将会发挥一定的作用,五是遗传算法和进化规划(Evolution Programming,EP)以及(Evolution Strategy,ES)等进化日益结合。EP和ES几乎是和遗传算法同时独立发展起来的,同遗传算法一样,它们也是模拟自然界生物进化机制的方法,即同遗传算法具有相同之处,也有各自的特点。目前,这三者之间的比较研究和彼此结合的探讨正形成热点。
1991年D.Whitey在他的论文中提出了基于交叉的交叉算子(Adjacency based crossover),这个算子是特别针对用序号表示基因的个体的交叉,并将其应用到了问题中,通过实验对其进行了验证。D.H.Ackley等提出了随机迭代遗传(Stochastic Iterated Genetic Hill-climbing,SIGH)采用了一种复杂的概率选举机制,此机制中由m个“投票者”来共同决定新个体的值(m表示群体的大小)。实验结果表明,SIGH与单点交叉、均匀交叉的神经遗传算法相比,所测试的六个函数中有四个表现出更好的性能,而且总体来讲,SIGH比现存的许多算法在求解速度方面更有竞争力。H.Bersini和G.Seront将遗传算法与单一方法(simplex method)结合起来,形成了一种叫单一操作的多亲交叉算子(simplex crossover),该算子在根据两个母体以及一个额外的个体产生新个体,事实上他的交叉结果与对三个个体用选举交叉产生的结果一致。同时,文献还将三者交叉算子与点交叉、均匀交叉做了比较,结果表明,三者交叉算子比其余两个有更好的性能。
1992年,英国格拉斯哥大学的李耘(Yun Li)指导博士生将基于二进制基因的遗传算法扩展到七进制、十进制、整数、浮点等的基因,以便将遗传算法更有效地应用于模糊参量,系统结构等的直接优化,于1997年开发了可能是世界上最受欢迎的、也是最早之一的遗传/进化算法的网上程序 EA_demo,以帮助新手在线交互式了解进化计算的编码和工作原理[3]
,并在格拉斯哥召开第二届IEE/IEEE遗传算法应用国际会议,于2000年组织了由遗传编程(Genetic Programming)发明人斯坦福的 John Koza 等参加的 EvoNet 研讨会,探索融合GA与GP结构寻优,超越固定结构和数值优化的局限性。
国内也有不少的专家和学者对遗传算法的交叉进行改进。2002年,戴晓明等应用多遗传并行进化的思想,对不同种群基于不同的遗传策略,如变异概率,不同的变异等来搜索空间,并利用种群间迁移算子来进行遗传信息交流,以解决经典遗传算法的收敛到局部最优值问题
2004年,赵宏立等针对简单遗传算法在较大规模组合优化问题上搜索效率不高的现象,提出了一种用基因块编码的并行遗传算法(Building-block Coded Parallel GA,BCPGA)。该方法以粗粒度并行遗传算法为基本框架,在染色体群体中识别出可能的基因块,然后用基因块作为新的基因单位对染色体重新编码,产生长度较短的染色体,在用重新编码的染色体群体作为下一轮以相同方式演化的初始群体。
2005年,等针对并行遗传算法求解TSP问题,探讨了使用弹性策略来维持群体的,使得算法跨过的障碍,向全局方向进化。
遗传算法基本框架
遗传算法编码
遗传算法不能直接处理问题空间的,必须把它们转换成遗传空间的由基因按一定结构组成的染色体或个体。这一转换操作就叫做编码,也可以称作(问题的)表示(representation)。
评估编码策略常采用以下3个:
a)(completeness):问题空间中的所有点(候选解)都能作为GA空间中的点(染色体)表现。
b)健全性(soundness): GA空间中的染色体能对应所有问题空间中的候选解。
c)非冗余性(nonredundancy):染色体和候选解一一对应。
目前的几种常用的编码技术有编码,编码,编码,变成编码等。
而二进制编码是目前遗传算法中最常用的编码方法。即是由二进制{0,1}产生通常的0,1来表示问题空间的候选解。它具有以下特点:
a)简单易行
b)符合最小字符集编码原则
c)便于用模式进行分析,因为模式定理就是以基础的。
遗传算法适应度函数
进化论中的适应度,是表示某一个体对的适应能力,也表示该个体繁殖后代的能力。遗传算法的适应度也叫,是用来判断群体中的个体的优劣程度的指标,它是根据所求问题的来进行评估的。
遗传算法在搜索进化过程中一般不需要其他外部信息,仅用评估函数来评估个体或解的优劣,并作为以后的依据。由于遗传算法中,函数要比较排序并在此基础上计算选择,所以适应度函数的值要取正值。由此可见,在不少场合,将目标函数成求最大值形式且非负的函数是必要的。
适应度函数的设计主要满足以下条件:
a)、连续、非负、最大化
b) 合理、一致性
c)计算量小
d)通用性强。
在具体应用中,函数的设计要结合求解问题本身的要求而定。函数设计直接影响到遗传算法的性能。
遗传算法初始群体选取
遗传中初始群体中的个体是产生的。一般来讲,初始群体的设定可采取如下的策略:
a)根据问题固有知识,设法把握最优解所占在整个问题空间中的分布范围,然后,在此分布范围内设定初始群体。
b)先随机生成一定数目的个体,然后从中挑出最好的个体加到初始群体中。这种过程不断,直到初始群体中个体数达到了预先确定的规模。
遗传算法一般算法
遗传算法是基于生物学的,理解或编程都不太难。下面是遗传算法的一般算法:
遗传算法建初始状态
初始种群是从解中随机选择出来的,将这些解比喻为或,该种群被称为第一代,这和符号人工智能系统的情况不一样,在那里问题的初始状态已经给定了。
遗传算法评估适应度
对每一个解(染色体)指定一个适应度的值,根据的实际接近程度来指定(以便逼近求解问题的答案)。不要把这些“解”与问题的“答案”混为一谈,可以把它理解成为要得到答案,系统可能需要利用的那些特性。
遗传算法繁殖
繁殖(包括突变)
带有较高值的那些染色体更可能产生后代(后代产生后也将发生突变)。后代是父母的产物,他们由来自父母的基因结合而成,这个过程被称为“”。
遗传算法下一代
如果新的一代一个解,能产生一个充分接近或等于期望答案的输出,那么问题就已经解决了。如果情况并非如此,新的一代将重复他们父母所进行的繁衍过程,一代一代演化下去,直到达到期望的解为止。
遗传算法并行计算
非常容易将遗传算法用到并行计算和群集环境中。一种方法是直接把每个节点当成一个并行的种群看待。然后有机体根据不同的繁殖方法从一个节点迁移到另一个节点。另一种方法是“农场主/劳工”,指定一个节点为“农场主”节点,负责选择有机体和分派的值,另外的节点作为“劳工”节点,负责重新组合、和适应度函数的评估。
遗传算法术语说明
由于遗传算法是由进化论和遗传学机理而产生的,所以在这个算法中会用到很多生物遗传学知识,下面是我们将会用来的一些术语说明:
遗传算法染色体
染色体又可以叫做基因型个体(individuals),一定数量的个体组成了群体(population),群体中个体的数量叫做群体大小。
遗传算法基因
基因是串中的,基因用于表示个体的特征。例如有一个串S=1011,则其中的1,0,1,1这4个元素分别称为基因。它们的值称为(Alleles)。
遗传算法基因位点
基因位点在算法中表示一个基因在串中的位置称为基因位置(Gene Position),有时也简称基因位。基因位置由串的左向右计算,例如在串 S=1101 中,0的基因位置是3。
遗传算法特征值
在用串表示时,基因的特征值与的权一致;例如在串 S=1011 中,基因位置3中的1,它的基因特征值为2;基因位置1中的1,它的基因特征值为8。
遗传算法适应度
各个个体对环境的叫做(fitness)。为了体现染色体的适应能力,引入了对问题中的每一个染色体都能进行度量的函数,叫函数。 这个函数是计算个体在群体中被使用的概率。
遗传算法运算过程
是模拟生物基因遗传的做法。在遗传算法中,通过编码组成初始群体后,的任务就是对群体的个体按照它们对环境(适应度评估)施加一定的操作,从而实现优胜劣汰的进化过程。从优化搜索的角度而言,遗传操作可使问题
的解,一代又一代地优化,并逼近最优解。
包括以下三个基本遗传(genetic operator):选择(selection);交叉(crossover);(mutation)。这三个遗传算子有如下特点:
个体遗传的操作都是在随机扰动情况下进行的。因此,群体中个体向迁移的规则是随机的。需要强调的是,这种操作和传统的方法是有区别的。进行的高效有向的搜索而不是如一般方法所进行的无向搜索。
的效果和上述三个遗传所取的操作概率,编码方法,群体大小,初始群体以及函数的设定密切相关。
遗传算法选择
从群体中选择优胜的个体,淘汰劣质个体的操作叫选择。选择有时又称为再生算子(reproduction operator)。选择的目的是把优化的个体(或解)直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的,目前常用的选择算子有以
下几种:适应度方法、随机遍历抽样法、局部选择法。
其中轮盘赌选择法 (roulette wheel selection)是最简单也是最常用的选择方法。在该方法中,各个个体的选择概率和其值成比例。设群体大小为n,其中个体i的为,则i 被选择的概率,为遗传算法
显然,概率反映了个体i的在整个群体的个体适应度总和中所占的比例。个体越大。其被选择的概率就越高、反之亦然。计算出群体中各个个体的选择概率后,为了选择交配个体,需要进行多轮选择。每一轮产生一个[0,1]之间均匀,将该随机数作为选择来确定被选个体。个体被选后,可随机地组成交配对,以供后面的交叉操作。
遗传算法交叉
在自然界生物进化过程中起核心作用的是生物的重组(加上变异)。同样,遗传算法中起核心作用的是的交叉算子。所谓交叉是指把两个父代个体的部分结构加以替换重组而生成新个体的操作。通过交叉,遗传算法的搜索能力得以飞跃提高。
交叉算子根据交叉率将中的两个个体随机地交换某些基因,能够产生新的基因,期望将有益基因组合在一起。根据编码表示方法的不同,可以有以下的算法:
a)实值重组(real valued recombination)
1)离散重组(discrete recombination)
2)中间重组(intermediate recombination)
3)重组(linear recombination)
4)扩展线性重组(extended linear recombination)。
b)二进制交叉(binary valued crossover)
1)单点交叉(single-point crossover)
2)多点交叉(multiple-point crossover)
3)均匀交叉(uniform crossover)
4)洗牌交叉(shuffle crossover)
5)缩小代理交叉(crossover with reduced surrogate)。
最常用的交叉算子为单点交叉(one-point crossover)。具体操作是:在个体串中随机设定一个交叉点,实行,该点前或后的两个个体的部分结构进行互换,并生成两个新个体。下面给出了单点交叉的一个例子:
个体A:1 0 0 1 ↑1 1 1 → 1 0 0 1 0 0 0 新个体
个体B:0 0 1 1 ↑0 0 0 → 0 0 1 1 1 1 1 新个体
遗传算法变异
变异算子的基本内容是对群体中的个体串的某些基因座上的基因值作变动。依据个体编码表示方法的不同,可以有以下的算法:
a)实值变异
b)二进制变异。
一般来说,变异算子操作的基本步骤如下:
a)对群中所有个体以事先设定的变异概率判断是否进行变异
b)对进行的个体随机选择变异位进行变异。
遗传算法引入变异的目的有两个:一是使遗传算法具有局部的能力。当遗传算法通过交叉已接近时,利用变异算子的这种局部能力可以加速向最优解收敛。显然,此种情况下的变异概率应取较小值,否则接近最优解的积木块会因变异而遭到破坏。二是使遗传算法可维持群体,以防止出现未成熟收敛现象。此时收敛概率应取较大值。
遗传算法中,交叉因其全局搜索能力而作为主要算子,变异算子因其局部搜索能力而作为辅助算子。遗传算法通过交叉和变异这对相互配合又相互竞争的操作而使其具备兼顾全局和局部的均衡搜索能力。所谓相互配合.是指当群体在进化中陷于搜索空间中某个超而仅靠交叉不能摆脱时,通过变异操作可有助于这种摆脱。所谓相互竞争,是指当通过交叉已形成所期望的积木块时,变异操作有可能破坏这些积木块。如何有效地配合使用交叉和变异操作,是目前遗传算法的一个重要研究内容。
基本变异是指对群体中的个体码串随机挑选一个或多个并对这些基因座的基因值做变动(以变异概率P.做变动),(0,1)二值码串中的基本变异操作如下:
基因位下方标有*号的基因发生变异。
变异率的选取一般受种群大小、染色体长度等因素的影响,通常选取很小
的值,一般取0.001-0.1。
遗传算法终止条件
当最优个体的达到给定的,或者最优个体的适应度和群体适应度不再上升时,或者迭代次数达到预设的代数时,算法终止。预设的代数一般设置为100-500代。
遗传算法不足之处
(1)编码不规范及编码存在表示的不准确性。
(2)单一的遗传算法编码不能全面地将优化问题的约束表示出来。考虑约束的一个方法就是对不可行解采用阈值,这样,计算的时间必然增加。[4]
(3)遗传算法通常的效率比其他传统的优化方法低。
(4)遗传算法容易过早收敛。
(5)遗传算法对算法的精度、可行度、计算复杂性等方面,还没有有效的定量分析方法。
遗传算法应用
由于遗传算法的整体搜索策略和优化搜索方法在计算时不依赖于信息或其它辅助知识,而只需要影响搜索方向的目标函数和相应的适应度函数,所以遗传算法提供了一种求解复杂系统问题的通用框架,它不依赖于问题的具体领域,对问题的种类有很强的,所以广泛应用于许多科学,下面我们将介绍遗传算法的一些主要应用领域:
遗传算法函数优化
函数优化是遗传算法的经典应用领域,也是遗传算法进行性能评价的常用算例,许多人构造出了各种各样复杂形式的测试函数:连续函数和离散函数、和、低维函数和函数、单峰函数和多峰函数等。对于一些、多、多目标的函数优化问题,用其它优化方法较难求解,而遗传算法可以方便的得到较好的结果。
遗传算法组合优化
随着问题规模的增大,组合优化问题的搜索空间也急剧增大,有时在目前的计算上用法很难求出。对这类复杂的问题,人们已经意识到应把主要精力放在寻求满意解上,而遗传算法是寻求这种满意解的最佳工具之一。实践,遗传算法对于组合优化中的NP问题非常有效。例如遗传算法已经在求解、 、、图形划分问题等方面得到成功的应用。
此外,GA也在生产调度问题、自动控制、机器人学、、、遗传编码和等方面获得了广泛的运用。
遗传算法车间调度
车间调度问题是一个典型的NP-Hard问题,遗传算法作为一种经典的智能算法广泛用于车间调度中,很多学者都致力于用遗传算法解决车间调度问题,现今也取得了十分丰硕的成果。从最初的传统车间调度(JSP)问题到柔性作业车间调度问题(FJSP),遗传算法都有优异的表现,在很多算例中都得到了最优或近优解。
遗传算法演示学习
EA_demo,英国格拉斯哥大学1997年出版[3]
,至今仍广泛使用,采用大学包括英国利物浦(Liverpool)大学、苏塞克斯(Sussex)大学、北安普顿(Northampton)大学,德国乌尔姆(Ulm)大学,瑞士日内瓦(Geneva)大学,西班牙格林纳达(Granada)大学,葡萄牙新里斯本(Nova de Lisboa)大学,美国加州大学戴维斯分校(UC Davies),加拿大卡尔加里(Calgary)大学,澳大利亚墨尔本皇家理工大学(RMIT),新加坡国立大学,台湾国立清华大学,上海交通大学,巴西PUCRS大学等。
EA_demo允许用户直接在网页上一代一代地手动运行,以看遗传/进化算法是怎样一步一步操作的,亦可在背景中批次运行,以观察算法的收敛和染色体是否跳出局部最优。用户可以改变终止代数,群体规模,交配率,变异率和选择机制。也有其它自学课件收录于AI中心网站和欧洲软计算中心网站。
.爱奶嘴[引用日期]
.IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics. ): .[引用日期]
.University of Glasgow CAutoD.1997[引用日期]
.爱奶嘴[引用日期]
本词条内容贡献者为
副理事长兼秘书长
中国通信学会
中国通信学会
原武汉邮电科学研究院
中国联通网络技术研究院
工业和信息化部电信研究院互联网中心
副院长兼总工程师
中国移动设计院
首席架构师业务总工程师
中兴通讯股份有限公司
百度公司发展研究中心
中国通信学会科普中国百科科学词条评审专家委员会
中国通信学会是全国通信...
提供资源类型:内容

我要回帖

更多关于 生物遗传学概率计算 的文章

 

随机推荐