如何从不同来源的样本中提取miRNA(microRNA)?
来源:艾德科技(北京)有限公司
浏览人数: 2888
如何提取小小的miRNA(microRNA),各知名生物技术公司均推出了自己的试剂盒,国内知名核酸纯化公司艾德科技与合作伙伴针对不同来源的样本亦推出了一系列拥有独特技术的miRNA(microRNA)提取试剂盒!
miRNA(microRNA)的成功提取依赖于样本中核酸的充分裂解和释放,有没有一种试剂盒能够针对所有的样本都适用的?答案是否定!目前市场上的miRNA(microRNA)试剂盒主要针对于培养的细胞和动物的组织。血清、石蜡包埋组织、多糖多酚植物的小RNA等由于样本本身的特殊性很难提取,艾德科技利用本身在核酸分离纯化方面开发的诸多新技术,为科研用户提供针对性强的专用产品。我们从不同类型的样本来探讨其miRNA(microRNA)的提取方法。
1、 培养的细胞和动物的组织:最早使用于此类型样本的试剂盒是由ambion公司推出,利用胍盐裂解,加入苯酚抽提、氯仿分层,通过两个吸附柱分别提取大RNA和小RNA;艾德科技的A-R5301是此类方法的升级版,将胍盐和苯酚以合适的比例混合,混合后的试剂不仅提高了裂解效果、混合液中的苯酚更不容易变质,而且节省了操作的时间和步骤。2、 全血、血清:全血总RNA获得用户的一致好评,同样,采用直接裂解法的A-R5301提取全血、血清miRNA(microRNA)比其他方法体现出了更好的稳定性。3、 石蜡组织:从石蜡组织中提取miRNA(microRNA)是比较困难的,只有专用的试剂盒才能很好的提取,本试剂盒A-R5311包含脱蜡的步骤和相关的试剂,能够帮助客户迅速的提取石蜡组织中的miRNA(microRNA)。4、 多糖多酚植物:植物的类型多种多样,尤其是多糖多酚的植物更难提取!一般的裂解液既不能去除多糖也不能去除多酚,所以无法很好的提取多糖多酚的植物艾德科技利用本身在多糖多酚植物RNA提取方面领先的技术,率先开发出专用的植物miRNA(microRNA)提取试剂盒A-R5331,应该是目前市场上唯一针对植物样本的miRNA(microRNA)提取试剂盒,避免了您提取miRNA(microRNA)时走弯路!直接通向成功的实验彼岸!
请您对这篇文章发表看法
这篇文章来自
相关技术资料
艾德科技(北京)有限公司
地址:北京市昌平区中关村生命科学园东60米艾德园
邮政编码:100012
联系人:Peter
电话:010-25208
传真:010-当前位置: >>
microRNA的检测 及其靶标的确定张尚书版权归郑州大学所有copyright目录? ? ? ? ? ? ? microRNA研究的兴起与发展 microRNA的检测 microRNA的靶基因 扩展与举例(Blast) 扩展与举例(cancer genetics web) 扩展与举例(miRa
nda) microRNA研究思路2microRNA研究的兴起与发展基因组 ? 编码蛋白质的基因 ? 多种非编码的RNA有着重要的调控作用 miRNA兴起 ? 1993年发现第一个miRNA lin-4,没有引起重视 ? 2001年,涌现大量miRNA报道,自此miRNA备 受关注,随后几年相关学术文献呈爆炸性增长。microRNA研究的兴起与发展miRNA发展中 遇到的问题: ?在各种生物中寻找 miRNA ?发现miRNA的靶基因 ?揭示miRNA的功能目前靶基因检测 工作成为miRNA 功能研究的瓶颈microRNA是什么?miRNA(microRNA,微小RNA) I. 是一类长约19~25个核苷酸的 II. 内源性 III. 单链 IV. 非编码 V. 小分子RNA。 根据预测,人体中30%以上的基因都受到 miRNA的调控。pri-mRNA5’端带帽、3’端加多聚A尾RNaseⅢ(一种核糖核酸内切酶,是特定的双链 RNA。它对转录后的RNA ――前核糖体RNA和各种 其他包含RNA双链区的结构 加工起到了重要的作用。)Drosha酶、Dicer酶RISC:RNA-InducedSilencing ComplexmiRNA如何行使功能?与mRNA的3‘端非编码区特定位点(其第2~8个核 苷酸)绑定:&与mRNA完美互补时――会引发mRNA降解; &不完美的与mRNA配对时,会引发转录后的基因沉默(抑制 靶基因的表达)从而抑制或阻止相应的mRNA翻译过程。 举例分析:在DNA修复通路中行使上述过程 1)抑制或阻止正常细胞DNA修复产生致癌作用 2)抑制或阻止癌细胞DNA修复达到治疗效果miRNA调控作用及相关检测方法microRNA功能miRNA序列(其基因位置和序列高度保守)、结构、*丰 度和表达方式的多样性使其可能作为mRNA表达的调 节因子,从而在以下生命过程中起着重要的调控作用: 【细胞发育 细胞增殖 细胞凋亡 细胞分化】 【应激反应 】 【病毒感染】 【脂肪代谢 】 【癌症 心脏病】 在人类基因组中大约50%的已知miRNA成簇表达,而 且一个簇的miRNA经常是彼此相关的。*丰度:DNA在混合物中的浓度。 一般以百分数表示。miRNA的检测? miRNA的获取 ? miRNA的确认 ? miRNA的检测方法miRNA的获取miRNA 分子的序列短小1)在基因组中存在较多的互补序列 2)在不同生物体内与靶基因结合的方式也不尽相同 3)通常与多种蛋白相互作用 这使得建立一个有效而且普遍适用的研究方法异 常困难。 #到目前为止,miRBase上公布的miRNA总数将近3 000种。 #现在已知靶基因的miRNA多是通过基因克隆和生物信 息学筛选的方法发现的。miRNA的获取――基因克隆1.1 基因克隆 直接克隆的方法通常是从总RNA中提取大约22 nt的小 RNA分子,制备一个小RNA的cDNA(complementary DNA)文库。 将文库中的小RNA序列与基因组数据库中BLAST序列类似性 比对,排除非miRNA 序列后,通过Northern印迹方法(Northern blotting) 得到最终确认。目前大量的已知miRNA都是通过这 种方法获得的。 基因克隆方法的优点是对于高丰度或常表达的基因来说, 可以获得完整的miRNA序列。然而对于另一些miRNA,它们在 生物体内浓度很低(表达量低或表达产物极不稳定,或前体到 成熟的加工效率低等原因引起) ,或者某些只在生物体的特定 时期或特定组织器官中表达,直接克隆法则无法获取。注:Northern印迹杂交(Northern blot)。这是一种将RNA从琼脂糖凝胶中转印到硝酸纤维素膜上的方法。miRNA的获取――生物信息学筛选1.2 生物信息学筛选随着生物全基因组测序的完成,利用计算机对基因组序列进行搜索可以大大提高miRNA的鉴定效 率。所以,人们根据目前已知的miRNA基因序列总结它们的特征和规律,编写了一些计算机程序,通 过对生物基因组数据库进行搜索,可以找到那些可能为miRNA的基因序列,然后通过Northern blotting来筛选真正的miRNA 基因。 生物信息学方法是依据在不同的物种中,其成熟的miRNA 具有较大的序列同源性以及前体的 茎环结构具有相当大的保守性这一特征在基因组数据库中搜索新的miRNA 基因。该方法根据比较 基因组学原理并结合生物信息软件在已测序基因组中进行搜索比对,根据同源性的高低再进行 RNA二级结构预测,将符合条件的候选miRNA与已经通过实验鉴定的miRNA分子进行比较分析,最终确定该物种miRNA的分布及数量。近年来随着miRNA预测方法的不断发展,人们发现的miRNA数量呈几何级数增长。这些预测方法从简单的序列比对搜索发展到现在的机器学习算法, 程序设计越来越智能化,复杂化。miRNA的获取――生物信息学筛选随着人miRNA基因转录出的pri-miRNA迅速加工成具有 茎环结构的pre-miRNA,随后被切割成miRNA:miRNA*双 体,并被选择性地组合进核糖核酸沉默诱导复合体(RISC) 并进行靶基因识别。在相似的物种中,miRNA是很保守的; 但在相距较远的物种间,miRNA又有一定的分歧,尤其体 现在pre-miRNA上。这些miRNA功能作用机制的阐明为预测 软件的研发提供了理论依据,但仍需要不断修补和完善。 近年来,几个基于这些规则的miRNA预测程序先后被开发 (下表),并被广泛使用。 生物信息学手段可以说是一种更高通量的方法。通常有以 下几种方法: ①Mirscan是一种基于二级结构的预测程序,通过扫描两种 系之间是否存在同源的茎环结构, 应用于检测脊椎动物和 线虫的候选基因。miRNA的获取――生物信息学筛选②Mirseeker是一种检查RNA序列茎环结构的预测程序,应用于筛选昆虫的候选基因。 它是根据3个标准来预测的:一是具有长度为70~100 nt茎环结构的 Pre-miRNA;二是不同种系生物中Pre-miRNA的保守性;三是miRNA的 核苷酸差异性。③ERP IN是一种类似于BLAST的校对程序,用于搜寻动物基因组中与miRNA 序列类似的序列。 ④MiPred可以通过random forest预测模型和miRNA特征的结合,区分 miRNA 的真正前体和假冒前体。
miRBase序列数据库miRBase序列数据库是一个提供包括miRNA序列数据、注 释、预测基因靶标等信息的全方位数据库,是存储miRNA信 息最主要的公共数据库之一。miRBase提供便捷的网上查询 服务,允许用户使用关键词或序列在线搜索已知的miRNA和 靶标信息,详情请(http://www.mirbase.org/)。 日正式发布。相比于以往版本的数据库 (Sanger microRNA序列数据库),19.0版数据库进行了巨大 的数据更新:miRNA发夹前体序列已升至21264条,新增3171 条;成熟miRNA升至25141条,新增3625条;已发布的miRNA 序列共涵盖193个物种,相比于18.0版新增25个物种。新版数 据库对miRNA序列注释和命名进行了系统的修正,miR*命名 已经终止使用,取而代之的是-5p和-3p的命名法。miRNA的确认判断标准: ①能够通过与特定大小的总RNA样品杂交得到22个碱基对 ( ~22nt)的产物(即需要Northern杂交或引物延伸反应验证表 达) 。 ②所得的序列是从特定大小的( ~22nt)的小分子RNA库中克 隆到的, 并且必需与克隆的来源物种的基因组序列完全匹配。 ③经过前体的二级结构预测,有发夹状的二级结构,并且成熟 的miRNA序列在发夹的一条臂上。 ④成熟的miRNA序列与预测的二级结构在不同物种间有保守 性。 ⑤在Dicer突变的系统中,前体的积累增多。 要确认基因克隆获得的或生物信息学分析预测的基因是 否为真正的miRNA,就应该采用上面5个原则来检验。miRNA的检测方法要了解miRNA在基因调控中扮演的角色,很关键的 一个方法就是迅速、准确地定量检测miRNA基因 的表达。检测miRNA的方法主要有以下几种: ①Northern blotting是现在检测miRNA表达最主 要的手段,所有克隆和生物信息学分析得来的 miRNA都需要经过Northern blotting来验证和确 认。 这种方法的缺点在于灵敏度较低且不能进行高 通量的检测。miRNA的检测方法②RT-PCR(reverse transcription PCR,反转录PCR)也 被用来检测miRNA前体的表达水平,但miRNA前体的表 达水平并不一定和成熟miRNA的表达水平一致。因此, 在RT-PCR的基础上,人们改进了一些技术,从而使得能够 检测低表达量的miRNA。? 实时荧光定量PCR ( real-time PCR)可以很精确的定量分析 miRNA的表达,也经常用于验证预测的miRNA。 ? 引物延伸法,就是在引物的5′末端加一个特异标记,可以定 量测定低丰度的RNA含量。 ? 原位杂交技术,可以方便的检测miRNA的时空表达的差异。原位杂交是指将特定标记的已知顺序核酸为探针与细胞或组织切片中核酸进行杂交,从而对特定核酸顺 序进行精确定量定位的过程。原位杂交可以在细胞标本或组织标本上进行。另有荧光原位杂交。miRNA的检测方法③芯片技术(mi-croarray) 是一种更快、更广泛、更有前途的 研究miRNA表达的方法。Liu等最先发表了关于微点阵能够获 得高通量的结果。这些结果显示了组织特异性miRNA的表达 标记,而且通过Northern blot和real-time PCR进行了验证。 芯片技术固然以其高通量和并行处理的特点在基因信息 分析中占据重要地位,但信息量大并不等于质量高。实际上, 基因芯片的一个突出弱点就是其信息质量的稳定性和可重复 性比较差,且无法实现定量检测,因此后来又出现了多种改进 的芯片技术,其中现在流行的就是液相芯片技术。 液相芯片( liquichip )是美国纳斯达克上市的Luminex公司 研制出的新一代生物芯片技术,它既能为后基因组时代科学研 究提供强大的技术支持,又能提供高通量的新一代分子诊断技 术平台。miRNA的识别多个研究小组采用生物化学结合是生物信息学的方法开展对miRNAs的研 究工作。由于据推测都是由Dicer酶降解RNA得到的,21―23个碱基大小、 有5’端磷酸基和3’羟基的RNA片断,有的实验室采用改良的定向克隆方法 来筛选具有相同特征的小分子―― 1.筛选一定大小的RNA分子,连接到3’和5’的适配子(adapters) 2.逆转录 在分子克隆中指从大片段 3.通过PCR扩增 的克隆中选取特定小片段 再克隆/subclone 4.亚克隆 5.测序。 miRNA前体在基因组上的定位和聚类是通过向基因组数据库查询进行。 这个方法有助于判断miRNAs是否是mRNAs、tRNAs、rRNAs等分子的降 解产物。 生物信息学的方法被鉴别出来,已经鉴别出来的miRNAs只不过是沧海一 粟,由于很多已经鉴别出来的miRNAs是从单个克隆中鉴别出来的,所以 可以假设还有很多miRNAs在分离和鉴定过程中被“漏掉”了,测序工作 还远远不够。miRNA的靶基因? miRNA的靶基因预测 ? miRNA的靶基因检测 ? miRNA的生物学功能miRNA的靶基因预测以前,研究miRNA的靶基因依赖于正向遗传学方法,包括突变体的产 物、变形筛选、定位克隆和miRNA及其靶基因的确认,如lin24和let27及 它们的靶基因的发现。在果蝇中,miRNA bantam及其靶基因hid的发现 就是正向遗传学研究miRNA的经典过程。 反向遗传学联合生物信息学的方法比正向遗传学更优越。它主要 是由软件来预测miRNA的靶基因并为分子实验提供指标,其基本原理 是基于miRNA与其靶基因的自然配对。已知miRNA及其靶基因之间的 对比和相关性, lin24、let27和bantam基因的确认等都为计算机程序发 展提供了更多的信息。 计算机程序预测方法在植物种属中运用的很成功,而在动物中则 不是很成功,这可能是因为植物中的miRNA 与其靶基因几乎完全配对 结合。而在动物中,miRNA与靶基因mRNA通常以不精确的碱基互补配 对结合。miRNA的靶基因预测――miRNA的研究意义之重大是毋庸置疑的。然而,与新的 miRNA的频频发现相比,miRNA的功能研究相对缓慢。 ――到目前为止,在发现的4449多个miRNA中,确定功能的 miRNA仅有几十个。 ――导致miRNA功能研究进展缓慢的非常重要的原因是miRNA的 作用靶标难以确定。――通过实验方法确定miRNA的作用靶标非常耗时,目前尚无高 通量的靶标鉴定方法。因此,通过理论方法预测miRNA的作用靶标成为当前识别 miRNA作用靶标的较为理想的途径。以下重点介绍几种经典预测 软件的算法分析,其他软件(见下表):miRNA几种常见的预测方法下面概括介绍几种常见的预测方法:() miRanda. ? miRanda 是最早的一个利用生物信息学对miRNA 靶基因进行预测的软 件, 由Enright等人于2003 年设计开发. 其对3′UTR 的筛选依据主要是 从序列匹配、miRNA 与mRNA 双链的热稳定性以及靶位点的保守性三 个方面进行分析. ? miRanda 软件首先选取了黑腹果蝇(Drosophila melanogaster)中已知的 73 条miRNA 作为探针, 采用类似于Smith-Waterman 的算法对9805 个 3′UTR 进行碱基互补分析. ――首先, 互补参数被设定为: GUC, AUU 为+5, GUU 为+2, 其他配对方式 为?3, 同时起始空位(gap-opening)罚分为?8, 延伸空位(gap-extension)罚分 为?2;*序列比对就是通过一定的算法对两个或多个序列进行比较,找出序列间最大的相似性匹配。*Smith&Waterman算法是一种 经典的序列比对算法,在双序列比较的情况下具有比较好的速度和结果,但是在进行序列数据库搜索时则显得处理速度不足。miRanda――其次, 为体现与靶基因作用过程中miRNA5′ 端和3′端的不对称性, 5′端的前11 个碱基的互 补分值(complementarity scores)将乘以一个scale 参数; ――最后, miRNA 与靶mRNA 的互补还要遵循以 下4 个规则: ? miRNA 第2~4 位碱基和靶基因精确匹配; ? 第3~12 位碱基和靶基因错配不得多于5 个; ? 9~L-5(L 为miRNA 总长)位碱基最少一个错配; ? 最后5 个碱基错配不得多于2 个.miRanda? 在热稳定性方面, miRanda 采用Vienna 软件包 计算miRNA 与3′UTR 作用的自由能(ΔG). ? 在物种间保守性方面, 要求靶位点在多物种 3′UTR 比对中相同位置处碱基相同. 综合以上3 条原则, miRanda 选取每条miRNA 相对的3′UTR 中排名前10 位的基因, 作为miRNA 的候选靶基因, 对于多个miRNA 对应于同一靶位 点的情况, miRanda 则使用贪心算法(Greedy Algorithm)选取其中得分最高且自由能最低的那 一对.TargetScan() TargetScan 和TargetScanS.∞ TargetScan 是Lewis 等人在2003 年开发的一款用于预测哺乳动物miRNA靶 基因的软件, 该软件将RNA 间相互作用的热力学模型与序列比对分析相结 合, 预测不同物种间保守的miRNA 结合位点. ∞ 与miRanda 不同, 在TargetScan 的算法中, 要求miRNA5′端第2~8 位碱基与 mRNA 的3′UTR 完全互补, 这7 个核苷酸被称作“miRNA 种子区/关键区” (seed region). 种子区向两侧延伸直到出现碱基错配为止, 这期间允许G UU配对, 同时利用RNAFold 计算结合位点的自由能. ∞ TargetScan 中引入了信号噪声比来评估预测结果的准确度, 所谓信号噪声 比即用已知(信号组)和随机生成的miRNA(噪声组)分别对mRNA 的3′UTR 进行预测, 所得靶基因数目的比值. ? 当仅针对人(Homo sapiens)和小鼠(Mus musculus)的3′UTR 对miRNA 靶位 点进行预测时, 信号噪声比为2U1 ? 针对人、小鼠、大鼠(Rattus norvegicus)的3′UTR 进行预测时信号噪声比 为3.2U1 ? 研究范围扩大到人、小鼠、大鼠和河豚(Takifugu rubripes)时, 信号噪声比 为4.6U1. 随着物种数目的增多, 预测得到的靶基因减少, 但准确性得到了相应的 提高.TargetScanS∞ 后来, Lewis 等人又对TargetScan 进行了优化,即TargetScanS. ∞ TargetScanS 在人、小鼠、大鼠的基础上增加了狗(Canis familiaris)和鸡(Gallus gallus)的基因组数据, ∞ 同时在算法上做了改动, 将种子区由先前的7 个核苷酸调整为 5′端第2~7 位碱基共6 个核苷酸,要求在种子区完全互补的情 况下, miRNA 第8 位碱基与靶基因互补或者miRNA第1 位碱基 是腺嘌呤. ∞ 2007年, Andrew 等人又将TargetScanS 的算法中加入了新的条 件 1)即有效的miRNA 结合位点多分布于3′UTR 中AU 富集的区域 2)功能上具有协同作用的miRNA 靶位点相近 3)miRNA 的第12~17 个核苷酸与3′UTR 互补促进两者的结合 4)有效的miRNA 结合位点优先分布于3′UTR 的两侧, 但距离终 止密码子至少15 个核苷酸.动物中靶基因预测方法扩展? ? ? ? ? ? ? miRNA命名 物种缩写 癌基因和相关miRNA的特征 基因数据库 Blast简介 cancer genetics web miRanda应用miRNA命名(1)miRNA简写成miR-No.,它的基因简写成mir-No. 如miR-21; (2)高度同源的miRNA在No.其后加英文字母(小写,一般从a开始) 如miR-199a 和miR-199b; (3)由不同染色体上的DNA序列转录加工而成的具有相同成熟体序列的miRNA, 则在后面加上阿拉伯数字以区分, 如miR-199a-1和miR-199a-2; (4)如果一个前体的2个臂分别加产生miRNA,则根据克隆实验,在表达水平 较低的miRNA 后面加“*” ,如miR-199amiR-199a*,或进行如下命名,miR142-5p(也可命名为miR-142-s,表示从5' 端的臂加工而来)和miR-142-3p(也可 命名为miR-142-as,表示从3'端的臂加工而来); (5)将物种缩写置于miRNA之前,如hsa-miR-195; (6)确定命名规则之前发现的miRNA,如let-7,则保留原来名字。物种缩写? http//www.gene.ucl.ac.uk/nomenclature/guidelines.html hsa: Homo sapiens, 人 mmu: Mus musculus, 小家鼠 rno:Rattus norvegicus大鼠 cfa:Canis familiaris 狗 gga:Gallus gallus鸡 dan、der、dgr、dme(黑腹果蝇)、dmo、dpe、dps、dse、 dsi、dvi、dwi、dya:果蝇(不同种属)癌基因和相关miRNA的特征ж 大量关于癌症的相关研究证实在癌症患者体内确实存在着某 些异常表达的miRNA ж 值得研究的是癌症患者体内已发现的异常表达的miRNA几乎全部作用于癌症患者的癌基因上ж 从这个角度看,miRNA在癌症的发生过程中,特别是对癌基因的基因调控,抑制蛋白质表达方面应该起着非常重要的作用 ж 因此,研究癌症与miRNA的关系具有非常重要的生物学意义。癌基因和相关miRNA的特征? 癌症患者体内存在的某些与癌症有密切关系的蛋 白质,其出现与癌基因的激活有密切关系,因此 研究蛋白质的结构域与miRNA的关系也非常有意 义。 ? 目前研究的RNAi技术可在体外培养细胞中沉默人 类的内源性基因,使得RNAi技术可能进入肿瘤治 疗领域。利用RNAi技术封闭恶性细胞中的癌基因 成为高特异性治疗癌症的新希望。基因数据库一.GenBank数据库 GenBank(http://www.ncbi.nlm.nih.gov/)是 美国国家卫生研究所(NIH)基因序列数据库, 由美国生物技术信息中心开发。该数据库中半数 以上是人类基因组的序列。 GenBank提供Entrez浏览检索,Blast序列类 似性检索,dbEST检索,dbSTS检索和文本检索。 可按基因存取号、著者号、基因名称、期刊 刊号、刊名、标题词、文本词、序列号等字段进 行限定检索。Blast简介BLAST 是由美国国立生物技术信息中心 (NCBI)开发的一个基于序列相似性的 数据库搜索程序。BLAST是“局部相似性 基本查询工具” (Basic Local Alignment Search Tool)的 缩写。主要的blast程序生物序列的相似性相似性(similarity): 是指一种很直接的数量关系,比如部分相同 或相似的百分比或其它一些合适的度量。 比如说,A序列和B序列的相似性是80%, 或者4/5。这是个量化的关系。当然可进行 自身局部比较。生物序列的同源性同源性(homology): 指从一些数据中推断出的两个基因或蛋白 质序列具而共同祖先的结论,属于质的判 断。就是说A和B的关系上,只有是同源序 列,或者非同源序列两种关系。而说A和B 的同源性为80%都是不科学的。Blast资源1.NCBI主站点: http://www.ncbi.nlm.nih.gov/BLAST/(网络版) ftp://ftp.ncbi.nlm.nih.gov/blast/ (单机版) 2.其他站点: http://life./blast/ http://nema.cap.ed.ac.uk/ncbi_blast.html http://www.fruitfly.org/blast/(果蝇) …Blast结果给出的信息Blast结果会列出跟查询序列相似性比较高, 符合限定要求的序列结果,根据这些结果 可以获取以下一些信息。 1.查询序列可能具有某种功能 2.查询序列可能是来源于某个物种 3.查询序列可能是某种功能基因的同源基因 … 这些信息都可以应用到后续分析中。Blast程序评价 序列相似性的两个数据? Score:使用打分矩阵对匹配的片段进行打分,这是对各对氨基酸残基(或碱基)打分求和的结 果,一般来说,匹配片段越长、 相似性越高则 Score值越大。? Evalue:在相同长度的情况下,两个氨基酸残基(或碱基)随机排列的序列进行打分,得到上述 Score值的概率的大小。E值越小表示随机情况下 得到该Score值的可能性越低。NCBI提供的Blast服务登陆ncbi的 blast主页核酸序列蛋白序列翻译序列底下有其他一些针对 特殊数据库的和查看 以往的比对结果等 46Blast任务提交表单(一)1.序列信息部分序列范围 (默认全部)填入查询(query)的序列选择搜索数据库 如果接受其他参数默认 设置,点击开始搜索47Blast任务提交表单(二)2.设置各种参数部分设置搜索的范围,entrez关键词, 或者选择特定物种一些过滤选项,包括简 单重复序列,人类基因 组中的重复序列等E值上限 窗口大小 如果你对blast的命令行选项熟悉的话,可以在这里加入更多的参数48Blast任务提交表单(三)3.设置结果输出显示格式 E值范围 选择需要显示的选项 以及显示的文件格式 显示数目 Alignment的显 示方式筛选结果点击开始搜索其他一些显示格式参数49提交任务返回查询号(request id)修改完显示格式后点 击进入结果界面可以修改显示结果格式50结果页面(一)图形示意结果51结果页面(二)目标序列描述部分带有genbank的链接,点击可以进入 相应的genbank序列匹配情况,分值,e值52结果页面(三)详细的比对上的序列的排列情况53一个具体的例子(blastp)假设以下为一未知蛋白序列&query_seq MSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEEL RFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIV WVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNST PGSSRGNSPARMASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTAT KQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTW LTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAAD MDDFSRQLQNSMSGASADST QA我们通过blast搜索来获取一些这个序列 的信息。在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的 格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。54具体步骤1.登陆blast主页 http://www.ncbi.nlm.nih.gov/BLAST/ 2.根据数据类型,选择合适的程序 3.填写表单信息 4.提交任务 5.查看和分析结果55分析过程(一)1.登陆ncbi的blast主页 2.选择程序,因为 查询序列是蛋白序 列可以选择blastp, 点击进入也可以选择tblastn 作为演示, 我们这里选blastp56分析过程(二)3.填入序列(copy+paste) Fasta格式,或者纯序列 4.选择搜索区域,这里我们要 搜索整个序列,不填 5.选择搜索数据库,这里我们 选nr(非冗余的蛋白序列库)。 是否搜索保守区域数据库 (cdd),蛋白序列搜索才有。 我们选上 57分析过程(三)6.限制条件,我们限制 在病毒里面找。7.其他选项保持默认值打分矩阵58分析过程(四)8.输出格式选项保持 默认值9.点击开始搜索59分析过程(五)10.查询序列的一些 相关信息 在cdd库里面找到 两个保守区域, 点击可以进入60分析过程(六)图形结果61分析过程(七)匹配序列列表62分析过程(八)具体匹配情况63两个保守区域的 信息 返回64cancer genetics web(http://www.cancerindex.org/geneweb/) ? 主要目的是为相关专业人员和研究者提供全面可靠 的与癌症肿瘤相关的突变基因、蛋白质的数据信息。 每个基因都包含着其他基因数据库、参考文献摘要、 其他研究和总结等链接。 ? cancer genetics web的异常基因信息按照三种方式分 类,一种是以异常基因所在的染色体分类,标记了 人类包括性染色体在内的共24条染色体(其中男性 Y染色体,女性X染色体);第二种以基因的名字字 母表分类查询;第三种主要是以相关癌症和肿瘤等 疾病的致病基因分类。cancer genetics web导航――三种检索方式按疾病分类检索选择GSTM1GSTM1检索结果
miRNA预测――主要遵循原则主要遵循以下几个常用原则: ()miRNA 与其靶位点的互补性 ()miRNA 靶位点在不同物种之间的保守性 ()miRNA-mRNA 双链之间的热稳定性 ()miRNA 靶位点处不应有复杂二级结构 ()miRNA 5′端与靶基因的结合能力强于3′ 端.区别:miRNA与mRNA的3’端结合举例:miRanda例如:输入let-7搜索框与let-7对应的物种 是Dme黑腹果蝇输入miRNA信息特征和物种信息 http://www.microrna.org/microrna/home.do搜索结果【view targets】 【view in miRBase】View targets选择第一行的“细节描述”Alignment details返回miRBase―dme-let-7前体信息成熟dme-let-7序列Let-7aLet-7b相关参考文献靶基因的检测方法目前由于miRNA相关研究开展时间不长,可以辅助 或实现miRNA靶基因鉴定的生物实验方法种类不多, 总结起来主要有:DNA微阵列实验(DNA microarray)、 免疫印迹(Western blot)、 报告基因检验(report gene assay)、 靶位点突变实验、 免疫沉淀反应实验(immunoprecipitation,IP)、 蛋白质谱分析实验(mass spectrometry)。与miRNA靶基因的预测方法相比, 对miRNA靶基因进行实验验 证的方法并不多, 目前还没有一个快速、简便、高通量的鉴 定方法.靶基因的检测方法? 最直接的鉴定方法是, 利用荧光定量PCR 及Western blot 方法 分别检测转染(水平升高)或敲低(水平降低)miRNA后细胞中 mRNA 水平及蛋白水平的变化, 从而确定miRNA与靶基因的对 应关系. 这种方法能够直接鉴定出miRNA 的靶基因, 准确度高 但不能鉴定miRNA 的靶位点. ? 目前最为常用的miRNA 靶位点鉴定方法是荧光素酶报告基因 法. 其基本原理是首先构建荧光素酶表达载体, 将希望鉴定的 miRNA 靶基因的3′UTR 构建到荧光素酶基因的3′UTR 中, 之 后将构建好的载体转染细胞并改变细胞中相应miRNA 的表达 水平,最后检测荧光素酶的表达情况以分析转染3′UTR 中是 否含有miRNA 的靶位点.(荧光素酶表达量与荧光水平相关)DNA microarray? DNA microarray是最为常见的观测miRNA对活性样本影响的生 物学实验手段。首先,将生物样本(如成长过程中的细胞) 一分为二,其中一份样本正常生长,而在领一份样本中通过 加入过量miRNA(Over-express)或减小miRNA含量(Knock Down、 Knock Out)的方法人为改变观测的miRNA的表达水平。在此 基础上分别用microarray检测两个样本中mRNA的浓度,并进行 比较以评估miRNA的作用。 ? microarray可以一次性检测过万个基因的转录水平,有着很大 的吞吐量。加上技术成熟且成本相对较低的优点,microarray 实验成为miRNA靶标预测的重要手段。 ? 但是由于它的检测目标是mRNA的浓度,无法直接观测到 miRNA对蛋白质的影响,而在高等动物中,miRNA的最主要功 能恰恰是翻译的抑制、而非mRNA的降解,因此无法对靶基因 识别做出判别性的结论。*吞吐量:单位时间内成功传输数据的量*/biology/class18/70302.shtml免疫印迹(Western blot)? 免疫印迹(Western blot)是对目标蛋白质进 行定性或半定量分析的一种方法。简单来说, Western blot利用电泳现象根据分子量大小分 离蛋白质,再通过对应抗体对靶蛋白的特异性 进行检测,从而推断目标蛋白质的大致含量。 ? Western blot成本较低、技术成熟,因此常用 于检测miRNA对特定蛋白质的影响,但由于其 原理的限制,一般用于检验单个蛋白质的含量, 而无法进行大吞吐量的靶标鉴定。靶位点的突变实验靶位点的突变实验: 是人为地讲3'UTR中可疑的靶位点序列改变或 去除,然后根据改变前后miRNA对基因表达的 影响程度不同进行判定。靶位点突变实验同 样具有针对性强、置信度高的特点,而且被 用作miRNA靶标鉴定以绑定点鉴定的判定实验, 但吞吐量小也是其不可克服的不足。蛋白质质谱分析实验? 蛋白质质谱分析实验(mass spectrometry)是用酶将蛋白质切 成小段的蛋白质肽链,加载电荷后通过电场到达接收板形成 质谱信号。由于不同荷质比粒子在电场中运行轨迹的不同, 各肽链到达接收板的时间和落点均有所不同,据此可以鉴定 出肽链碎片的质量,并进一步辨别出原始蛋白质的种类和含 量,通过miRNA表达前后蛋白质数量的变化,可得到相关信息 进行进一步的靶基因鉴定。? 蛋白质质谱分析实验可一次性检测上千种蛋白质的含量,有 着客观的吞吐量,可以为靶基因鉴定提供有力的证据;但质 谱实验所检测到的蛋白质含量的变化,可能是受整个生物调 控系统调控的结果,而非miRNA的直接作用,因此也不具判决 性;此外,质谱实验成本极高,对其数据的分析仍然处于起 步阶段,因此直到近期仅发现一篇将其用于靶基因鉴定的文 章,短时间内发范围开展相关研究的难度较大。总结? 在目前靶基因鉴定的生物学实验中,判决性实验的 吞吐量太小,根本无法实现大批量的靶基因鉴定; ? 而大吞吐量的实验置信度较低,只适合参与缩小靶 基因范围的辅助型工作。 ? 总体来看,生物实验成本高、耗时长,对实验人员 的技能水平也有很高的要求;且生物实验的可重现 性有限,条件、设备的不同均会对结果产生较大的 影响。 ? 因此,在miRNa靶基因鉴定领域,生物学家对新型 靶基因鉴定实验不断进行开发的同时,生物信息学 家也在积极尝试探索靶基因预测这一问题的解决方 案。研究思路 如何写论文?例如:一.某种功能基因二.microRNA结合位点SNP 三.与疾病的关联特征数据库数据提取流程图可以作为信息检索 的思路microRNA靶序列SNP的检索与分析步骤具体实施1.寻找相关基因:BRCA1 2. http://www.ncbi.nlm.nih.gov/projects/SNP/SNP的筛选1.SNP的筛选: NCBI Genebank、UCSC genome、dbSNP、 dbTSS、peseudogene、transfacmiRNA特征信息基因座的选择――Hapmap?(www.hapmap.org)人类基因组计划的主要 目的是对人基因组多态性和连锁不平衡的模式 进行整体的分析,发布相关数据,并利用该数 据指导人全基因组的标签SNPs的选择。 ?国际HapMap协作组遵循尽可能快的发布数据 的政策,以期为众多的研究者提供帮助。协作 组期望该计划产生的数据能被应用于多个方面, 如开发新的分析方法,理解多态性、连锁不平 衡和单体型联合的模式,以及指导用于定位疾 病相关基因的分子标记的选择。因此,协作组 承诺这些数据可被任何人以任何目的的使用。microRNA相关变异数据库系统性的microRNA靶序列SNP与肿瘤的关联研究需要全面的生物 信息学检索和分析。近年,microRNA相关变异的数据库有了较大 的发展以 “Patrocles” (http://www.patrocles.org/Patrocles.htm)和 “polymiRTS (Polymorphism in microRNA Target Site)” (http://compbio.uthsc.edu/miRSNP/)为代表的数据库都收录了大量 的microRNA靶序列SNP的信息; “miRanda”数据库能够检索miRNA与特定序列结合与否,以及结 合自由能等信息; “RNAhybrid”数据库可以构建microRNA与其靶序列的结合模式图; “dbSNP”数据库可以检索SNP相关的频率信息; “Pubmed”数据库可以检索靶基因与肿瘤的关联情况。 这些数据库的综合运用可以对microRNA靶序列单核苷酸多态 性进行深入的生物学分析。microRNA相关SNP主要包括三个部分,即 miRNA基因自身SNP,,miRNA靶序列SNP和 miRNA合成通路相关基因SNP。 其中有些单碱基替换在正常人群中也有分布, 分布频率&0.01的单碱基变化成为SNP。 使用到的软件:Snapshot检 索 与 分 析 步 骤 第 一 步共5033,为基准 选取当前microRNA靶序列变异数据库中 最权威的两个数据库Patrocles和polymiRTS, 进入第二步搜索 检索全基因组的microRNA靶序列SNP。按 1742个validated SNP(每页显示100个) 照检索结果,以其中较为保守的数据库为 基准数据库,另一个数据库为参考数据库。 利用基准数据库检索,在设定种子区类型 的条件下,检索全部microRNA种子区结 共16300,为参考 合序列内已确认(Validated)的SNP。――检 索 与 分 析 步 骤 第 二 步利用dbSNP数据库 (http://www.ncbi.nlm.nih.gov/projects/SN P/),获得上述全部SNP的频率(MAF) 信息、野生型等位基因信息(RefSNP)和 SNP周边序列信息。按照预先设定的频率 标准筛选上述SNP,例如设定的频率标准 是:每个SNP有三种基因型(genetype) 存在,且最少基因的频率&=0.05。在基因 型频率方面,首选中国北京人的频率 (HapMap-HCB),在没有中国北京频率的 情况下,参考亚洲人群频率数据(Asian)。――检 索 与 分 析 步 骤 第 三 步利用pubmed数据库,检索上述SNP所在 基因是否与肿瘤发病或预后相关,在 pubmed数据库中使用检索词“靶基因 名称”+“cancer”,检索全部相关论文, 阅读论文摘要(或全文),保留与肿瘤 有明确关联的靶基因的SNP。 以TTLL 10(基因:见上图)和breast cancer在Pubmed搜索 No items found――检 索 与 分 析 步 骤 第 四 步按照同一基因上高频率(高MAF?)靶序 列SNP的数量对靶基因分组,即分为包 含单个靶序列SNP的基因和包含多个靶 序列SNP的基因,统计各组靶基因的数 量和构成情况。――检 索 与 分 析 步 骤 第 五 步针对包含多个microRNA靶序列SNP的基 因,利用DIANA microT,RNA22和 RNAhybrid等软件分析每个靶序列SNP的 功能类型,描述同一基因上多个靶序列 SNP的组合模式。(熟悉软件操作)――检 索 与 分 析 步 骤 第 六 步将基准数据库检索获得的全部肿瘤相关 基因microRNA靶序列SNP与参考数据库 对比,选取重复的SNP,统计两个数据 库的重复率。――检 索 与 分 析 步 骤 第 八 步对上述两个数据库重复预测的SNP进行 功能分型,即按照该SNP对microRNA结 合靶基因的影响分类,统计各类的数量 和比例。――检 索 与 分 析 步 骤 第 七 步选取具有特殊模式或重要功能 的典型靶序列SNP进行深入分析。――