核苷酸序列测定的方法

测定多肽的序列变体的方法
专利名称测定多肽的序列变体的方法
测定多肽的序列变体的方法本文报道了测定多肽的序列变体的方法,所述方法包括胰蛋白酶消化多肽,片段的色谱分离,经分离的片段的高分辨质谱分析以及测定序列变体。
背景技术蛋白质在当今的医药组合中起重要的作用。对于人类应用,每种治疗性蛋白质必须符合不同的标准。为了保证生物药剂对人的安全性,治疗性蛋白质的特征必须在某些限制之内,并且特别地必须移除在生产过程中积累的副产物。与想要的形式不同的、多肽的氨基酸组分和序列的任何改变和修饰被分别定义为序列变体。这能够是导致氨基酸序列改变的核酸突变、不想要的翻译后修饰(PTM)或异常的多肽变体(缩短的或伸长的形式)的。为了保证多肽的一致性并且避免错误,必须评估生物学机制(例如复制的保真 性,转录和翻译的准确性)和技术方法(细胞系发展中的转染和扩增以及发酵条件)对序列变体的存在的影响。也必须提供这样的方法,所述方法为发现和鉴定潜在的序列变体提供高敏感性。例如,细胞系发展方法能够导致序列变体,所述序列变体可分别成为对细胞系转换和克隆变化关键的。在意外缺少饲养基质中的某些基质成分下的发酵和下游加工(DSP)可分别导致序列变体或氨基酸的翻译后修饰。因此,必须检查序列变体的存在以验证产品的同质性和一致性。Barnes, C. A. S.,等,Mass. Spectrom. Rev. 26 (8 报道了质谱法用于重组蛋白药物的结构性表征的应用。由Zhang, Z.,等,在Mass. Spectrom.Rev. 28(6中报道了质谱法用于治疗性抗体的结构性表征。Yu,X. C.等(Anal.Chem. 81 (90)报道了通过高分辨质谱法鉴定重组单克隆抗体中密码子特异性的丝氨酸到天冬酰胺的错翻译。Houde, D.,等,J. Chromatogr. ) 189-198报道了通过质谱法测定蛋白质氧化以及转移到质量控制的方法。发明概述本文提供了用于测定氨基酸序列变体(即多肽的氨基酸序列中的突变)的方法。也能够随其间接地测定核酸序列变体。更详细地本文报道了测定(生产的)多肽中的氨基酸序列突变的方法,所述方法包括下述步骤a)提供(生产的)多肽的样品,b)用蛋白酶孵育样品中的多肽,c)使用与肽的氨基酸序列片段的高分辨质谱法(FT-ICR/FT-轨道阱)和MS/MS分析偶联的逆相色谱实施二维分析,d)通过搜索在给定的保留时间的信号强度的差异并且通过评价关于氨基酸序列突变的差分信号,通过一起比较样品获得的LC-MS数据集与参考样品的数据集进行数据评价。用于数据评价(步骤d)的参考样品能够是良好表征的标准或者是待分析的样品中的一份。本文报道的第一个方面是测定氨基酸序列变体、特别地多肽的氨基酸序列中的氨基酸突变的方法,所述方法特征在于包括下述步骤a)提供多肽的至少两份样品,
b)用蛋白酶孵育样品,c)通过包括逆相色谱分离和质谱法分析和/或MS/MS分析的组合的二维数据分析,分析经孵育的样品,d)将在步骤c)中用一份样品获得的数据集定义为参考样品,并将在步骤c)中用其他样品获得的数据集与参考样品的数据集比较,由此测定的每个差异是多肽的氨基酸序列变异(突变)并从而测定多肽的氨基酸序列变体。本文报道的另一个方面是测定多肽的氨基酸序列中的氨基酸序列突变的方法,所述方法特征在于包括下述步骤a)提供多肽的至少两份样品,b)用蛋白酶孵育样品,c)通过包括逆相色谱分离和质谱法分析和/或MS/MS分析的组合的二维数据分析,分析经孵育的样品,d)将在步骤c)中用一份样品获得的数据集定义为参考样品,并将在步骤c)中用其他样品获得的数据集与参考样品的数据集比较,由此测定的每个差异是多肽的氨基酸序列突变并从而测定多肽的氨基酸序列突变,或下述步骤a)提供多肽的至少一份样品,b)用蛋白酶孵育样品,c)通过包括逆相色谱分离和质谱法分析和/或MS/MS分析的组合的二维数据分析,分析经孵育的样品,d)将在步骤c)中用样品获得的数据集与用如步骤b)和c)中报道的方法测定的参考样品的数据集比较,由此测定的每个差异是多肽的氨基酸序列突变并从而测定多肽的氨基酸序列突变。提供的样品可源自通过编码多肽的核酸的瞬时转染获得的不同的克隆,或源自稳定转染的细胞系,或源自不同龄、或不同的发酵规模、或在不同条件下进行的发酵的细胞系。在一种实施方案中提供从2至10000份样品,在另一种实施方案中提供从2至1000份样品,还在另一实施方案中提供从2至348份样品。在一种实施方案中方法还包括步骤e)通过MS/MS碎裂和数据分析测定氨基酸序列变化(突变)的身份和位置。在另一实施方案中,提供额外的样品,所述额外的样品包含用具有已知的氨基酸序列变异(突变)的多肽掺料(spike)的多肽。除了提供的样品,孵育、分析并比较额外的样品。在一种实施方案中,分析在少于8. 0的pH值下和在少于40°C的温度下实施。这些条件降低了方法诱导的氨基酸序列改变。在其他实施方案中PH值为从pH 6. 5到少于pH8.0。在另一实施方案中,温度为从20°C至40°C。在另一种实施方案中,在三(羟甲基)氨基甲烷缓冲液中提供样品,用于酶促消化。还在另一实施方案中,用蛋白酶孵育样品是通过蛋白酶将多肽切割为长度从3至60个氨基酸残基的片段。在一种实施方案中,步骤d)中的比较是用一种、或一些、或全部MS-电荷状态的数据实施的。在其他实施方案中,比较包括将参考样品和每份其他样品的质谱法总离子色谱图(MS-TIC)覆盖,由此计算全部覆盖的和对准的质量的强度比率,并且必须认为具有多于、10的比率的峰是氨基酸序列变异(氨基酸序列突变)。还在其他实施方案中,比较还包括将DNA翻译的蛋白水解的片段肽模式与样品的质谱法总离子色谱图(MS-TIC)比较。对于氨基酸序列变体(氨基酸序列突变)搜索被研究的多肽的编码核酸序列中的单碱基替换、缺失和插入是允许的,在计算机芯片上(in silico)翻译并用与方法中使用的相同的酶在计算机芯片上消化获得的序列。随后,通过匹配肽的实验测定的MS/MS片段波谱与衍生自前文描述的计算机方法的肽的理论MS/MS波谱鉴定氨基酸序列变体(氨基酸序列突变)。
在其他实施方案中,多肽是完整的免疫球蛋白、免疫球蛋白片段,或免疫球蛋白缀合物。在另一实施方案中,样品中的多肽是还原的并且在用蛋白酶孵育之前,自由的巯基残基被羧甲基化。在根据本文报道的方法的步骤中,全部分别地处理样品,即单独地并不作为混合物处理。在一种实施方案中在还原步骤、孵育步骤,和分析步骤中单独处理样品。在一种实施方案中方法是用于高通量测定的方法。在一种实施方案中,用蛋白酶孵育样品16小时至18小时并随后立即添加甲酸或三氟乙酸。在其他实施方案中,用蛋白酶孵育样品4小时并随后立即添加甲酸或三氟乙酸。
本文报道的另一个方面是生产多肽的方法,所述方法包括选择生产多肽的细胞,其中多肽分别包含全部经处理的样品中的最小数目和最小比率的氨基酸序列变异(即氨基酸序列中的突变)。本文报道的另一个方面是生产多肽的方法,所述方法包括选择生产多肽的细胞,其中多肽不包含可检测的氨基酸序列突变(变异)。在一种实施方案中,最小数目和最小比率的氨基酸序列变异(氨基酸序列中的突变)分别是关于参考样品或预先测定的氨基酸序列测定的。在一种实施方案中,方法包括步骤为a)提供包含编码多肽的核酸的至少两种细胞,b)单独保藏和培养细胞,c)用单独保藏的细胞实施如本文报道的方法,d)选择生产多肽的细胞,其中多肽包含最小数目,和/或最小比率的氨基酸序列变异(氨基酸序列突变),e)培养选择的细胞,f)通过从细胞或培养基回收多肽来生产多肽。在一种实施方案中,提供的细胞选自瞬时转染的细胞,或稳定转染的细胞,或从免疫后的动物获得的免疫细胞。发明详述治疗性蛋白质(例如由重组方法生产的)可为具有稍微不同的氨基酸序列的分子的混合物,其中差异不仅在氨基酸序列的C-或N-端而且也在氨基酸序列内(例如,氨基酸突变、交换,氧化或硫醚形成)。通过肽作图方法学能够用本文报道的方法检测氨基酸序列突变(变异)。例如,这些氨基酸序列突变(变异)可在下述期间出现i)由于核酸聚合酶的错误在核酸复制期间,ii)由于RNA聚合酶或剪接装置的错误在核酸转录期间,或iii)由于获取错误的t-RNA或由于装载错误的氨基酸的t-RNA在蛋白质翻译期间,或iv)由于非计划的翻译后修饰或信号肽的非完全移除。因此,氨基酸序列突变(变异)能够起因于编码各自多肽的DNA的整合/扩增过程,或起因于编码核酸的复制,或包括转录后修饰(例如在mRNA剪接或RNA编辑期间)的转录或在翻译期间。起因于分子从核糖体释放后的个体氨基酸残基的修饰的氨基酸变异被定义为未必非计划的翻译后修饰并且非本文所称的突变(变体)。从文献中知晓真核生物(以及原核生物)酶具有平均错误率为复制正常的聚合酶-1/108至IO12个复制的核酸碱基,易错的聚合酶-1/101至IO3个复制的核酸碱基;转录1/104至IO5对转录的核酸碱基对;翻译1/103至IO4个并入的氨基酸残基。这显示在一方面在复制步骤期间通过易错的聚合酶诱导的错误率以及在另一方面在翻译期间的错误率具有最大的影响力,特别地与施加于细胞的“胁迫”(例如在转染之 后的选择过程或存在选择剂时的生长)组合时。在翻译期间额外的突变是统计学事件而在复制期间突变将导致具有稳定定位/座位的单个事件。换言之,在复制期间的错误将导致位置特异性的和可重复的氨基酸序列突变(差异),而转录和翻译错误能够导致非位置特异性的氨基酸突变(变异)和这些改变在整个分子上的统计学分布。最后,用于获得重组细胞的包括整合入基因组的转染方法能够导致至多I %改变的DNA (见例如Lebk0Wski,J. S.,等人,Mol. Cell Biol. 4(-1960)。这将导致频率至多I
100的先于复制的位置特异性的突变(变异)。本文报道了样品制备、数据收集和评价方法,所述方法使用二维数据分析,其包括为了证明正确的多肽的成分和氨基酸序列的、具有最高的可能的序列覆盖度的基于LC-MS/MS的肽作图,以及潜在的突变体氨基酸序列(变体)对非突变体氨基酸序列(非变体)的相对定量。必须指出本文报道的方法使用成片段的蛋白质代替完整的和完全的蛋白质用于分析。这增加了方法检测非常低水平的突变的敏感性。这也避免了干扰并且避免了需要区分和分辨对于可能的突变的等压质量。对于测定氨基酸序列突变(变异)两种不同的起始位置是可能的情况A :如果已经表征的样品是可获得的,这能够被选择为参考样品并且能够将待测定的样品与其比较使用已知的肽模式和峰排布(assignment)作为参考并且样品中每个检测到的差异能够是氨基酸序列突变(变异)。此类参考物质可为来自良好表征的细胞系(例如来自规定的发酵方法)的物质。情况B :如果没有已经表征的样品是可获得的,那么a)对于峰排布能够实施一份样品的完全表征并且能够应用/遵循情况A(情况B-1);或b)将一份样品任意选择为参考样品(情况B-2)并且将剩余的样品与其比较;这包括在参考样品以及非参考样品两者中都测定差异(即突变)参考样品可来自不同的细胞系,或细胞系世代,或培养规模,或在改变的/不同的培养条件下(比如,例如基质成分)获得。在一种实施方案中,如果必须分析大量样品,任何样品能够被选为参考样品并且能够根据测定的氨基酸序列突变(变异)对全部其他的样品分组。之后在每组中实施详细的表征。在本文报道的全部方面的一种实施方案中多肽是完整的免疫球蛋白,或免疫球蛋白片段,或免疫球蛋白缀合物。一般方法学用蛋白酶(例如,胰蛋白酶)消化含有待分析的多肽的样品,获得特征氨基酸序列片段(肽)。在一种实施方案中,氨基酸序列片段大小为从3或4个氨基酸残基开始并且至多60个氨基酸残基长。在第二个步骤中,使用傅里叶变换离子回旋共振(FT-ICR/FT-轨道阱)技术和通过碰撞诱导的分离(CID)在质谱仪中对获得的氨基酸序列片段进行质谱法(MS/MS)分析,实施与高分辨质谱法(MS)耦合的氨基酸序列片段的色谱分离(逆相高效液相色谱,RP-HPLC)。这是二维数据分析。由于分析的两个维度,即时间对质量,能够获得改善的分辨率。二维分析也允许能够接受MS分析之前的液相色谱分离的低分辨率,由于能够在MS分析期间分辨重叠的峰。此后比较获得的HPLC-MS数据集,即,比较样品的氨基酸序列片段洗脱模式和质量比电荷(m/z)模式,并且通过分析MS/MS片段波谱实施突变(即差异)鉴定。如果实施 基于参考样品的分析,除了检测含有氨基酸序列突变(变异)的氨基酸序列片段和它们的相对的定量外,必须实施氨基酸片段鉴定、峰排布和/或序列覆盖度测定。在一种实施方案中,多肽是免疫球蛋白或非免疫球蛋白多肽。使用本文报道的方法,能够测定样品的成分和其中具有氨基酸序列突变(变异)的分子的部分。通过将实验测定的质谱法碎裂数据和理论氨基酸序列片段质量匹配也能够实施样品一致性的定量测定,所述理论氨基酸序列片段质量是通过多肽和其变体的计算机蛋白质水解消化以及随后的碰撞诱导的碎裂的模拟获得的。最后能够获得并通过人工数据评价验证具有被提出的突变(变异)的序列和突变(变体)位置。一旦已经鉴定氨基酸序列突变(变异),通过使用一种,一些,或全部MS-电荷状态的数据,能够相对于未经修饰的氨基酸序列对其定量。已经发现通过采用掺料(spiking)实验,本文报道的方法的总检测限制为至少0. 1-1.0%的突变体氨基酸序列(变体)。进一步发现在一方面在样品制备期间,为避免脱酰氨作用(即方法诱导的修饰),避免碱性PH值和高温度是有利的。因此在本文报道的方法的一种实施方案中在中性和弱碱性pH范围(即在低于pH 8.0和高于pH 6. 5的pH值下)并且在适度温度下(即温度低于40°C)实施方法。进一步发现在一种实施方案中,通过使用三(羟甲基)氨基甲烷缓冲液代替通常用于质量分析的碳酸氢铵缓冲液,获得了较少的方法依赖性的假象(artifacts)。本方法使用LC-MS数据集用于测定并且允许检测和鉴定样品多肽的胰蛋白酶消化物中的一种或多种氨基酸突变(变异)。MS/MS数据能够用于鉴定,并且“错误容忍搜索(error-tolerant-search) ”方法基于单个核酸交换、插入或缺失鉴定氨基酸序列突变(变异)。类似地也能够鉴定片段和其他一些已知的修饰。这种比较性方法能够显著地降低分析所需要的时间,因为仅须具体地分析差异。此外,如果选择,仅须分析一次参考样品。如果许多突变(差异)存在于样品中,能够按照修饰对这些进行分组,并且能够分析每组的代表性样品。详细方法在下文描述了本文报道的全部方法的具体的实施方案。能够通过添加二硫苏糖醇(DDT)还原样品。也能够通过碘乙酸来羧甲基化自由巯基残基。此后能够交换样品缓冲液并为了酶促消化进行调整。能够过夜酶促消化样品(16至18小时)并且能够通过添加三氟乙酸终止消化。能够对经消化的样品进行RP-HPLC分离和经分离的氨基酸序列片段的高分辨质谱分析(使用例如FT-ICR/FT-轨道阱质谱仪)。如本文所用术语“数据集”指通过为了生成带电的分子或带电的片段,而电离样品中含有的经消化的和时间分辨的氨基酸序列片段,在色谱洗脱期间在质谱仪中获得的时间分辨的质量与电荷的比率。数据集至少包含通过碰撞诱导的亲体分子的解离获得的质谱总离子色谱图(MS-TIC)和串联质谱数据(MS/MS-数据)。情况A:—起分析待评估的样品与可获得的参考样品。每份样品和参考样品应当至少测定两次。作为阳性对照,将与参考样品相似的样品(即含有一种或两种氨基酸序列突变(变异))掺料至参考样品并且用作人工突变体氨基酸序列(变体)。在一种实施方案中人工突变体氨基酸序列(变体)以0.5% (w/w)掺料至参考样品,用于验证方法的总体敏感性。为了建立分析方法的参数,能够比较用参考样品(即没有突变(修饰)或有已知的突变(修 饰)模式的重组生产的多肽),和用与具有人工氨基酸序列突变(变体)的突变体氨基酸序列掺料的参考样品获得的结果。使用这些参数能够实施下文的分析。为了测定,能够覆盖参考样品和待分析的样品的总离子色谱图(TIC)并且能够比较在给定的保留时间的相应的质量信号的信号强度(即保留时间和质量相关的)。因此,在一种实施方案中分析和/或测定是二维分析,其使用根据色谱图的保留时间和质量(m/z值)的分离。能够计算全部覆盖的/对准的质量的强度比率,即样品的信号强度与参考样品的信号强度的比率。能够将此比率对保留时间作图,其中a)用约I的值表不在参考样品和样品中具有相同质量和相同强度的峰,由此用大于I的值表示在待分析的样品中更频繁出现的质量。b)鉴定具有多于I的值,在一种实施方案中具有多于3、或多于10、或多于100的值,在一种实施方案中具有从10至5 * IO9的值,在另一实施方案中具有从100至5 * IO9的值的全部质量,其中使用对应于亲体质量的全部MS/MS波谱用于鉴定并且也考虑不同的电荷状态。c)通过使用质谱中一种、或一些,或全部电荷状态,能够进行突变体氨基酸序列(变异)的彼此相对的定量,其中对于天然氨基酸序列和突变体氨基酸序列(变体)选择相同的电荷状态,生成提取离子色谱图(EIC)并且根据下述公式彼此相对地定量EIC中彼此对应的峰曲线下的面积
-------^-----------*突变体氨基酸序列
天然氨基酸序列+突变体氦基酸麵在一种实施方案中,用于分析的m/z窗口是各自的质量加/减I. 6amum/z。为了确保能够及时处理数据在一种实施方案中将2. 5或3的比率设定为阈值,即不分析低于该限制的全部比率。情况B 在这种情况中没有已经表征的样品。对于待分析的样品中的一份(在这种情况中必须具有多于一份的待分析的样品),能够实施TIC中全部测定的质量与理论测定的肽模式对准,即能够实施峰排布(用预先测定的蛋白酶用于消化)。对于正确的对准重要的一方面是准确的质量而另一方面是用于确认建议的肽的序列的MS/MS片段覆盖度。在一种具体的实施方案中,能够通过对每个天然氨基酸序列的计算的理论质量分别加上或从其中减去起因于核酸突变(即导致氨基酸序列差异的碱基三联体(密码子)中的单个核苷酸替换、缺失或插入)的质量差异,通过错误容忍搜索鉴定氨基酸序列突变(变异)。随后,必须通过MS/MS-碎裂模式验证建议的氨基酸序列突变(变异)。因此在MS/MS-分析中,片段的质量必须不仅包括氨基酸序列突变(差异)的身份而且包括氨基酸突变(改变)的位置。然而,LC-MS数据集的完整的峰排布是不必要的并且仅能够分析差异。所有剩余的样品能够与按上文所述分析的样品比较。通过使用质谱中一种、或一些,或全部电荷状态,能够实施突变体氨基酸序列(变异)的彼此相对的定量,其中对于每个天然氨基酸序列和突变体氨基酸序列(变异)选择相同的电荷状态,能够生成提取离子色谱图(EIC)并且根据下述公式彼此相对地定量EIC 中彼此对应的峰曲线下的面积
__iff,............................................................ 突变体氨慕酸序列
天然氨基酸序列+突变体氨基酸序列使用本文报道的方法,鉴定低至亚-百分数(sub-percentage)范围的氨基酸序列突变(变体)的方法是可获得的。取决于氨基酸序列片段的本性,测定总体敏感性为至少约0.5%。在某些情况下敏感性能够低于0.5% (例如对于具有好的色谱分析和/或电离性质的氨基酸序列片段)。在个案研究中能够检测0. 1%和10%之间的变异,在一些情况下低至0. 02%。这能够例如通过达到显著的和可靠的结果所需要的规定的组合的软件工具的实现。在检测氨基酸序列突变(变异)的情况中,能够通过验证检测或通过下述排除假阳性结果-从肽图离析含有氨基酸序列突变(变异)的多肽并且实施Edman测序,-合成具有氨基酸突变(变异)的肽并且将其掺料入多肽,用于验证保留和MS/MS谱的MS和MS/MS分析,-通过生产各自样品的细胞克隆的DNA测序验证存在,-用不同的蛋白水解酶消化并分析以此获得的片段。掺料实验实例用使用具有氨基酸序列突变(变异)的第二个mAb以多种比率(即以多种浓度)掺料的模型多肽(单克隆抗体(mAb))实施具有突变(变异)的多肽的检测的敏感性评价。在一个实例中,以1% (w/w)对具有氨基酸序列突变(变异)的HlAb掺料,即预期通过本文报道的方法鉴定出两种不同的多肽。mAb LC 肽 XXIXXXX突变体mAb LC 肽 XXVXXXXmAb HC 肽 XXXXXXXXXXTXXXXX突变体mAb HC 肽 XXXXXXXXXXIXXXXX在第二个实例中,以相异的比率(0. 5-10% )将突变体(变体)mAb掺料至mAb,SP预期17个不同的突变体(变体)肽。因此,本文报道了用于测定具有突变体氨基酸序列的多肽的方法,所述方法特征在于包括下述步骤a)提供多肽的至少两份样品,b)用相同的蛋白酶孵育每份样品,c)使用逆相液相色谱分离,和质谱分析和/或MS/MS分析的组合,通过二维数据分析来分析经孵育的样品,d)将在步骤c)中用一份样品获得的数据集定义为参考样品,并将在步骤c)中用 其他样品获得的数据集与参考样品的数据集比较,其中测定的每个氨基酸序列差异是多肽的氨基酸序列突变,并从而测定了具有突变体氨基酸序列的多肽。在一种实施方案中,具有多于3的样品质谱信号强度与参考质谱信号强度的比率的每个氨基酸序列差异是氨基酸序列突变。在其他实施方案中在分析中使用的m/z框宽度为1.6或更多。在其他实施方案中方法还包括步骤e),所述步骤e)通过MS/MS分析测定氨基酸序列中氨基酸突变的身份和位置。也在一种实施方案中提供包含用具有已知的氨基酸序列突变(变异)的多肽掺料的多肽的其他样品,并且除了提供的样品外,孵育和分析以及比较所述其他样品。在一种实施方案中,分析在少于8.0的pH值下和少于40°C的温度下实施。在另一种实施方案中,在三(羟甲基)氨基甲烷缓冲液中提供样品。还在一种实施方案中,用蛋白酶孵育样品是通过蛋白酶将多肽切割为长度从3至60个氨基酸残基的氨基酸序列片段。还在一种实施方案中步骤d)中的比较是用一种或一些或全部MS电荷状态的数据实施的。在一种实施方案中多肽是免疫球蛋白,免疫球蛋白片段或免疫球蛋白缀合物。在另一实施方案中用蛋白酶孵育样品16小时至18小时,其后添加甲酸或三氟乙酸。在其他实施方案中用蛋白酶孵育样品4小时,其后添加甲酸或三氟乙酸。还在一种实施方案中比较包括覆盖参考样品的和每份待分析的其他样品的质谱总离子色谱图(MS-TIC),由此计算全部覆盖的和对准的质量的强度比率,其中具有多于3,特别地多于10的比率的峰被评价为氨基酸序列突变。还在另一种实施方案中比较还包括比较理论的氨基酸序列的DNA翻译的蛋白水解片段肽模式和待分析的样品的总质谱离子色谱图(MS-TIC),并且通过对每个理论氨基酸序列的计算的理论质量分别加上或从其中减去起因于具有氨基酸改变的碱基三联体(密码子)中的核酸突变、缺失或插入的质量差异,鉴定氨基酸序列突变。本文报道的其他方面是生产多肽的方法,所述方法包括下述步骤-选择生产多肽的细胞,其中多肽分别包含全部加工的样品的、或关于参考样品或用本文报道的方法预先测定的氨基酸序列的最小数目或比率的氨基酸序列突变。本文报道的一方面还是生产免疫球蛋白的方法,所述方法包括步骤为a)提供包含编码免疫球蛋白的核酸的至少两种细胞,b)单独保藏并培养细胞,c)实施如本文报道的方法,d)选择生产免疫球蛋白的细胞,其中免疫球蛋白分别包含关于参考样品的最小数目或比率的氨基酸序列突变,e)培养细胞,f)通过从细胞或培养基回收多肽来生产多肽。
提供下述实例、序列表和附图以帮助理解本发明,本发明真正的范围如所附权利要求中示出。应当理解能够对示出的方法进行修饰而不偏离本发明的精神。序列表描沭SEQ ID NO 01抗-CCR5抗体重链可变结构域I。SEQ ID NO 02抗-CCR5抗体轻链可变结构域I。SEQ ID NO 03抗-CCR5抗体重链可变结构域2。SEQ ID N0:04抗-CCR5抗体轻链可变结构域2。SEQ ID NO 05抗-CCR5抗体重链可变结构域3。SEQ ID NO 06抗-CCR5抗体轻链可变结构域3。
SEQ ID NO 07 人 IgGl 恒定区。SEQ ID NO :08 人 IgG4 恒定区。SEQ ID N0:09人k轻链恒定结构域。SEQ ID N0:10人入轻链恒定结构域。附图描沭图I依赖于数据获取的MS/MS波谱的扫描事件循环的代表性时间顺序;缩写FTICR-傅里叶变换离子回旋共振;LIT-线性离子阱;CID-碰撞诱导的解离;RP_分辨本领;SID-源诱导的解离。图2在LTQ FT ICR(Thermo Scientific)上获得的来自参考抗-CD19抗体(参考)和样品抗-CD19抗体(样品)的胰蛋白酶消化的肽图的总离子色谱图。图3通过主峰的保留时间对准的LC-MS色谱图的覆盖。数据来自两份抗-CD19抗体(参考和样品)的胰蛋白酶消化的肽图。A和B是每者两次重复的平均TIC谱。图4显示样品和参考抗-⑶19抗体间差异的散点图。图5图4放大。图6样品抗-CD19抗体HC氨基酸序列片段的分配的MS/MS波谱(双倍带电的亲本离子的碰撞诱导解离的I—离子系列和b-离子系列)。以粗体字显示氨基酸序列变体的特征MS/MS片段。图7样品抗-CD19抗体LC氨基酸序列片段的分配的MS/MS波谱(双倍带电的亲本离子的碰撞诱导解离的I—离子系列和b-离子系列)。以粗体字显示氨基酸序列变体的特征MS/MS片段图8LC-MS样品试验内的天然氨基酸序列的和样品抗-CD19抗体HC氨基酸序列片段的氨基酸序列的提取离子色谱图。定量结果2% (质量百分数)的突变体氨基酸序列(变体)存在于样品中。图9LC-MS样品试验内的天然氨基酸序列的和样品抗-CD19抗体LC氨基酸序列片段的提取离子色谱图。定量结果0. 5% (质量百分数)的突变体氨基酸序列(变体)存在于样品中。附图说明
图10通过主峰的保留时间对准的LC-MS色谱图的覆盖。数据来自两份抗-CCR5抗体(参考和样品)的胰蛋白酶消化的肽图。图11显示参考和样品抗-CCR5抗体间差异的散点图。图12LC-MS样品试验内的天然氨基酸序列的和样品抗-CCR5抗体LC氨基酸序列片段的提取离子色谱图。图13LC-MS样品试验内的天然氨基酸序列的和的样品抗-CCR5抗体HC氨基酸序列片段的提取离子色谱图。实施例I材料和方法 参考和样品的样品制备方法a)还原和烧基化用变性缓冲液(0. 4M Tris-HCl,8. OM盐酸胍,pH 8)稀释最大体积IOOyl的250 u g免疫球蛋白至终体积240 yl。向溶液中添加20 U I 二硫苏糖醇(240mM在变性缓冲液中)并在37°C ±2°C孵育混合物60分钟。此后添加20 U I碘乙酸溶液(0. 6M在纯净水中),用力混合并在室温在黑暗中孵育15分钟。通过添加30 u I 二硫苏糖醇溶液(240mM在变性缓冲液中)终止烷基化反应。b)缓冲液交换使用NAP
G_25脱盐柱,交换包含变性的、还原的、羧甲基化的免疫球蛋白的溶液的300 ill缓冲液(约250iig或3. 2nmol)。简而言之,用包含50mM Tris-HCl,pH 7. 5的IOml缓冲液溶液平衡柱,对柱施用样品,用350 ill先前的缓冲液溶液洗涤柱,并且回收的样品约480 yl。在每个步骤(柱平衡、施用样品、洗涤和洗脱)之间允许溶液完全进入填充柱床。c)酶促消化将48iU胰蛋白酶溶液(0. 2g/l在Tris-HCl中,pH 7. 5)添加至经缓冲液交换的免疫球蛋白溶液并在37 °C在室温孵育约16小时。通过添加20iill0% (v/v)三氟乙酸(TFA)溶液终止消化。LC-MS/MS数据获取方法使用来自Advion BioSciences的纳米ESI离子源作为HPLC和质谱仪之间的接口,通过对胰蛋白酶消化步骤中获得的水解的肽分别进行色谱分离(LC)和随后的MS和MS/MS检测,实施LC-MS/MS分析。用下列参数实施色谱分析HPLC Dionex Ultimate 3000流动速率40ii 1/minUV 检测波长220nm 和 280nm柱温箱温度35 °C样品环路10 ill柱Dionexpep Map C18, 3 U m, 100 A, 1x150mm注入体积10 ill洗脱液A =含有0. 1%甲酸的HPLC梯度级水洗脱液B =含有0. I %甲酸的HPLC梯度级乙腈75分钟内应用的梯度是从5%体积百分数洗脱液B至100%体积百分数洗脱液B。用下述参数实施纳米ESI MS或MS/MS 纳米ESI 源Triversa NanoMate (Advion)
流入质谱仪离子源约200nl/min,由分流器管理气压0.1-0. 5psi应用电压 1.1-1. 7kV阳离子选择的用下列参数实施质谱检测仪器ESILTQ-FT ICR(Thermo Scientific)毛细管温度175 °CMS/MS的离子阱碰撞能量40%管透镜电压100V动态排斥特性启用(重复计数1,排斥持续时间8秒,排斥质量宽度3ppm).在图I中显示了依赖于数据获取的MS/MS波谱的扫描事件循环的代表性时间顺序。MS波谱的数据获取范围是350-2000m/z。根据标准仪器设定使用MS/MS波谱的M/Z范围。每高分辨FT的MS/MS波谱数能够在3和5之间不同。SID扫描对于此类分析是不必要的。实施例2抗-⑶19抗体的参考和样品的分析数据生成已经根据材料和方法部分处理了抗-⑶19抗体的参考和样品。已经根据材料和方法部分获取了 MS数据。数据分析a)使用LC-MS数据集检测参考和样品之间的差异为了比较参考和样品获得的质量谱(总离子色谱图(TIC),见图2)使用SIEVE 软件包(版本I. I. 0,来自Thermo Scientific)。简而言之,通过保留时间(图3)对参考和样品的TIC数据集进行对准,并且比较参考和样品的TIC数据集在低至预先设置的阈值的预先设置的保留时间窗口内的质量峰强度(图4和5)。在表I中列出了根据预先确定的用于评价的参数的参考和样品中不同的质量信号。在参考和样品中以相同的强度存在的质量信号显示比例为I。在样品中比在参考中具有更高强度的质量信号(例如氨基酸点突变)显示比例大于I。通过在样品的给定的m/z对保留时间框中的总体信号强度除以在参考中相应的强度计算比率。如果在参考的给定的m/z对保留时间框中的总体信号强度是0(例如由于数据获取期间的主动噪音降低(activenoise reduction)没有背景信号),比率等于在相应的框中的样品的总体信号强度(例如表I中结果2-10)。表I :具有& 50的比率的全部差分峰的数据1sI S I SS I把車I人二解释
—丁 I" 1061.19~" ~1062779~ ~^ 8^720~385~7..... 400431 ^西.........................................
3,54 36.043 36.343 68943
1.21 36,9 59552
5.72 36.9 55943
.245 36.9 52340
0,56 36.9 52235 ^4 ! A^MSZMS^*
9.19 36.9 45291承 $丨复MS/MS
I2.36 36.9 45107 背3的,
未引发MS/MS
6J3 44.9 36205
7.211 36.9 33871
Tf^0~44.0258"—443258———798~~突变= 3
17—607,21 ~608lT~43.874F—^.1741———571 —突变2^^
8. 44.5013 —2~6i——突变 2;z = 3..............................
14^910.713 912.——443258———'194—突变 2;z = 2
' 609. 44.突变2;z = 3
1. 44.突变2;,z = 2
17—601.538 "603.^^5J276 96未■定
在两个LC-MS
6.659 53.367 53.667 42 试验中都存在但仅具有
稍微不同的IS度
在两个LC-MS
,57 40 试验中都存在但仅具有
稽微不同的玀度
Illlll用于使用SIEVE比较参考和样品LC-MS数据的参数如下框m/z 宽度1. 6
框时间宽度0. 3min.强度阈值10000M/z 开始350M/z 结束2000搜索峰宽度30%保留时间开始5min.保留时间终止60min.已经为区分氨基酸序列差异相关的结果和假阳性(即非氨基酸序列差异相关的结果)优化了这些参数。它们仅需要根据LC-MS数据的实际参数调整,它们是i)色谱图分辨率(框时间宽度),以及ii)使用的仪器的敏感度和背景噪音(强度阈值)另外方法所需的敏感度(例如,用于检测非常低丰度的突变体氨基酸序列(变体))决定了待设置的强度阈值。例如使用LTQ FT ICR仪器已经鉴定了低至0.2%绝对频率的突变体序列(变体)。b)使用MS/MS数据鉴定参考和样品之间的差异为了鉴定发现的差异,使用如先前段落描述的方法首先检查同位素峰簇对于肽是典型的。然后检查各自的m/z信号是否是就生成MS/MS碎裂选择的,并且是否是通过Mascot错误容忍搜索(Mascot ETS)鉴定的。使用获得的MS/MS片段离子波谱,检查并且人工验证由Mascot ETS鉴定的每个暂定的序列变体(见图6和图7)。备选地,如果已经记录了 MS/MS数据并且Mascot ETS并未提出序列,人工或通过使用软件进行从头(de novo)测序。c)经鉴定的突变体氨基酸序列(变体)的定量在含有突变(变异)的(胰蛋白酶消化的)氨基酸序列片段的水平,并且相对于相同样品内的原来的、非突变的氨基酸序列片段对经鉴定的突变体氨基酸序列(变体)进行定量(见图8和图9)。从样品的LC-MS数据生成两幅提取离子色谱图(EIC),一幅是样品的而一幅是参考样品的。提取离子色谱图(EIC)包括各个肽的全部电荷状态和全部同位素峰。使用仪器软件(XCalibur),对由各自的EIC生成的峰积分并且在以下公式中使用据
此计算的面积
1.测定具有突变体氨基酸序列的多肽的方法,所述方法特征在于包括下列步骤
a)提供多肽的至少两份样品,
b)用相同的蛋白酶孵育每份样品,
c)使用逆相液相色谱分离和质谱法分析和/或MS/MS分析的组合通过二维数据分析,分析经孵育的样品,
d)将在步骤c)中用一份样品获得的数据集定义为参考样品,并且比较在步骤c)中获得的其他样品的数据集和参考样品的数据集,其中测定的每个氨基酸序列差异是多肽的氨基酸序列突变,并从而测定具有突变体氨基酸序列的多肽。
2.根据权利要求I的方法,其特征在于具有多于3的样品质谱信号的强度对参考质谱信号的强度的比率的每个氨基酸序列差异是氨基酸序列突变。
3.根据任何一项前述权利要求的方法,其特征在于用于模式比较的m/z框宽度是I.6或更多。
4.根据任何一项前述权利要求的方法,还包括步骤
e)通过MS/MS分析测定氨基酸序列中氨基酸突变的身份和位置。
5.根据任何一项前述权利要求的方法,其特征在于提供其他样品,所述其他样品包含用具有已知的氨基酸序列突变的多肽掺料的多肽,并且除了已提供的样品,孵育并分析并比较所述其他样品。
6.根据任何一项前述权利要求的方法,其特征在于在少于pH8. O的pH值下并且在少于40°C的温度下实施分析。
7.根据任何一项前述权利要求的方法,其特征在于在三(羟甲基)氨基甲烷缓冲液中提供样品。
8.根据任何一项前述权利要求的方法,其特征在于用蛋白酶孵育样品是通过蛋白酶将多肽切割为长度从3至60个氨基酸残基的氨基酸序列片段。
9.根据任何一项前述权利要求的方法,其特征在于步骤d)中的比较是用一种或一些或全部MS电荷状态的数据实施的。
10.根据任何一项前述权利要求的方法,其特征在于多肽是免疫球蛋白、免疫球蛋白片段或免疫球蛋白缀合物。
11.根据任何一项前述权利要求的方法,其特征在于用蛋白酶孵育样品16小时至18小时并且其后添加甲酸或三氟乙酸。
12.根据权利要求1-10中任一项的方法,其特征在于用蛋白酶孵育样品4小时并且其后添加甲酸或三氟乙酸。
13.根据任何一项前述权利要求的方法,其特征在于比较包括将参考样品和每份待分析的其他样品的质谱总离子色谱图(MS-TIC)覆盖,以此计算全部覆盖的和全部对准的质量的强度比率,以此将具有多于10的比率的峰评价为氨基酸序列突变。
14.根据任何一项前述权利要求的方法,其特征在于比较还包括比较理论氨基酸序列的DNA翻译的蛋白水解片段的肽模式和待分析的样品的总质谱法离子色谱图(MS-TIC),而通过对每个理论氨基酸序列的计算的理论质量分别加上或从其中减去起因于具有氨基酸改变的碱基三联体(密码子)中的核酸突变、缺失或插入的质量差异,鉴定氨基酸序列突变。
15.生产多肽的方法,所述方法包括下列步骤
-选择生产多肽的细胞,其中多肽包含全部经处理的样品的或关于参考样品或用根据权利要求I至14中的任一项的方法测定的预先测定的氨基酸序列的最小数目的氨基酸序列突变。
16.生产免疫球蛋白的方法,所述方法包括下列步骤
a)提供包含编码免疫球蛋白的核酸的至少两种细胞,
b)单独保藏并培养细胞,
c)实施根据权利要求I至14的任一项的方法,
d)选择生产免疫球蛋白的细胞,其中免疫球蛋白包含关于参考样品的最小数目的氨基酸序列突变,
e)培养细胞,
f)通过从细胞或培养基回收多肽来生产多肽。
本发明涉及测定生产的多肽中氨基酸序列突变的方法,所述方法包括下述步骤a)提供生产的多肽的样品,b)用蛋白酶孵育样品中的多肽,c)使用与高分辨质谱法(FT-ICR/FT-轨道阱)和MS/MS偶联的逆相色谱实施肽的氨基酸序列片段的二维分析,d)通过搜索在给定的保留时间的信号强度的差异和通过评价关于氨基酸序列突变的差分信号,通过一起比较对样品获得的LC-MS数据集和参考样品的数据集进行数据评价。用于数据评价(d)的参考样品能够是良好表征的标准物或是待分析的样品中的一份。
文档编号G01N33/68GKSQ
公开日日 申请日期日 优先权日日
发明者A·策克, F·维格朔夫, H·科尔, J·T·雷古拉 申请人:弗·哈夫曼-拉罗切有限公司

我要回帖

更多关于 核苷酸含量测定 的文章

 

随机推荐