用PCR、GC发夹及变性梯度凝胶电泳检测突变
变性梯度胶凝电泳(DGGE)能够将具有单个碱基差别的DNA分子分离开来。分离以 DNA在溶液中的解链特性为基础。以温度或变性剂浓增高时,DNA分子在不同的区域相对应的解链温度称为基础。解链区域的长度从25个碱基对到数百个碱基对不等,与每 一个解链区域相对应的解链温度称为解链温度(Tm)。由于一个DNA链上相邻碱基间的 堆积作用在DNA双螺旋的稳定上起着相当重要的作用,因此解链区域的Tm值主要取决 于核苷酸的序列。既使是很小的变化也会引起DNA片段Tm值的改变,如单碱基替代可 引起1.5℃的差异。在DGGE系统中,DNA片段在变性剂梯度聚丙烯酰胺凝胶中电泳,凝胶中自上而下所含变性剂浓度呈线性增加。DNA片段在进入变性剂某一浓度时,此浓 度下DNA片段在最低温度解链区域解链(相当于该区域的Tm值),此时DNA分子成分枝状结构,它使DNA分子在胶中的移动减慢。如果梯度条件选择恰当,因单个碱基变化使 不同的DNA片段在凝胶中的不同位置分叉,随后DNA片段移动减慢,从而使笪DNA片段 最终分离开来。
DGGE可以用来检测除最高温度解链区域以外的所有发生单个碱基变化的DNA片段。例如一个DNA片段有三个解链区域,其中头两个区域中的碱基变化能够检测到;但是最后一个区域的碱基变化,由于缺乏完全解链区域时依赖序列移动的DNA片段,一 般不能检测。我们能够利用克隆的DNA片段通过一个富含GC片段与有两个解链区域的 DNA片段结合来解决这一困难,富含GC的片段我们称之为GC发夹。当缺乏GC发夹时, 只有那些发生在此DNA片段第一个区域所发生的单碱基变化可用DGGE分开;而GC发夹与 该DNA片段结合能够区分第二区域所发生的单碱基改变。\par我们对GC发夹的研究最 初是通过将突变的DNA片段克隆入一个质粒载体,使其与一个含80%鸟嘌呤与胞嘧啶的 300bp片段连接,并用限制性内切酶隆解此克隆DNA,使之释放出与GC发夹结合的靶片 段。虽然该方法是行得通的,但是要设计一个适合于直接检测基因组DNA片段、特别是带有长达300bp的GC发夹的片段仍然存在着困难。克服这个困难的第一步是有关的实验观察以及理论推算,结果表明GC发夹长为30bp就足能用于绝大多数DNA片段的 DGGE分析。第二步进展在聚合酶链反应(PCR)基础上,设计一方法使短的GC发夹与DNA 基因组结合。该方法是根据一篇报道,即有限制性内切酶位点的DNA短片段能够与寡核苷酸相连,此寡核苷酸用于PCR扩增DNA片段;这些在DNA基因组织中未编聯的寡聚核 苷酸的wè5'尾斣陂织PCR过程中有效地掺入扩增的DNA片段的5'末端。我们最近将该原 理用于DGGE方法,结果表明长40-45bp的GC发夹能够与来源于人基因组的扩增DNA片段 结合,此GC发夹能检测发生单个碱基变化的DNA片段,而当其缺乏GC发夹时,DGGE检测不到。PCR扩增过程中DNA片段的大量扩增增加了灵敏度,所以只需少量DNA样品, 经EB染色的DNA可以很容易地检测出来,因而不需使用放射性探针。因不需与放射性探针杂交,此法也能比较容易地检测低、中和高拷贝数的重复序列,而这些序列用 Southern杂交来分析有时是十分困难的。在此将详细描述本方法的实验过程,并且专门讨论该方法如何用于完整的从短到中等长度的基因的分析。
策略
利用PCR扩增基因组或者克隆的DNA样品,两条寡核苷酸链与DNA的两侧相结合。 其中一条链的5'末端附加40-45nt的GC富含序列;该5'末端结构在PCR过程中掺入扩增 的DNA片端的5'末端。扩增的DNA片段在对待测DNA浓度合适的变性剂梯度胶中电泳,凝胶用EB染色、紫外检测。因突变或中性多态性而具有一个碱基差别的DNA片段在凝胶中迁移到不同的位置,经EB着色呈现不同的带。
在开始使用PCR/GC发夹方法前有几个方面需予以考虑。如下面将要讨论的,尽管 可用DGGE检测和1000bp的DNA片段,但该方法检测500bp和更短的DNA片段更为有效。 在PCR扩增以及DGGE过程中,可用几种不同的方法来选择寡核苷酸以达到最佳实验结果。此外,有三种不同的方法来决定对于每个扩增DNA片段最佳的变性梯度以及电泳 时间。
寡核苷酸的设计
在使用PCR/GC发地,必须选择用来扩增靶DNA的两个寡核苷酸。一般扩增最好是 选择长度在100-500bp之间的DNA片段。之所以选择范围的DNA片段因为用DGGE检测长 于500bpDNA片段时,突变型和野生型分子之间的分辨率会下降;此外,超过几百个碱 基对的DNA片段在聚丙烯酰胺凝胶电泳中移动非常缓慢,走电泳的时间太长,因此用 PCR/GC发夹的方法来检测几个kb的全基因,我们建议设计几对寡核苷酸将此基因扩增成几个带有重叠的DNA片段。虽然用PCR可同时扩增多个片段,但扩增临近片段时应小心避免产生不必要的复合体产物。因此,为了达到最理想的结果,每一对引物应分别 用于不同的PCR反应。但是通常可根据DNA片段的解链特性在DGGE之前、PCR扩增之后将两个或多个片段混合,只用单孔胶分析多个片段。
根据DNA片段的核苷酸序列[6,7,14,15],有可能推知它的解链特性;并且根据推论选择寡核苷酸的位置以便合成适合于DGGE的DNA片段。当然,也可以简便、有效地选择靶片段而不用推知解链特性,选择扩增DNA片段的寡核苷酸并且在PCR扩增后选择最佳的DGGE分析条件。下面将提供有关使用上述简便方法的具体建议:
1.选择两个相对长度为20-25nt的核苷酸序列作为特异的引物通过PCR合成靶片 段。理想的引物核苷酸序列应该最少有50%G+C,并且不应该有间接重复序列。
2.设计两个PCR引物,其中一个有额外的40个100%G+C核苷酸附加在5'末端作为GC 发夹。解链推测以及我们的经验表明任何随机的GC序列都能达实验目的。当然有几个 建议可以避免一些问题。避免在GC发夹序列中的重复延伸,此重复结构在PCR过程中 形成干扰引物与模板退火的二级结构。同时在设计的GC发夹引物中,最好C碱基经G碱基要多,并且使引物中的连续的G碱基减至最低。之所以如此,是因为寡核苷酸合成 仪合成含有少数相邻G碱基的引物产量很低。之所以如此,是因为寡核苷酸合成仪合 成含有少数相邻G碱基的引物产量很低。只要每个PCR反应分别进行,在每组引物中利 用相同的GC发夹序列都能得到满意的结果。我们曾用6个不同的GC发夹序列成功地扩 增出了几个不同的DNA片段。其中一个序列如下所示:
5'CGCCCGCCGCGCCCCGCGCCCGTCCCGCCGCCCCCGCCCC 3'
该序列在3'末端接上长20-25核苷酸特异序列,此序列可与基因组DNA中的靶片段 区退火。虽然我们在该GC发夹中间加入了一个T碱基,因其会使Tm值降低,所以建议 不要采用此形式;我们建议使用含100%G+C的发夹,发夹顺序如上所示或类似。根据序 列的解链计算以及我们使用6种不同的GC发夹的经验,表明一个长40核苷酸的发夹最为有效。因此超过该长度的发夹就没有必要。虽然短于40核苷酸的GC发夹与一些DNA 片段结合也有效,但它们对其他一些片段就不那么有效;因此,我们不主张使用少于 40个核苷酸的GC发夹。
3.对于大多数DNA片段,只需在其中一个的末端具有单一的GC发夹。有关的解链 预测以及某些实验表明GC发夹附着于DNA片段的两个末端并增加在DGGE上识别碱基的 分辩率。虽然我们还未扩增用两个分别含不同的GC顺序的寡核苷酸来扩增长达1000bp 的DNA片段,但仍有可能办到,然后用限制性内切酶消化扩增的DNA片段使其酶切位点差不多位于DNA片段的中间位置,产生两个含GC发夹的片段。使用该方法可能存在的问题在于两个GC引物在PCR过程中可能彼此干扰。
4.我们用变性的聚丙烯栈腕凝胶电泳纯化用于PCR的寡核苷酸引物;然而有些纯化 对于特异制备的引物可能是不必要的。因为含有GC-发夹的引物至少长60个核苷酸(40 个核苷酸的GC发夹与长20个核酸的特邓列结合),制备物通常含有干扰PCR结果的较短 寡核苷酸;这些片段很容易经制备电泳而除去。纯化之后,引物要经过酚抽提乙醇沉淀及TE缓冲液悬浮(10mMTris.HCl.pH8.0,1mMEDTA,),使其终浓度达10pmol/μl
聚合酶链反应
现已报道用多种不同条件通过PCR扩增DNA片段,现归纳如下。当对哺乳动物DNA 进行实验时,我们用的反应总体积为50μl,内含50-500ng基因组DNA。反应缓冲液: 67mM Tris.HCl,pH8.8,6.7mM MgCl2,16mM(NH4)2SO4,10mMβ羟基乙醇和10%二甲 基亚砚。反应液同时分别含有75pmol四种脱氧核苷三磷酸、每一种寡核苷酸引物为 50pmol。混匀样品后,加入一个单位的Taq DNA聚合酶,100μl矿物油覆盖于反应溶液的上层以防蒸发。反应样品于93℃保温1分钟使DNA变性,然后如下所述在60℃到 70℃之间放置1-2分钟。扩增后,将水相转入另一支试管,酚抽提及乙醇沉淀。用 50μl非变性胶载样缓冲液悬浮DNA。
在PCR扩增过程中出现的一些问题以及建议如下
A.错误的PCR扩增片段:使用简便的EB染色检测在变必梯度胶中的扩增DNA,经PCR 扩增应该合成单一的DNA。不幸的是反应产物偶尔比预料的要复杂得多;例如形成除靶 DNA之外的许多不同大小的DNA,有时这些非靶DNA片段占产物的绝大部分。在此情况 下,额外产笺DNA干扰了在DGGE上对靶片段的分析。我们采取以下几个步骤为防止上 述问题的出现:
1.在PCR过程中避免产生非靶DNA片段的方法之一是使反应在尽可能高的温度下进行。反应在低温下(45-55℃)退火有可能使引扩增基因组DNA上的其它区域而不是靶片 段。很可能引物不能完全与非靶DNA序列互补,但经PCR最初合成反应之后,这些新的 产物在随后的扩增循环中成为退火良好的模板。因此,我们一般在尽可能高的温度下 退火,通常是55-65℃,然后在可能的最高温度下延伸,一般为60-72℃。对于每一对 寡核苷酸温度的选择是根据经验来决定的。
2.选择比较长的寡核苷酸引物(25-30个核苷酸而不是20个,不包括GC发夹序列) 有时能改善反应的特异性,减少非目的产物。较长的引物同时可增高退火/延伸的温 度,而这也增加了反应的特异性。实际上,30个核苷酸长的引物在PCR过程中可直接 在两个温度之间(通常是70-72℃和93℃)进行循环反应,而不需要通过退火步骤,从而有助于防止非物异的带产生。
3.在有些情况下进行PCR,即使在较高的温度下反应,多余的带也会出现。这可能是所使用的寡核苷酸与基因组中相同或相似的序列退火,而这些区域可能是低.中 或高拷贝数的重复序列。解决这一问题的最简单的方法是合成新的寡核苷酸来扩增与 最初选择稍有不同的片段。由于合成寡核苷酸成本昂贵,我们建议两个引物中仅改变其中的一个引物(无GC发夹的那个引物)。如果这一方法有来检测DNA重了列所发生的碱基变化,通过使用与重复区域以外序列杂交的寡核苷酸进行扩增就可避免这些问 题。
4.如果上述方法仍不能避免非特异DNA的扩增,那么可以使用与靶DNA序列互补的 放射性探针在非物异片段的背景下来检测特异的靶片段。标记探针有几种用途:
a.最容易用探针检测PCR产物的方法是在DGGE上电泳样品,将DNA通过电转尼龙或 肖酸纤维素膜上,用放射性同位素标记的DNA片段与靶序杂交。由于靶DNA片段通过 PCR得到扩增,因此打点非常容易进行。检测信号使用低比活性的探针经短时间的曝光就可看到。
b.用探针检测PCR扩增产物的另一方法如下:克隆的靶序列经不对称PCR扩增,合 成一单链探针,在5'末端标记。其中一个引物的量大大超过另一引物,主要产生单链 产物。单链探针形成之后,它能与待测的变性PCR扩增DNA退火。在退火反应中,我们 建议用过量的靶序列,使得所有的探针与靶DNA结合。使用该方法已得到满意的结 果。需要注意的是,当野生型单链DNA探针与突变的DNA链退火互补时,该方法导致形 成单个碱基错配的异源双螺旋链。正如上面所作的讨论,由于碱基的错配的异源双螺 旋链。正如上面所作的讨论,由于碱基的错配而使得链区域的Tm很不稳定,当检测异 双螺旋时,DGGE系统的发辩率得到很大的提高。
c.使用标记探针的第三个方法是通过PCR制备一双链探针,仅在一条链的5'末端 标记,按上述单链探针的方式退火。
B.PCR导致的突变:在使用PCR及DGGE的时候,有时遇到的另一问题是Taq DNA聚合 酶的偶发高突变率。突变率估计为40个循环中每400bp发生一个突变。实际上,突变 率是变化的,并且可以通过改变PCR反应条件使突变率显著减少。突变率为1/400时, 在DGGE上可观察到明显的背景带。然而特异性的核苷酸带一般在此背景下是正确的。 虽然还没有系统地研究导致Taq DNA聚合酶体外高突变率的原因,但有些事实表明当 酶的反应的温度低于水生栖热菌(Thermusaquatics)生长的温度工时,酶反应的专一性降低。我们的实验结果表明PCR反应在较高的温度下进行时产生的突变较少,因此 在DGGE上出现较少的本底。所以,我们建议上面所提到的PCR延伸反应尽可能在最高的温度下进行,以减少突变率。
变性梯度凝胶电泳
有关DGGE系统的方法已经发表,详细的过程在这里将不作讨论。我们建议在购买 或建立用于DGGE实验的装置以臆仔细检查实验方法是否可行。尽管详细过程在此不作讨论,但将在下面讨论有关DGGE系统的几个特征,包括装置的使用以及决定解链性质 的方法。
实验装置
DGGE系统要求在聚丙烯酰凝胶中对待测DNA片段电泳,电泳的温度维持在仅低于待测解链区域Tm值几度。对绝大多数天然的DNA片段69℃是合适的。Lerman和Fischer 设计了一个实验系统,该实验系统在电泳过程中比较容易使胶处于稳定的温度,并且 避免因电鎏加热胶片所带来的问题。该凝胶系统在文献4和17中已作详尽描述,它主 要是用有机玻璃固定胶片,使胶的前后两平面暴露在外面。当胶制备完毕,要置入阴极的上层电泳槽便形成。电泳槽内注入经预热的电泳缓冲液,形成电泳下槽,在其中 置入阳极。用蠕动泵使缓冲液从下槽到上槽进行循环,在电泳过程中缓冲液处于充满 状态。我们已报道过好几种制胶装置可适用于DGGE;但是目前仅一种装置(GreenMou- ntainLabSupply,87CentralSt,Waltham,MA02154)提供了一整套设备作为完整系 统,该系统包括水槽、凝胶装置、凝胶载板、胶板厚度控制板、梳子、蠕动泵、加热装置以及电极。应用户的要求我们将计划生产电泳胶装置。
解链的确定
要想使DGGE达到最佳效果,有必要了解与待测DNA片段有关的解链性质。这些资 料表明应选择用于检测DNA的最理想的变性浓度范围以及电泳时间。此外,通过确定 几个DNA片段的解链性质,可设计在单孔胶中分析多个DNA片段的DGGE实验。有两种方 法可用来研究DNA片段的解链性质,一是根据经验,另一种方法是根据片段魇核苷酸 序列用计算机处理来预测解链的性质。
垂直DGGE决定DNA片段的解链性质最容易的方法是观察DNA片段在变性剂浓度梯度 与电泳方向垂直的凝胶上电泳的牲。在用于制备标准的水平DGGE的同一装置中以水平的DGGE作为标准制备垂直胶。在垂直胶的加样孔内加入DNA样品,此加样幻是一个占胶板整个宽度的单一大孔(与梯度方向平行),并电泳。从低浓度变性胶的一边进胶 的DNA片段,由于未与变性剂发生作用,DNA未解链,因此迁移较远。DNA片段在高浓 度变性剂胶一侧进胶后在电泳过程中几乎不能移动,因为DNA分子已大部分解链。在 中等变性剂浓度有胶的位置,可观察到中等移动速率的DNA片段。电泳后EB染色,DNA 片段呈现出类似的C0T曲线,并且在曲线中某个陡峭跃迁的位置相当于它所代表的解链区域的Tm值。这种电泳胶提供了有关DNA片段解链区数目及相对TM值的信息。根据 这些情况便可设计平行变性梯度胶,使其具有多个样品孔,在最佳条件下进行靶片段 的分析。
根据计算机的计算预测解链性质。以寡核苷酸溶解性的研究及解链理论为基础
Leonard Lerman设计了一种计算机程序,根据DNA片段的核酸序列预测解链性 质,包拓解链区域的位置以及Tm值。有关DNA片段的大量实验结果证实预测是准确 的。根据计算得到的解链情况可用来计算使具有单个碱基差别的DNA片段在凝胶中具 有最大分辩率时的变性梯度条件和电泳时间。
对解链数据的理释。根据垂直DGGE或计算机计算得到的结果来确定待测DNA片段 的电泳胶的最理想的条件。参考文献13和17对如何更好地使用该方法作了详细解释。 在此我们讨论这些方法来解释两种不同类型的解链性质。
1.单解链区域:当GC发夹与DNA片段的一个末端结合时,具有单个解链区域的DNA 片段将具有两上解链区域。这类解链性质是许多大小在50-500BP范围内的DNA片段的显著特征。这类DNA片段在垂直变性梯度胶内出现单一的解链转折;当第一个区域解 链时,出现陡峭的跃迁。由于GC发夹示解链,即使在高变性浓度的条件下,在凝胶中 也观察不到第二个跃迁。根据垂直胶的实验结果,为了选择水平胶电泳最理想的变性条件,测量凝胶中相对应于跃迁的中值位置的水平位置,该位置为该区域的TM值。通 过推算从凝胶的一边到中点折距离,便可确定相当于该TM值的变性浓度。选择水平胶 的条件可包括TM左右约10℃的范围区内,10℃相当于30%范围的变性剂。例如,如果 DNA片段的第一个解链区域的TM值为45%变性剂,那么它的水平胶梯度应该为30%到 60%的变性剂。如果用计算而不是垂直胶来推测解链性质,可使用相同的方法类推。例如,如果解链图型可知第一解链区域的TM值为75℃,带GC发夹的解链在90℃以上为 第二区域,那么水平变性梯度胶应在相当于TM值左右10℃的范围内。这样,对于75℃ 的TM值,水平胶温度范围应在70-80℃之间。假设TM值与变性剂的百分比转换因子大 约为1℃相当于3%变性剂。如果电泳温度为60℃,那么变性剂的浓度应为30%(60℃ +10℃)到60%(60℃+20℃)。
2.多个区域:两个解链区域的DNA片段与一GC发夹结合时,将有三个解链区;该 片段在垂直的梯度浓度凝胶中电泳可观察到两个突然的跃迁。如上所述,将观察不到 GC发夹的跃迁,因为GC发夹在胶的变性条件下不解链。在有多个解链区域的情况下,水平变性胶电泳的最理想的变性条件可根据上述测定的每一个确定解链区TM值的跃迁 中点来估算。如果两个TM值之差在10%变性剂范围内,那么就制备单一的水平变性 胶,其浓度范围在两个点两侧加10%(例如,如果两个区域解链分别在30%和40%变 性剂解链,可制备变性剂为20%-50%的水平胶)。如果DNA片段的两个解链区域TM 值之差超过10%,最好在两上不同的水平变性梯度胶上分别检测每一个区域,每一胶的变性剂范围为解链区左右的30%,如上所述的单解链区片段。例如,DNA片段的解链区域的TM值分别为30%和50%变性剂,检测第一区域水平胶变性剂浓度为15%到 45%;第二区域应在35%到65%下检测。
应用
一旦待测DNA片段的解链得到确定,电泳胶可作为分析多种样品的标准。通常用 单一胶板多个PCR扩增的片段;我们主张首先分别检查每一个片段的少数样品,如果在胶上出现的带彼此间无干扰,那么在加样以前就可先混匀样品。PCR扩增后对变性 梯度胶的实验结果的解释一般是简单明了的。如果检测的DNA有突变或多态性存在, 那么就可观观察到迁移速率的改变,比野生型DNA或慢或快。靶序列为异源双螺旋。在PCR最后几个循环中扩增DNA浓度增高到一定的水平,即使在高浓度的竞争性寡核苷酸引物存在的条件下,也能有效地使两条互补的DNA退火.形成异源双螺旋。由于这 些异源双螺旋分子不稳定,因此在DGGE上异源双螺旋分子的迁移速率比同源双螺旋分 子不稳定,因此在DGGE上异源双螺旋分子的迁移速率比同源双螺旋分子慢。正如上面读者论过的,DGGE的这种特征是有益的,因为异源双链DNA使凝胶电泳的分辩率增加。\par当观察到DGGE中出现有变化的带型时,根据研究者的需要可采取几种不同的方法。在大多数情况下,GC发夹法可用来检测一个基因以发现与疾病直接相关的突 变。以前未能检测的突变体,可以直接通过PCR扩增产物的DNA序列分析确定。虽然有 可能确定杂合子个体的PCR扩增样品DNA分子中带两个等位基因的DNA序列,但是由于 两个不同核苷酸序列在一组孔道中的位置交叉使测序胶的情况很复杂。减少该问题的 方法是从变性梯度胶中纯化突变的等位基因,经PCR重新扩增,并对其直接测序。实 际上,用从这些胶中纯化出的DNA片段已笪出了很好的结果。如果研究仅仅是为了了解遗传连锁,通过对家族中有关的个体进行研究实验,从变性梯度胶上可得到有关的 资料,而不需知道序列。同样地,如果系统被用来检测大量个体是否具有一个或一组 已知突变,从变性梯度胶中直接得到的数据足可以得出结论,特别是在含已知突变的正对照克隆或DNA基因样品作为标记时。
总之,我们建议用PCR.GC发夹和DGGE综合法检测长度在500BP以下的DNA片段上 所有可能发生的碱基变化。我们发现用几组寡核苷酸检测长达2500BP的完整基因组 DNA区实际上是可行的,然而需作出更大的努力来检测更长的DNA片段。该方法在检测 基因编码区域的突变中尤其有用。编码靶基因的信使MRNA可合成第一条链CDNA,基因 的各片段可用合适的引物进行PCR扩增,以笪到完整的基因。当一个大片段的DNA需进 行多态性检测,而又没有必要检测该区域可能发生的每个碱基变化时,我们建议使用 另外两种方法。其中方法之一是用PCR扩增长约2-5KB的DNA片段,用限制性内切酶切 片段,而后进行DGGE分析;方法之二是用具高频切割的限制性内切酶酶解基因组DNA, 经DGGE,随后电转移到尼龙膜上,用放射同位素标记的探针检测。