Chris Echeverri, Christoph Sachse, Andrew Walsh, Anne Grabner
Cenix BioScience GmbH
David Brown
Ambion, Inc.

这是一种细胞过程,其中被称为短干扰 RNA (siRNA) 的短双链 RNA 引导含有至少一条 siRNA 链互补序列的转录本的降解 [1,2]。siRNA 通过被称为 RNA 诱导沉默复合物 (RISC) 的蛋白复合物触发 RNA 降解 [3]。大多数证据表明 RISC 仅含有两条 siRNA 链中的一条 [4],提示在 siRNA 掺入 RISC 之前或期间有一个可消除其中一条 siRNA 的步骤 [5]。任一条 siRNA 链均可以被 RISC 摄取 [5,6],但 RISC 仅可引导与结合 siRNA 互补的细胞 RNA 的降解。近期的研究表明,链的选择可能会受到 siRNA 核苷酸组成的影响 [7,8]。因此,可以选择倾向于将反义 siRNA 链掺入 RISC 的 siRNA 靶点,从而提高含有正确靶向 siRNA 链的 RISC 百分比。这最终将改善 siRNA 的效果和特异性。

siRNA 设计算法

showcase.par.88761.image.180.120.1
在过去一年中已出现了多种 siRNA 设计算法,声称可为沉默人类基因提供较高的成功率。某些生成的 siRNA 设计算法所声称的性能主要基于统计外推和/或实验性短切割(例如沉默共转染的外源报告基因构建体)而确定。Cenix BioScience 与 Ambion 合作,选择了一种更严格的路径,可以直接测量约 1,100 个其自身算法设计的 siRNA 沉默近 400 个内源性表达人类转录本的有效性。重要的是,该分析在严格标准化的实验条件下使用培养的人类细胞进行。因此,该经验研究代表了当今可用的任何 siRNA 设计算法的生理相关、直接和综合性能分析。

尽可能提高 siRNA 的成功率

迄今为止,公开提供的 siRNA 设计项目已显示,生成 48 小时后在 HeLa 细胞中可沉默超过 70% 的靶标 mRNA 水平的 siRNA 的成功率为 50%-60%。基于该基准,Cenix 针对一组 79 个算法设计 siRNA(每个 siRNA 靶向不同的激酶转录本),通过在相同条件下测量沉默效果(即,使用定量 RT-PCR 测量转染 48 小时后 HeLa 细胞中的靶标 mRNA 水平)对其算法的成功率进行了第一次测试。分析表明,79 个 siRNA 中有 74 个(或经过检测的 siRNA 中的 94%)的沉默效率高于 70%(参见图 1)。


图 1.使用 Cenix 算法设计的靶向 79 个内源性表达人激酶的 79 个 siRNA 的沉默效果。通过 qRT-PCR 法测定靶标 mRNA 水平,并对照在 siRNA 转染至 HeLa 细胞后 48 小时收获的样本中的 18S rRNA 进行归一化。


在对靶向相同转录本的多个 siRNA 集进行的后续分析中,Cenix 指出,某些基因(以及在某些情况下某些转录本)比大多数基因(转录本)更难以进行基于 siRNA 的沉默(未显示数据)。由于尚不清楚属于这一类别的基因的百分比,因此很明显,任何从几十个甚至数百个 siRNA 中推断出基因沉默成功率的外推都具有相当有限的统计价值。因此,预计其算法的最终“真实”成功率可能会低于最初在 79 个激酶中观察到的 94%,Cenix 将相同的性能分析扩展至更大的 siRNA 集,以创建更具有统计学意义的数据集。图 2 显示了靶向近 400 个内源性表达的人类转录本的 1,100 多个 siRNA 的 siRNA 效果分布。

综合调查表明,当对每个基因的三个 Cenix 设计的 siRNA 进行检测时,1 个或多个 siRNA 在超过 93% 的检测基因中实现 >70% 沉默、在近 80% 的检测基因中实现 >80% 沉默、在约一半检测基因中实现 >90% 沉默。对于每个 siRNA,约 80% 的单独 siRNA 表现出 >70% 的靶标沉默效果。性能数据清楚地证实了 Cenix siRNA 选择过程的成功。

尽可能提高沉默效果

除了提高 siRNA 有效的可能性,Cenix 算法也可以得到显著强效的 siRNA(图 2)。在经过优化的转染系统中使用 Cenix 设计的 siRNA 时,Ambion 研究人员通常观察到使用 nM 或甚至 pM 量的 siRNA 使得靶标 mRNA 水平降低超过 90%。图 3 显示了一项靶向三种不同基因的 siRNA 以不同浓度被转染的实验。以 200 pM 或 10 nM 浓度转染时,每个 siRNA 的表现基本相同,只有一项例外情况。观察到 GAPDH siRNA 在 200 pM 下的有效性低于在 1 nM 下的有效性,这可能是因为相较于检测的其他两个 mRNA 靶标,GAPDH mRNA 在细胞中含量明显较低。可能的情况是细胞中的 GAPDH 转录本浓度超过仅转染 200 pM GAPDH siRNA 生成的 RISC 相关 GAPDH siRNA 的浓度。


图 2.针对靶向 379 个内源性表达的人类基因的 1,106 个 siRNA 测定的基因沉默分布。通过 qRT-PCR 法测定靶标 mRNA 水平,并对照在 siRNA 转染至 HeLa 细胞后 48 小时收获的样本中的 18S rRNA 进行归一化。提供了显示 siRNA 诱导的沉默超过所述阈值(F70 = 70%,F80 = 80%,等)的基因的百分比。



图 3.Cenix 设计的 siRNA 的效果
。靶向三种不同基因的 siRNA 被转染到 HeLa 细胞中。转染后 48 小时,对细胞中的 RNA 进行回收,并利用 18S rRNA 作为上样对照,通过实时荧光定量 PCR 分析靶标 mRNA。通过比较每个检测 siRNA 与阴性对照 siRNA 的 PCR 结果,计算靶标 mRNA 的降低情况。即使是极低浓度的 Cenix 预设计的 siRNA 也能产生强效 RNAi 反应。


使用低浓度高活性 siRNA 有几个优势;最重要的是尽可能减小脱靶效应,因为已知该效应会随起始 siRNA 浓度的增加而增加 [9, 10]。细胞中高浓度 siRNA 产生脱靶效应的原因很可能是由于更多的正义链被结合到 RISC 上,并利用与正义链 siRNA 互补的序列降解转录本,或者刺激抗病毒反应通路的 dsRNA 结合蛋白更可能被激活并诱导抗病毒反应基因的表达所致。使用较少 siRNA 进行沉默实验的另一个重要优势是转染低浓度的 siRNA 可同时转染多个 siRNA。Ambion 研究人员使用通过 Cenix 算法设计的高活性 siRNA 同时降低了多达 5 个基因的表达(图 4)。


图 4.使用 siRNA 进行多基因敲低。
将等量的 5 种不同 siRNA 混合,并将指定浓度的 siRNA 转染到 HeLa 细胞中。转染后 48 小时,对细胞中的 RNA 进行回收,并使用 18S rRNA 作为上样对照,通过实时荧光定量 PCR 分析靶标 mRNA 降低。通过比较每个检测 siRNA 与相同总 siRNA 浓度下阴性对照 siRNA 的 PCR 结果,计算靶标 mRNA 的降低情况。

使这种算法如此成功的因素是什么?

一个在该领域广泛传播的理论是,siRNA 中总体 G/C 的含量较低往往与提高沉默效果有关。尽管高效 siRNA 具有的 G/C 含量往往低于 50%,但总体 G/C 含量并不能很好地预测 siRNA 的效果。Cenix 反而认识到由于靶序列末端或其附近残基的选择所产生的差异末端稳定性对沉默效果的强烈影响。结果显示,在反义链的 3' 末端附近的某些残基处含有较高 G/C 含量的 siRNA 和在反义链的 5' 末端附近的某些残基处含有较低 G/C 含量的 siRNA 具有显著较高的成功率。因此,这一原则被作为尽可能提高沉默效果的关键算法决定因素之一实施。

自此以后,最近发表在 Cell 期刊中的一篇文章提出了关于靶点核苷酸末端组成与 siRNA 效果之间关系的生物学原因。Schwarz 等人[7] 使用体外试验系统证明 siRNA 的正义和反义链并不一定会等同地与 RNA 诱导沉默复合物 (RISC) 结合。在细胞中的每个 RISC 仅使用一条 siRNA 链作为 RNAi 的引导 [4],因此,RISC 结合的链决定了被靶向进行降解的 mRNA 序列。Schwarz 等人注意到,5' 末端含较低 G/C 含量的 siRNA 链被优先加载。事实上,一端具有高双链稳定性且另一端具有低双链稳定性的 siRNA 表现出了这类显著的链偏向性,其中一条链可能被掺入 RISC 中从而排除另一条链。作者假设一个负责解旋 siRNA 的 RNA 解旋酶基于其可解旋双链体的前 4-5 个核苷酸的容易程度选择一条链用于掺入 RISC(图 5)。这些结果有助于解释 Cenix 所观察到的有效和无效的 siRNA 之间的序列偏倚。在 1-4 位具有高 G/C 含量且在 16-19 位具有低 G/C 含量的 siRNA 靶点导致 siRNA 的反义链(与所需 mRNA 靶标互补的链)在 5' 末端具有低 G/C,在 3' 末端具有高 G/C。根据 Schwarz 等人,反义链将优先掺入 RISC 中,并将靶向正确的 mRNA 进行降解。

RISC 对 siRNA 反义链的优先摄取有两个重要后果:(1) siRNA 往往具有更高的效果,因为正确的链被负责 mRNA 降解的酶复合物有效摄取;(2) siRNA 具有更高的特异性,因为正义链没有被 RISC 摄取,因此无法引导具有至少部分与 siRNA 靶点互补的序列元素的 mRNA 降解 [9]。

超越末端 Tm

除了 siRNA 末端的 G/C 含量外,发现在确定合适的 siRNA 序列时具有影响的特性包括 siRNA 的特异性内部结构域的 Tm、siRNA 长度、CDS(编码区)内靶序列的位置以及 3' 突出端的核苷酸含量。这些结果被整合到用于设计 Ambion 的 Silencer™ 预设计 siRNA 和 Silencer™ 经验证 siRNA 以及 Silencer™ siRNA 文库的 Cenix 算法中。设计过程还包括特异性检查,其中对两条 siRNA 链进行自定义同源性检索,以尽可能减少产生脱靶效应的风险,并对照最新的单核苷酸多态性 (SNP) 数据库筛选推测的 siRNA 靶序列,以避免 siRNA 效果的变异性。同样要避开已知通过与蛋白因子结合介导调节过程的靶标 mRNA 序列与 CpG 基序。

专注于您的实验,而不是您的 siRNA 设计

Cenix BioScience、Ambion 和其他机构的实验 [7,8] 证明,siRNA 设计存在规则,并且可以利用这些规则来改善 siRNA 的有效性和增强 siRNA 的效果。Ambion 的 Silencer 预设计经验证和文库 siRNA 产品无需筛选 siRNA 的功能,因此研究人员可以集中精力进行实验,避免在试剂设计上浪费时间。