密码子优化工具Codon OptimWiz

我们大家都知道密码子优化问题的由来、定义与相关进展等内容。在生命科学研究中,如何优化一条基因序列,使之大量表达出所需要的蛋白质是小伙伴们面临的一个基础问题。

今天就继续跟小伙伴们分享一下金唯智独立开发的密码子优化工具Codon OptimWiz®

了解密码子优化问题的定义后,小伙伴们应当明白很难去穷尽蛋白质或基因对应的所有碱基序列解空间,正确姿势应当是结合所在宿主的密码子使用频率与其它影响基因转录与蛋白质翻译过程的因素(如GC含量等),利用优化算法帮助我们寻找最优的碱基序列。

其实,优化算法就是人工智能的一种。近几年各种人工智能的新闻铺天盖地而来,特别是“阿尔法狗”一战成名后。人工智能在生命科学及相关医学领域也是缘份不浅,特别是医疗领域,或许不久的将来,人工智能机器人就可以给我们看病、动手术了。我们现在谈到的密码子优化问题,就是人工智能的一个应用场景,作为生命科学领域研究大军的一员,我们也可以自豪一下。

韩国围棋九段李世石败给了人工智能

图1. 2016年3月,经过五番棋激战,韩国围棋九段李世石败给了人工智能“AlphaGo”(人们爱称其为“阿尔法狗”) 。

为了实现准确、高效的密码子优化服务,金唯智的小伙伴们自2009年以来就开始了相关的研发工作,直到具有自主知识产权的密码子优化工具Codon OptimWiz®的问世。使用过金唯智密码子优化服务的小伙伴应当已经感受到了密码子优化的重要作用,图2可以看到使用OptimWiz进行基因密码子优化后的蛋白质M在宿主A与B中具有很高的蛋白质表达量。

OptimWiz优化前后蛋白质M在宿主A与B的表达量

图2. 使用OptimWiz优化前后蛋白质M在宿主A与B的表达量

当然,金唯智始终没有停止对Codon OptimWiz®的更新,我们深知随着人们基因转录过程与蛋白质翻译机制了解的深入,密码子优化工具也应当继续改进。

密码子优化的核心问题是从海量的潜在基因序列中,选出一条或几条最优解,进行后续的基因合成与相应的科学研究。当然大家也不要怕,Codon OptimWiz®已经为你实现了这些优化算法。

蛋白质表达量的提高是密码子优化软件的最终目标,也是Codon OptimWiz®的重要追求。除此之外,其它指标在优化后也会有着极大的提升,如密码子适应指数(Codon Adaptation Index, CAI),其中CAI代表了优化后的基因每个氨基酸位置所采用密码子的相对使用频率(相对于对应氨基酸在物种中使用频率最高的密码子,如果该氨基酸位置采用了使用频率最高的密码子,它的相对使用频率即为1)的平均值。

如图3所示,优化后的基因密码子相对使用频率一般都会增高,换句话说,优化后的基因选用使用频率较高的密码子的概率较大,但这并不意味着所有氨基酸位置都使用最高使用频率密码子的基因会是最优的基因,如前文中提到的,其它因素如GC含量、RNA二级结构等也会影响基因最终的蛋白质表达量,经过多年的研发,Codon OptimWiz®已逐渐总结出不同因素在密码子优化过程中的最佳权重。

OptimWiz优化前后密码子相对使用频率分布

图3. 某基因使用OptimWiz优化前后密码子相对使用频率分布

目前Codon OptimWiz®可以支持上万种宿主物种,当然,大家也可以自己提供相应的密码子使用频率表进行定制化、如GC含量、RNA结构、特定模体序列、剪接位点等;为客户考虑是我们的宗旨;此外,Codon OptimWiz®还提供双宿主优化,可以让优化的基因序列在两个不同宿主中都能达到不错的蛋白质表达量。

Codon OptimWiz®会继续学习、改进,为小伙伴们优化好基因序列,也欢迎大家随时提供反馈和建议,帮助Codon OptimWiz®进步,一同推动基础生命科学与合成生物学的发展!