DNA测序技术使我们几乎可以肆无忌惮地获取任何物种和其群体的遗传信息。我们同时也要思考:生物学,尤其是基因组学,还有哪些未解之谜?
“人类基因组计划”开启了诸多前所未有的新学科分支(基因组学、生物信息学、蛋白质组学等),推动了科学研究的平台化和规模化,比如高性能计算和规模化生物学数据获取。新研究平台的建立也同时促进了学科的交叉和整合。
随着DNA测序技术的发展和广泛应用,揭开了诸多令人困惑的“科学谜团”,同时也遇到了更复杂、更深刻、更具有挑战性的新问题。
遗传学和物种进化理论是生物学的几大基石之一。DNA测序技术从根本上解决了发现遗传变化的手段,使我们几乎可以肆无忌惮地获取任何物种和其群体的遗传信息。我们同时也要思考:生物学,尤其是基因组学,还有那些未解之谜?这里我们不妨先探讨其中的三个。
第一个“生命之谜”是植物、脊椎动物、节肢动物等不同高级谱系基因组之间的结构差异。例如,高等植物基因组有很多基因间区(基因之间没有基因的部分,大多是被称为RNA转座子的重复序列),但是这些部分有时候会是整个基因组核苷酸总数的95%(例如大麦和小麦)以上,因此我们不禁要问:为什么植物要复制这些不编码蛋白质的DNA序列呢?为什么不增加一些编码基因的序列呢?难道这里是“进化”的“死角”?与植物基因组相反的是:动物基因组将重复序列放在了基因的内含子里面(内含子是基因的一部分,与外显子构成基因的结构部分),不仅被复制了,而且还被转录了,最后在翻译之前又被毫不吝惜地丢掉了。从表面上看,也是一种资源的浪费。因此,我们称之为“复制—转录负担”之谜,即植物基因组复制多余的非编码DNA,动物基因组转录多余的RNA。
第二个“生命之谜”是基因突变和自然选择之间的在分子水平上的复杂性。200余年来,达尔文的进化理论主导了生物学各个领域,达尔文和他的继承者们否定了拉马克主义的进化理论(以“用进废退”和“获得性遗传”最为著名),认为遗传突变是随机产生的,而且大部分是中性的,或近于中性的弱有害突变。然而,我们十余年来的研究发现突变和选择的机制其实既有达尔文主义的原理,也有拉马克主义的原理,远比人们已知和想象的要复杂和细致得多。从数量来看,“达尔文主义变异”(或称随机突变)毫无疑问占据了主要的地位;但是从复杂性来看,“拉马克主义变异”(非随机变异和非蛋白质功能选择)则更功能化、更细腻、更无所不在,因此也更神奇。因此,这个“生命之谜”又称为“生殖系之谜”。
第三个“生命之谜”是遗传与非遗传(或称环境和表观遗传)的关系,或称“表观遗传之谜”。尽管分子生物学也有60年的历史了,但是遗传学与分子生物学,尤其是与细胞生物学的边界还是有很深的鸿沟。比如,细胞生物学家在选择研究对象时往往忽略遗传学因素。分子生物学家对机制和分子之间的相互作用感兴趣更多。目前生物学研究的总体趋势是“分久必合”,是信息和知识的大整合时期。逻辑很简单,生命是复杂的,因此科学研究也应该走向接纳复杂性、认识复杂性和解决复杂问题。过去我们对非遗传因素的定义非常粗略,现在是重视的时候了。我曾提出了所谓的“五流说”,强调遗传学只是“信息流”的学问,其他四个“流”是用来定义非遗传因素的:“操作流”、“分室流”、 “平衡流”和可塑性的研究。这“五流”以各自的研究进展,不断深化我们对生命奥秘认识的同时,也提出了很多新的问题。
尽管说非遗传因素或称表观遗传学的研究还刚刚开始,但是值得庆幸的是我们已经积累了很多工具和知识,我们需要的是一些主导性的大型项目。目前可数的是神经系统的“连接组” 研究,揭示神经元之间的物理和生理关系。“暴露组”研究也在启动,用于量化物理和化学环境对生命的影响。前者是为神经生物学研究和行为、认知等研究奠定物质基础,而后者则试图关联遗传因素与非遗传因素的关系。
写到这里,我们也许会很容易地意识到“五流说”作为一个生物学研究的理论框架,一定不会覆盖所有生物学领域的科学问题。是的,但是我们总应该找到一个开始。“千里之行始于足下”,足下的“五流”也正是一个不算宽广的“路”的开始。生命科学研究的路既充满乐趣和实用性,又充满挑战,漫长而坎坷。
(作者系中国科学院北京基因组研究所研究员)