什么是基因? -- 翻译:不算和


虹桥科教论坛 http://www.rainbowplan.org/bbs/edu/



送交者: fan 于 2006-06-07 04:10:45

回答: 科普编译:什么是基因?之一 由 不算和 于 2006-06-04 16:56:35

什么是基因?
翻译:不算和

什么是基因?
Helen Pearson
Nature, vol 441, pp399-401

“基因”(Gene)并非一个典型的四字母英语单词,一点不讨人嫌,向来没有人把它从电视台词中抹去。相比其他多数言简意赅的四字母单词,搞清“基因”的含义实在不容易。往分子遗传学里扎得越深,就越说不清楚“基因”到底是什么。

里克•扬是麻省剑桥市怀德海研究所的一位遗传学家。他说,二十年前当他开始做教授的时候,如果是对付本科小娃娃,他只需要两个钟头就能把基因及其机制讲清爽。如今就不行喽。单是灌输基因的概念,他就需要召集一帮人来讲三个月。倒不是因为一代不如一代,扬说:“即便是教脑瓜机灵的研究生也得花一个学期。基因定义过去是能一口清的,现在太复杂了。”

经典遗传学里的基因是一个抽象概念:亲代向子代传递遗传特征的单元。生物化学里强调,这些特征是与酶或者蛋白相关联的,一个蛋白对应一个基因。而在分子生物学里基因却是实实在在的东西:DNA碱基序列。当这些序列转换到所谓“信使”RNA单链以后,它们所对应的蛋白就可以按对应氨基酸序列逐个装配起来。过去人们认为,基因序列零散地分布于DNA长链分子上,而这些长链分子在染色体内又互相缠绕着。多数人仍然觉得这个描述挺管用,但是在遗传研究前沿的人看来,它越来越显得老派了,至少只是一种粗略近似。它没有描述很多新发现的复杂现象,甚至对探索工作可能起阻碍作用。

过去认为,遗传信息好像是沿着染色体组织起来的。实际情况却要复杂得多。RNA分子并不是被动地交换遗传信息,而是积极地调控着细胞内各种进程。有些例子显示RNA甚至能够将信息传代,而这一般是由DNA包办的。去年有一个实验令人惊异地显示,植物在某些情况下能够根据基于RNA继承的信息来改写DNA。刊载于本期《自然》第469页的研究结果又显示在小鼠体内可以出现一种类似的现象,也许还可以推广到其他哺乳动物。英国巴斯大学进化遗传学家劳伦斯•赫斯特说,如果这一类现象的确分布广泛,“那么其意义是非常重大的。”加州大学圣迭戈分校的分子生物学家任兵说,“这一切对传统的基因定义提出了挑战。” 而且挑战日趋激烈。年底以前,国际“DNA元件百科全书”(ENCODE)计划将要发布大批数据。该计划的试验阶段即要求空前详细地审查整个人类基因组的大约1%,目的是检出全部有用的序列并且解释其作用。巴塞罗那基因组调控研究中心的罗德里克•吉古参与了这个计划。他说:“计划开始的时候我对基因概念是另一个看法,我们完全没有预料到这样的复杂程度。”

之二

一个DNA序列只有一个蛋白的编码,这是分子生物学范式之一。第一个挑战这个范式的是选择性剪接,它是在1977年研究病毒时发现的。人体内的蛋白是由DNA编码的,而大多数蛋白的DNA序列是以模块化的形式组织起来的。外显子是蛋白的编码序列,内含子是非编码序列,二者交替排列。细胞可以利用选择性剪接来除去内含子,按多种顺序将外显子连接起来,这样产生的不同遗传信息就可被表达成为不同的蛋白。多年以来,遗传学家们已经记录了各种各样古怪的组织方式,比如重叠基因,基因内基因等等。

然而,选择性剪接现象本身并不要求将基因概念推倒重来,因为它不过指出了某些DNA序列编码的蛋白不止一个。今天,传统基因概念受到的冲击要严重得多,这主要是因为对RNA的广泛研究。

对RNA信息或称转录本有着全面分析经验的研究者特别严厉地抨击了一个基因对应一个蛋白的思想,例如,由加州圣巴巴拉Affymetrix公司的托马斯•金吉拉斯领导的研究人员。他们调查了八种人体细胞株内共有的十个染色体所产生全部转录本,确定了每一个转录本在染色体上对应的精确位置。他们描绘出一幅令人震惊的复杂图像。传统理论里,基因是离散分布的并且只能刻板地批量制造等同的转录本。而他们发现,大量的转录过程却是把许多基因组片断转换成多个长短不一的RNA链。传统理论认为,RNA链只能依据DNA双链之一为模板。实际上恰恰相反,这些RNA链可以根据任一DNA链合成出来。一部分转录本的确来自已知的含有蛋白编码基因的DNA区域。更多的转录本却不是这样。金吉拉斯的同事菲利普•卡普兰诺夫说:“一定程度上这是有革命性的。我们开始认识到基因组包含许多重叠转录本。”其他人研究了隐藏在这个现象背后的可能因素。他们是吉古的研究组和遗传学家罗特姆•索列克的小组。索列克现在以色列特拉维夫大学。此前曾有研究报道,转录过程可以从某个蛋白的基因序列开始,然后跳向另一个彻底不同的蛋白基因而继续下去,结果得到融合转录本。吉古小组深入研究了人类RNA转录本数据库,发现在传统上认定为基因的DNA区域内,大约有4-5%在转录过程中符合这一现象。他们认为,细胞可以依靠制造融合转录本这一机理,从数量有限的外显子得到更高的蛋白多样性。

许多科学家开始认为,描述蛋白的DNA编码或许是交叉的,就是说,每个编码序列可以深入至下一个序列的内容,甚至更远。今年底将发布的DNA元件百科全书的成果就将标志着这样一个重要思想。卡普兰诺夫和其他人报道了许多反常的转录事例。有的蛋白编码有着多个外显子,两个外显子之间却可以隔着数十万个碱基对,而这些碱基对又可能含有其他几个“基因”。而且,这样的基因连续体还可以跨越不同的染色体。去年,纽黑文耶鲁大学医学院的理查德•弗拉维尔报道说,一些人类免疫基因可能受到位于另一染色体上的调控区域的控制。吉古说道:“基因的离散模式消失了,我们看到的是一个转录本组成的连续体。”

之三
送交者: 不算和 于 2006-06-04 16:58:28

以上大规模转录研究认为,人类和小鼠体内制造的RNA中有相当数量不含蛋白编码。例如,去年日本一批研究者估计,小鼠基因组的大约63%是得到转录的。这个数字令人咂舌,因为人们原来以为普通外显子的序列仅占整个基因组的1-2%。

RNA并不仅仅是DNA和蛋白合成的中介。这一点不新颖,因为细胞合成蛋白的机制需要大量RNA分子以及蛋白才能运转正常。然而人们相继发现了“微小RNA”及其他对动植物细胞内进程起着关键控制作用的RNA分子。把这些与逐渐丰富RNA新转录过程综合起来,人们认为RNA实际上主动地处理和执行基因组包含的指令。

也许,用于产生非编码RNA的DNA区域应该被赋予与基因同等的地位,即使不能使用“基因”这个名词。澳大利亚布里斯班昆士兰大学的分子生物学家约翰•马提克说:“我看大家都该静下心来好好想想。生物体内大量信息是由RNA来处理的。”

尽管有几个RNA分子的功能已经被鉴别出来,目前争论的焦点在于这些多余的RNA究竟在何种范围起作用。可以理解,DNA序列可能不管好坏一概被转录,细胞只需要忽略那些没用的RNA就行了。而在机制上仅让那些有用的信息转录,好像比较困难一点。然而去年的一项研究表明,至少有一部分非编码RNA的确是有用的。约翰•霍金内什在加州圣迭戈的诺华研究基金会基因组学研究所工作。他和同事们系统地抑制了人体细胞中超过五百种非编码RNA的活性,发现其中八种RNA与细胞信号和细胞生长有关。但霍金内什和其他许多科学家一样,认定非编码RNA在功能上远不如蛋白编码RNA来得重要。因为一直以来,人们在寻找疾病或其他生物特征的遗传学基础的时候发现,绝大多数情况下,一般是由于某个蛋白编码基因出现突变,而不是其他DNA区域。他说:“已有的优势证据支持蛋白编码基因的作用,这是不会错的。”

近期的新发现,比如人类基因组产生转录本的连续体,或者细胞制造大量非编码RNA,对分子生物学界以外的人们而言尚不是问题。人口遗传学家并不需要考虑精确的分子水平上的机理,他们照样能研究某个性状如何传递和进化。例如,遗传学家可以构建模型来考察某个突变是如何继承的,不论它影响某个蛋白,某个非编码RNA或者某个DNA调控区域。赫斯特说:“实际上我不在乎RNA是否与蛋白合成有关。方程组都是一样的。”而事情对其他研究方向则不同,比如所谓的外基因组遗传模式。近年来许多研究人员专注于表观遗传现象。后代经过这个现象得到的遗传信息与DNA序列无关。在本期《自然》第469页,法国尼斯的国立卫生与医学研究所的米努•拉索尔萨德甘率领其研究组报道,某些情况下RNA可能使传统的遗传学模型变得复杂化。文章报道说,小鼠的Kit基因突变会导致尾巴和四足的白点。具体地说,小鼠的两个等位基因中如果一个正常另一个变异,那么就出现白点表现型。古怪的是,这些小鼠的某些后代即使继承了两个正常基因仍然出现了白点。研究者认为,突变Kit基因也制造了异常RNA分子。这些异常分子在精子中得到积累并传递给卵子。在下一代及其后代体内,这些RNA片断通过某种机制使正常Kit基因沉默,从而产生白点表现型。弗朗索瓦•库琴是作者之一。他说:“我们确信这是一个比较普遍的现象。”

奇怪吗?还有更奇怪的。印第安娜西拉菲特的普渡大学的罗伯特•普鲁特及其同事研究了拟南芥并于去年发表了有关结果。与之有关的基因叫做HOTHEAD。他们的研究显示,某些个体不含亲代的突变HOTHEAD基因,因为它们已经把异常DNA序列改写为祖父母的正常编码。普鲁特说,“这简直就改变了一切。反正我的遗传学看法是变了的。”他目前的工作正是要解释拟南芥是如何实现这个技巧的。一种看法是,它们以RNA编码的形式而携带有祖父母的遗传信息备份。这些RNA与普通DNA一起传递给种子,并能够作为模板来“纠正”特定的基因。普鲁特认为,可以想象,某些神秘的非编码转录本可能在起作用。“我觉得在我们传统认定的DNA基因组之外,还有某些东西也是可以遗传的。”

之四
送交者: 不算和 于 2006-06-04 16:59:50

这些发现对进化有何意义还有待观察。不过,RNA作为可传代的遗传信息的载体,这一定会丰富基因概念,当然也使其复杂化。

让我们暂且不管表观遗传学正在带来的许多麻烦,如此多的科学家仍然不考虑分子机理,而继续坚持那些相对单纯的遗传学观点,这可行吗?一些遗传学家说不行。他们担心,如果坚持过于简单化的基因思想,会使人错误地抛弃不与简单理论切合但是非常重要的实验结果。比如,如果某个位点的一个序列产生了许多不同的转录本,医学研究人员却可能无意地抹杀其差别。缺乏清晰的思想来描述基因概念,这或许还会妨碍合作。哈佛大学的发育遗传学家威廉•吉尔伯特说,“有时候很难搞懂人家在说什么,因为我们各自的定义不一样。”

由于缺乏清晰的基因定义,生物信息学家的日子也不好过, 因为他们是用计算机程序来寻找标志性序列,确定一个基因在哪里开始又在哪里结束。然而,正如卡伦•艾尔贝克宣称的那样,目前根本不可能达成任何共识。艾尔贝克在加州大学伯克利分校工作,是序列本体合作计划的协调员。该计划的目的是为生物遗传序列数据库里标志性序列提供标记,以便不同数据库间的比较,比如小鼠和果蝇的数据。库。该计划试图规定某个蛋白编码记录是否必须包括一个标记着序列结束的DNA碱基三联码。艾尔贝克说,二十五名科学家花了差不多整整两天时间才就基因定义达成基本一致。“我们为此开了几次会,每次大家都要吵上好几个钟头。”为了大家都满意,工作组最后确定了一个宽松定义。(既然你想知道的话,基因是“一个基因组序列内的可定位区域,该区域对应一个遗传单元,这个遗传单元与某些如下区域有关:调控,转录,和/或其他功能序列。”)

反正事情总是被搞糟,所以多数遗传学家不再强求形成单一定义。他们使用不那么扎眼的词汇,比如转录本和外显子。比如他们经常这样写:“蛋白编码基因”,或者用其他前缀修饰。弗朗西斯•科林斯是国立人类基因组研究所的主任。他说,“我们每次写下那个名词,差不多都要在前面加上一个形容词。”

不论遗传学家如何努力要确定这飘忽不定的基因,正是基因本身的不确定性才一直吸引着人们的好奇心。怀德海研究所的扬说:“它总是变得越来越奇妙。”

看起来,某些事物并不总能用粗糙的四字母英语单词来描绘。

阅读次数:1

所有跟贴:


加跟贴

笔名: 密码: 注册笔名请按这里
标题:

内容(可选项):

URL(可选项):
URL标题(可选项):
图像(可选项):



所有跟贴·加跟贴·
Copyright © 2000 - 2005 rainbowplan.org