大虎说事

王大虎:基因的本质是量子信息的流程

王大虎

曾经有科学家认为,基因必然是确定性的物质。在科学手段越来越细致化的今天,随着表观遗传学的发展,科学家们却发现本来百年前人们一直确认的基因,却无法定义,失去了准确的定位,作为遗X位的基因却越来越模糊了。

那什么是基因呢?

基因的演化

传统认为基因(遗传因子)是遗传的物质基础,是DNA分子上具有遗传信息的特定核苷酸序列的总称,是具有遗传效应的DNA分子片段,是控制性状的基本遗X位,基因通过指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表现。

一个基因要有正常的生理机能,它的几个正常组成部分一定要位于相继邻接的位置上,也就是说核苷酸要排成一定的次序,才能决定一种蛋白质的分子结构。假使几个正常组成部分分处于两个染色体上,理论上就是核苷酸的种类和排列改变了,这样就失去正常的生理机能。所以,基因不仅是一个遗传物质在上下代之间传递的基本单位,也是一个功能上的独立单位。

王大虎

基因概念的提出有其演化历史,1864年英国哲学家斯宾塞曾提出“生理单位”,1868年达尔文将其称为“微芽”。遗传学的奠基人孟德尔于1866年发表了著名的《植物杂交试验》的论文,发现了遗传学的两个基本规律——分离律和X组合规律。文中指出,生物每一个性状都是通过遗传因子来传递的,遗传因子是一些独立的遗X位,遗传因子作为基因的雏形名词诞生了。虽然他的研究直到1900年才被人们重视,但孟德尔“遗传因子”的提出为现代基因概念的产生奠定了基础。

大虎说事
大虎说事

1909年,丹麦遗传学家约翰逊(W.Johansen 1859~1927)在书中提出“基因”概念,以此来替代孟德尔假定的“遗传因子”。1926年,遗传学家摩尔根在书提出基因是遗传的功能单位,它能产生特定的表型效应,基因又是一个独立的结构单位。在同源染色体之间可以发生基因的互换,但交换只能发生在基因之间而不是发生在基因之内;基因可以发生突变,由一个等位形式变为另一个等位形式,因而基因又是突变单位。这种认识把基因与染色体联系起来,说明了基因的物质性、基因存在的场所及排列方式。

1953年,美国分子生物学家詹姆斯·沃森(J.D.Watson)和英国物理学家佛朗西斯·克里克(F.H.C.Crick)提出了著名的DNA双螺旋结构模型,进一步说明基因成分就是DNA,它控制着蛋白质合成。进一步的研究证明,基因就是DNA分子的一个区段。

王大虎

从20世纪40~50年代,先后经历了一个基因、一个酶学说,基因通过它所控制的酶决定着代谢中生化反应步骤,进而决定生物性状。后来发现有些蛋白质不只由一种肽链组成,不同肽链有不同基因编码,因而又提出了“一个基因一条多肽链”的假设。DNA是遗传信息的载体,遗传物质是DNA而不是蛋白质,这些都获得了验证。

1955年,美国分子生物学家本泽(Benzer)通过深入研究,提出了基因的顺反子(Cistron)概念。他把遗传的功能单位称为顺反子,1个顺反子决定一条多肽链,顺反子即是基因。1个顺反子内存在着很多突变位点——突变子,突变子就是改变后可以产生突变型表型的最小单位。1个顺反子内部存在着很多重组子。重组子就是不能由重组分开的基本单位。理论上每一个核苷酸对的改变,就可导致一个突变的产生,每两个核苷酸对之间都可发生交换。这样看来,一个基因有多少核苷酸对就有多少突变子,就有多少重组子,突变子就等于重组子。这个学说打破了过去关于基因是突变、重组、决定遗传性状的“三位一体”概念及基因是最小的不可分割的遗X位的观点,从而认为基因为DNA分子上一段核苷酸顺序,负责着遗传信息传递,一个基因内部仍可划分若干个起作用的小单位,即可区分成顺反子、突变子和重组子。一个作用子通常决定一种多肽链合成,一个基因包含一个或几个作用子。突变子指基因内突变的最小单位,而重组子为最小的重组合单位,只包含一对核苷酸。

所有这些均是基因概念的伟大突破。关于基因的本质确定后,人们又把研究视线转移到基因传递遗传信息的过程上。在20世纪50年代初人们已懂得基因与蛋白质间似乎存在着相应的联系,但基因中信息怎样传递到蛋白质上这一基因功能的关键课题在20世纪60年代至20世纪70年代才得以解决,并把核酸密码和蛋白质合成联系起来。然后,沃森和克里克等人提出的“中心法则”,此后的实验进一步发展和完善了“中心法则”,至此,遗传信息传递的过程已较清晰地展示在人们的眼前。过去人们对基因的功能理解是单一的即作为蛋白质合成的模板。但是1961年法国科学家又发现了有些基因不起合成蛋白质模板作用,只起调节或操纵作用,提出了操纵子学说。从此根据基因功能把基因分为结构基因、调节基因和操纵基因。

王大虎

结构基因与调节基因:根据操纵子学说,并不是所有的基因都能为肽链进行编码。于是便把能为多肽链编码的基因称为结构基因,包括编码结构蛋白和酶蛋白的基因,也包括编码阻遏蛋白或激活蛋白的调节基因。有些基因只能转录而不能转译,如tRNA基因与rRNA基因。还有些DNA区段,其本身并不进行转录,但对其邻近的结构基因的转录起控制作用,被称为启动基因和操纵基因。启动基因、操纵基因与其控制下的一系列结构基因组成一个功能单位叫做操纵子(operon)。就其功能而言,调节基因、操纵基因和启动基因都属于调控基因。这些基因的发现,大大拓宽了人们对基因功能及相互关系的认识。

具有相同遗传信息的同一个体细胞间其所利用的基因并不相同,有的基因活动是维持细胞基本代谢所必须的,而有的基因则在一些分化细胞中活动,这正是细胞分化、生物发育的基础。前者被称为管家基因,而后者被称为奢侈基因。

断裂基因:20世纪70年代中期,有科学家发现鸡卵清蛋白基因的表达中,细胞内的结构基因并非全部由编码序列组成,而是在编码序列中间插入无编码作用的碱基序列,这类基因被称为间隔或断裂基因。随后研究表明基因是一个DNA序列同时包含两个区段:一个区段将被表达并存在于成熟的mRNA中,称为“外显子”。一个区段虽然也同时被表达,但将在成熟mRNA中被删除,称为“内含子”。原核生物的基因序列一般是连续的,在一个基因的内部几乎不含“内含子”,而真核生物中绝大多数基因都是由不连续DNA序列组成的断裂基因。断裂基因的表达过程是:整个基因先由DNA转录成一条信息RNA前体,其中的内含序列会被一种称为“剪接体”的RNA/蛋白质复合物所切除,两端再相互连接成一条连续的核酸顺序,以形成成熟的mRNA。DNA分子断裂基因的存在为基因功能的展现赋予了更大的潜力。

重叠基因:1977~1978年,科学家发现在病毒核苷酸序列组成的单链DNA所包含的10个基因中有几个基因具有不同程度的重叠,但是这些重叠的基因具有不同的读码框架。基因的重叠性使有限的DNA序列包含了更多的遗传信息,是生物对它的遗传物质经济而合理的利用。

王大虎

移动基因:1950年,美国遗传学家麦克林托卡发现玉米染色体上有一种控制基因会改变位置,同时引起染色体断裂,使其离开或插入部位邻近的基因失活或恢复活性,从而导致玉米籽粒性状改变。20世纪60年代末,英国人夏皮罗和前西德的西特尔分别在细菌中发现一类称为插入顺序的可移动位置的遗传因子,20世纪70年代又发现细菌质粒的某些抗药性可移动的基因,移动基因不仅能在个体的染色体组内移动,并能在个体间甚至种间移动。现已了解到真核细胞中普遍存在移动基因。基因移动性的发现不仅打破了遗传的DNA恒定论,而且对于认识X基因的形成和表达以及生物进化研究提供了新的线索。因此麦克林托卡这位“玉米夫人”荣获了1983年度诺贝尔奖。

套装基因:在一个基因中的内含子中,包X另一个基因。

组装基因:在发育过程中,不同的DNA序列重新组装成一个表达功能的基因的现象。

为X基因正名:人类基因组中只有约2.1万个是能够编码蛋白质的基因,只占整个基因组的1.2%,因为其余98.8%的基因不能编码蛋白质,科学家曾经把这些基因叫“XDNA”。长久以来人们一直认为“X”基因是没用的,但最新研究发现,但最新研究发现,其实“XDNA”相当于一个工厂的庞大控制面板,这个面板不仅能调控数以百万计基因的活性,还影响人的健康。

2012年9月,国际科学界宣布,“DNA元素百科全书”计划(简称“ENCODE”)获得了迄今最详细的人类基因组分析数据,这项研究是由全世界32个实验室、共440名科学家历时9年完成的。在这个庞大的研究项目中,最为重要的发现是“XDNA”并非X。在这个庞大的研究项目中,最为重要的发现是“XDNA”并非X。在这些原来被错误解读的“XDNA”片段中,至少有400万的遗传开关。这些开关在控制细胞、器官、以及其他组织的行为中发挥着关键的作用。经过研究确定80%的基因组是有功能的是活跃且必须的,其余的20%也不是X。类基因组中的“XDNA”实际上是一个庞大的控制面板,能调控数以百万计基因的活性。如果没有这些开关调控,基因将不能正常工作,而这些区域也许会导致人类患上疾病。

人们了解到,当DNA发生变异时细胞很容易发生癌变。最近的一些研究表明,当表观遗传标记X扰时,细胞也会更容易发生癌变,因为那些至关重要的基因被关闭了,而那些应当被关闭的基因却被打开了。

近些年科学家发现,生物遗传中,没有DNA变化的时候,照样也会发生性状的遗传,我们把它们称之为表观遗传。DNA甲基化是表观遗传因素之一,当要将一个甲基族的顶端放在DNA上的时候,一簇蛋白质就必须被RNA分子导引到正确的位置,但这些RNA分子并不产生蛋白质,而是非常迅速的在细胞内开始工作。这些RNA“导游”,就像核糖体中的RNA分子一样,突破了传统的基因概念的范畴。在过去的10年里,科学家们发现了一些从不会成为蛋白质的新型RNA分子,科学家们将之称为非编码RNA。

王大虎

这些发现让科学家们感到非常惊讶,想弄明白细胞内到底有多少非编码RNA,科学家Encode估计,在人类基因组中能产生RNA转录的可占到惊人的93%。

不死的假基因:1977年,G·Jacp对非洲爪赡5SrRNA基因簇时行研究后,提出了假基因的概念,这是一种核苷酸序列同其相应的正常功能基因基本相同,但却不能合成出功能蛋白质的失活基因。大多数真核生物中发现了假基因,由于假基因不工作或无效工作,故有人认为假基因,相当人的痕迹器官或作为后补基因。

假基因是基因组上与正常发挥功能的编码基因序列非常相似的非功能性基因组DNA拷贝,一般情况都不被转录,且没有明确生理意义。有人估计,人类基因组中存在1万到2万个假基因。部分假基因在染色体上都位于正常基因的附近,但也有在不同的染色体上的。有一类假基因除了一般的特征之外,还有一些其他的特征暗示着它们的形成与mRNA有关,少数仍能制造出具有重要功能的RNA分子。

假基因如果异常,也会导致人类产生疾病。科学家曾经做过这样的实验:把假基因功能阻断,结果就会产生了疾病,假基因的功能异常也可能是导致人类疾病产生的因子。这种现象是一种意外发现,因为当研究人员为了另一项完全不同的实验制作转殖鼠时,研究人员期望转殖鼠会因为注入基因的影响而表现出直接的反应,以便学习到这项基因的功能,他们将DNA注入X卵,使得DNA随机嵌入老鼠的基因组。这种实验也会偶然中断老鼠其他基因的功能,结果研究人员发现一组老鼠出现不寻常且严重的病征,几乎都死亡,即使存活下来者也都出现严重肾脏及骨骼疾病,并且会将这些缺陷传给下一代。而其中原因是一个假基因与另一个染色体上的基因是一个整体。

这项研究者ynshaw·Boris博士发现基因嵌入位点有三个基因,进一步的研究排除了两项基因,因而认定第三项基因——假基因makorin1-p1为老鼠产生异常的罪魁祸首。另一个参与者Hirotsune博士表示:“由于假基因是没有能力产生蛋白的,因此我们很想知道这假基因是如何使老鼠产生疾病的?”研究人员发现,假基因makorin1-p1为一碎片基因,它类似于一完整的称为makorin1蛋白基因,此makorin1位于另一染色体上。正常老鼠肾脏中有大量表现的makorin1蛋白,而当假基因makorin1-p1失去功能时,makorin1蛋白的表现也相对减弱且呈现异常,进一步的研究结果发现,makorin1-p1在调节makorin1的稳定度上扮演非常重要的角色。

王大虎

另一方面当相当数量的病毒DNA四处跳跃时,它们就会造成很大的损害,能够干扰基因,使其停止制作重要的蛋白质。人类数百种遗传疾病就跟这些跳跃基因密切相关,一些非编码DNA在基因组中的最重要工作之一是阻止这种病毒DNA的快速蔓延。

人类基因组丛林里,正常复制蛋白的基因、入侵病毒基因、不死的假基因、小RNA分子、表观遗传因素,他们不断调整斗争,传统的基因概念已经受到了非常大的冲击。

加州大学的大卫豪斯勒认为:如果一个DNX段对一些重要分子进行了编码,突变往往就会产生灾难性的损害。自然选择将淘汰大多数的突变。但是,如果一个DNX段不做那么多,它就能在不引起任何损害的情况下发生突变。在数百万年的时间里,与那些不太重要的DNX段相比,一个重要的DNX段几乎不会收集突变信息。

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注