科学家发现人类400万基因开关有助控制疾病
“人类基因组不再是一个空壳了。”国际科学界5日宣布,“DNA元素百科全书”计划(简称ENCODE)获得了迄今最详细的人类基因组分析数据,以30篇论文的形式同时发表在英国《自然》杂志等多份学术刊物上。
[b]人类基因研究再突破[/b]
这是“人类基因组计划”之后国际科学界在基因研究领域取得的又一重大进展。人类基因组计划让我们得到了人类基因组图谱,但其中许多基因过去都不知道有什么功能。研究者最常关注的是与编码蛋白质相关的基因,但它们只占整个基因组的约2%。一个聚集了422位科学家的国际团队,完成了解析基因组剩余部分(非编码区域)的工作,人类基因组中约80%的基因都有某种确定的功能。
参与这项计划的英国桑格研究所研究人员珍妮弗·哈罗说,如果说人类基因组计划提供了一张地图,那么ENCODE计划就在这张地图上标出了各个基因的功能信息。
这两个计划之间也有承上启下的关系,在人类基因组计划基本完成的2003年,国际科学界创建了ENCODE计划。这也是一个大型国际合作项目,来自美国、英国、西班牙、日本和新加坡五国32个研究机构的科学家参与了此次项目,耗资1.5亿美元。他们获得并分析了超过15万亿字节的原始数据,目前已经全部公布。研究对147个组织类型进行了分析,以确定哪些能打开和关闭特定的基因,以及不同类型细胞之间的“开关”存在什么差异。
[b]“垃圾DNA”并非垃圾[/b]
基因是遗传的基本单位,到上世纪60年代,科学家认为基因是用以制造蛋白的DNA编码。人类基因组中2.1万个蛋白质编码基因只占了整个基因组的1.2%,那么,其余98.8%的基因是做什么的?1972年,日本遗传学家大野乾给这些不能编码蛋白质的DNA片段起了个名字,叫做“垃圾DNA”。
ENCODE项目的一个主要目的就是去分析那些“垃圾”的功能。经过ENCODE合作项目的初步努力,现在科学家们可以说“80%的基因组是有功能的”。
其余的20%也不是垃圾,该项目的首席分析员伊万·伯尼解释说,虽然ENCODE只分析了147种不同类型的细胞,但总数上千。如果还检测其他类型的细胞,功能可能会出现比例分化。“这就像是从80%到100%,”伊万·伯尼说,“我们真的没有任何多余的大区域DNA。这个‘垃圾’的比喻没有多大用处。”
[b] 开关调控基因活性[/b]
人类基因组中的“垃圾DNA”实际上是一个庞大的控制面板,能调控数以百万计基因的活性。如果没有这些开关调控,基因将不能正常工作,而这些区域也许会导致人类患上疾病。
从遗传学角度来看,同卵双生的孪生子具有完全相同的基因组。但是双胞胎即使在同样的生活环境下也会表现不同的性格,这是因为基因活性是不同的,同样的基因,有些基因活性大,有些活性小。
比如一种叫柳穿鱼的花卉,大多是对称的白色花瓣,有一些却长成黄色五角星。这两种花是同一种植物,样子不同并不是因为它们的基因有差异,而是因为DNA甲基化模式让一些基因“闭嘴”,这个基因活跃的时候花就是左右对称的,如果它沉默,花朵就变成轴对称。
这样的例子在植物中很多,在动物中也被发现不少,甚至可以帮助了解癌症起源。长久以来,人们了解到,当DNA发生变异时细胞很容易发生癌变。最近的一些研究表明,当表观遗传标记被干扰时,细胞也会更容易发生癌变,因为那些至关重要的基因被关闭了,而那些应当被关闭的基因却被打开了。
正如同人类基因组计划带给生物医学研究领域的革新意义,ENCODE项目也将推动生物医学的前进,开辟研究新道路。这份基因组功能图谱,其中包含有400万基因的“开关”,这一重要的参考数据将有助于研究人员找到与人类疾病密切相关的区域。