基因组计划的内容及研究进展 试述人类基因组计划与后基因组计划研究的主要内容及它们对医学发...

\u7b80\u8ff0\u4eba\u7c7b\u57fa\u56e0\u7ec4\u8ba1\u5212\u7684\u4e3b\u8981\u5185\u5bb9\u548c\u610f\u4e49\uff1f

\u4e3b\u8981\u5185\u5bb9\uff1a
HGP\u7684\u4e3b\u8981\u4efb\u52a1\u662f\u4eba\u7c7b\u7684DNA\u6d4b\u5e8f\uff0c\u9057\u4f20\u56fe\u8c31\u3001\u7269\u7406\u56fe\u8c31\u3001\u5e8f\u5217\u56fe\u8c31 \u3001\u57fa\u56e0\u56fe\u8c31\uff0c\u6b64\u5916\u8fd8\u6709\u6d4b\u5e8f\u6280\u672f\u3001\u4eba\u7c7b\u57fa\u56e0\u7ec4\u5e8f\u5217\u53d8\u5f02\u3001\u529f\u80fd\u57fa\u56e0\u7ec4\u6280\u672f\u3001\u6bd4\u8f83\u57fa\u56e0\u7ec4\u5b66\u3001\u793e\u4f1a\u3001\u6cd5\u5f8b\u3001\u4f26\u7406\u7814\u7a76\u3001\u751f\u7269\u4fe1\u606f\u5b66\u548c\u8ba1\u7b97\u751f\u7269\u5b66\u3001\u6559\u80b2\u57f9\u8bad\u7b49\u76ee\u7684\u3002
\u610f\u4e49\uff1a
1\u3001HGP\u5bf9\u4eba\u7c7b\u75be\u75c5\u57fa\u56e0\u7814\u7a76\u7684\u8d21\u732e
\u4eba\u7c7b\u75be\u75c5\u76f8\u5173\u7684\u57fa\u56e0\u662f\u4eba\u7c7b\u57fa\u56e0\u7ec4\u4e2d\u7ed3\u6784\u548c\u529f\u80fd\u5b8c\u6574\u6027\u81f3\u5173\u91cd\u8981\u7684\u4fe1\u606f\u3002\u5bf9\u4e8e\u5355\u57fa
2\u3001HGP\u5bf9\u533b\u5b66\u7684\u8d21\u732e
\u57fa\u56e0\u8bca\u65ad\u3001\u57fa\u56e0\u6cbb\u7597\u548c\u57fa\u4e8e\u57fa\u56e0\u7ec4\u77e5\u8bc6\u7684\u6cbb\u7597\u3001\u57fa\u4e8e\u57fa\u56e0\u7ec4\u4fe1\u606f\u7684\u75be\u75c5\u9884\u9632\u3001\u75be\u75c5\u6613\u611f\u57fa\u56e0\u7684\u8bc6\u522b\u3001\u98ce\u9669\u4eba\u7fa4\u751f\u6d3b\u65b9\u5f0f\u3001\u73af\u5883\u56e0\u5b50\u7684\u5e72\u9884\u3002
\u56e0\u75c5\uff0c\u91c7\u7528\u201c\u5b9a\u4f4d\u514b\u9686\u201d\u548c\u201c\u5b9a\u4f4d\u5019\u9009\u514b\u9686\u201d\u7684\u5168\u65b0\u601d\u8def\uff0c\u5bfc\u81f4\u4e86\u4ea8\u5ef7\u987f\u821e\u8e48\u75c5\u3001\u9057\u4f20\u6027\u7ed3\u80a0\u764c\u548c\u4e73\u817a\u764c\u7b49\u4e00\u5927\u6279\u5355\u57fa\u56e0\u9057\u4f20\u75c5\u81f4\u75c5\u57fa\u56e0\u7684\u53d1\u73b0\uff0c\u4e3a\u8fd9\u4e9b\u75be\u75c5\u7684\u57fa\u56e0\u8bca\u65ad\u548c\u57fa\u56e0\u6cbb\u7597\u5960\u5b9a\u4e86\u57fa\u7840\u3002

\u6269\u5c55\u8d44\u6599\uff1a
\u4eba\u7c7b\u57fa\u56e0\u7ec4\u8ba1\u5212 - \u6210\u679c
1860\u81f31870\u5e74\uff1a \u5965\u5730\u5229\u5b66\u8005\u5b5f\u5fb7\u5c14\u6839\u636e\u8c4c\u8c46\u6742\u4ea4\u5b9e\u9a8c\u63d0\u51fa\u9057\u4f20\u56e0\u5b50\u6982\u5ff5\uff0c\u5e76\u603b\u7ed3\u51fa\u5b5f\u5fb7\u5c14\u9057\u4f20\u5b9a\u5f8b\u3002
1909\u5e74 \uff1a\u4e39\u9ea6\u690d\u7269\u5b66\u5bb6\u548c\u9057\u4f20\u5b66\u5bb6\u7ea6\u7ff0\u900a\u9996\u6b21\u63d0\u51fa\u201c\u57fa\u56e0\u201d\u8fd9\u4e00\u540d\u8bcd\uff0c\u7528\u4ee5\u8868\u8fbe\u5b5f\u5fb7\u5c14\u7684\u9057\u4f20\u56e0\u5b50\u6982\u5ff5\u3002
1944\u5e74 \uff1a3\u4f4d\u7f8e\u56fd\u79d1\u5b66\u5bb6\u5206\u79bb\u51fa\u7ec6\u83cc\u7684DNA\uff08\u8131\u6c27\u6838\u7cd6\u6838\u9178\uff09\uff0c\u5e76\u53d1\u73b0DNA\u662f\u643a\u5e26\u751f\u547d\u9057\u4f20\u7269\u8d28\u7684\u5206\u5b50\u3002
1953\u5e74 \uff1a\u7f8e\u56fd\u4eba\u6c83\u68ee\u548c\u82f1\u56fd\u4eba\u514b\u91cc\u514b\u901a\u8fc7\u5b9e\u9a8c\u63d0\u51fa\u4e86DNA\u5206\u5b50\u7684\u53cc\u87ba\u65cb\u6a21\u578b\u3002
1969\u5e74 \uff1a\u79d1\u5b66\u5bb6\u6210\u529f\u5206\u79bb\u51fa\u7b2c\u4e00\u4e2a\u57fa\u56e0\u3002
\u53c2\u8003\u8d44\u6599\uff1a\u767e\u5ea6\u767e\u79d1-\u4eba\u7c7b\u57fa\u56e0\u7ec4\u8ba1\u5212

\u4f60\u662f\u5357\u660c\u5927\u5b66\u533b\u5b66\u9662\u7684\u5927\u4e8c\u5b66\u751f\u5427\uff1f\u662f\u4e0d\u662f\u4e94\u6708\u5341\u53f7\u4ea4\uff1f
\u505a\u4e8b\u8981\u7528\u81ea\u5df1\u7684\u5934\u8111\u3002

人类基因组这个研究,第一次在生命科学里面实现了整体上的遗传信息的解析,基因组功能的研究。基因组就是一个生命体的遗传信息的总和。

生命信息的储存单位,实际上就是我们说的基因,载体是脱氧核糖核酸 DNA。在多细胞的生物里,不同的细胞之间,由不同的 细胞所组成的组织之间,由不同的组织所形成的器官之间都在发生信息的流动。这个就是我们所说的:遗传学的中心法则。基因组就是一个生命体的遗传信息的总和。DNA双螺旋的发现大概是20世纪生命科学最最伟大的突破。ATCG四种不同的碱基构成了纷繁复杂的遗传学语言。

实际上绝大多数的人类疾病都是多基因控制的。人类基因组计划正式启动是1990年,就是要用15年的时间,到2005年完成人类基因组DNA全序列的测定。到今天为止我们也还没有这样的技术,说拿来一条染色体,我们就能直接测序。所以整个人类基因组计划实际上就是由复杂到简单,再由简单又回归复杂的一个过程。在人类基因组测序起步的时候,当时用的DNA序列的分析方法是凝胶电泳为主的方法,基本上还是手工运作的。但是在20世纪90年代以后,新的一个测序技术产生了就是毛细管电泳仪技术。使得测序的速度大大加快。一天就可以有100万个碱基对的的序列被测出。中国也加入这一个测序计划,我们承担了1%的任务。2000年4月份,21号染色体全序列测序草图完成了。

现在我们已经可以做到在指甲盖大小的生物芯片上点上人类的基因组,所有的基因都点在上面。将来要去看病,不光要带病卡,还要带一个自己的芯片。医生用药诊断之前,用芯片看看你可能得什么病。通过对进化不同阶段的生物体基因组学的比较,就可以发现基因组结构组成的功能调节的规律。实际上人类疾病相关的基因,也恰恰是人类基因组结构和功能完整性至关重要的信息。实际上在过去几年当中,对疾病的研究早已成为人类基因组研究

一个重要计划的组成部分。1997年提出了两个计划:一个是肿瘤基因组的解剖计划,还有一个叫环境基因组计划。实际上都是和健康相关的。人类基因组计划对医学的贡献,一个是在诊断方面,另外是在基因治疗方面。对于我们这样发展中国家来说,更应该注重预防。

我们国家的基因组计划,是1994年开始启动的,从功能基因组的角度进行切入。采取结构与功能并重,多学科交叉建立关键技术,进行基因组多样性和疾病基因研究。这是我们一开始的时候一个策略。我们可以很自豪的说:现在除了Y染色体,所有的染色体上面都遍布着中国科学家发现和命名的基因。最近我们启动了一个中华民族基因组-SNP的大规模的研究。这个工作从群体遗传学转向了,我们中国人群特点的、疾病发生发展的遗传学信息的研究。所以,如果现在我们能够把中华民族生命元素变异的系统目录和数据库做出来的话,就能够获得我国生物医学界和制药工业界技术创新的知识产权来造福子孙后代来贡献于全人类。

全文

当然清华是我们国家最高等的学府之一了。所以,今天到这里来,也有点诚惶诚恐。那么主要是来求教的。现在我要给大家介绍的人类基因组这个研究,可以说是第一次,在生命科学里面,实现了某种大科学的概念。也就是说来一个整体上的遗传信息的解析,基因组功能的研究。所以我说现在生物学的特点,已经从70年代、80年代,主要是以分析为主,学科的精细化,分工的细化,这样一个趋势到了一个新的平台上面。这个平台就是大综合,其实我们中国的科学,一开始就是讲究大综合。你看我们的艺术也是这样,我们的写意画就是一种大综合。这个东西方的融合非常重要,把西方严谨的分析,和中国早在几千年前的大综合的思路结合在一起的话,我想有可能带来一些新的突破的机遇。那么这张图我想,恐怕不光是搞生命科学的,就是我们非生命科学的同学们,也都是非常熟悉的,遗传学中心法则。

我们都知道,生命活动它的本质,它是一个信息的流动。有人一直说,我们都是搞生命科学的。但是突然有一个冒出一句话:“什么是生命”?这个倒可以让人思索一番。我个人体会,生命信息它的储存单位,生命的重要特点之一,它有记忆功能。那么它的储存的单位,实际上就是我们说的基因,在绝大部分的生命体我们知道,它的载体是脱氧核糖核酸DNA。但是它的执行单位,主要来说是蛋白质。这里面它用信息的语言,不是一样的,一个是核酸的语言,一个是氨基酸的语言。所以在这个空间信息的流动,需要有一些调控的机制。这个调控大家知道,第一步就是转录。这个时候生命信息的语言,没有发生变化,都是核酸的语言。只是从DNA到了MRNA上面,这个过程我们称为转录。然后语言要发生变化,发生转换,要求来进行翻译了。所以从MRNA上面的生命语言,变成蛋白质的生命语言。当然我们知道这个蛋白质,很多的蛋白质它都具有代谢的活动。生命体和非生命体的重要差别之一就是有代谢和新陈代谢,然后蛋白质可以形成高级空间的构型。那么在这个里面,细胞的不同的部分互相之间作用,细胞核和细胞浆互相在作用。然后在多细胞的生物里,不同的细胞之间、由不同的细胞所组成的组织之间、由不同的组织所形成的器官之间都在发生信息的流动。我想这个就是我们所说的“遗传学的中心法则”。那么基因这个概念,大家都很清楚了或者说基本概念很清楚,确切的定义也许今天还不是非常清楚。

那么基因组是什么意思?基因组就是一个生命体的遗传信息的总和。那么在这里我们就不是单个基因,而是所有的基因。它所编码所有的氨基酸相互之间的这个关系,所以感官性是完全不一样的。DNA双螺旋结构的发现大概是20世纪生命科学最最伟大的突破。那么A、T、C、G四种不同的碱基,构成了纷繁复杂的遗传学语言,生命信息的最基本的符号。这个最基本的符号实在是让我们感到非常简单。大自然就用这四种简单的字符,组成了让我们叹为观止的大千世界的无数生命的多样性的现象。那么它的遗传信息,在绝大多数的生命体,我刚才说的是DNA的分子。那么它的排列组合在那里就决定了,或者说在相当大的程度上决定了生命活动在人体,也就是我们讲的:生、老、病、死等等这些活动。那么我们在讲双螺旋结构的时候,我们都知道,碱基对、DNA是生物的大分子。一般来说我们不是用一个质量单位来表示它的体量,而是用它的长度。那么一个bp,中文叫一个碱基对。但是在基因来说,一个基因常常是要成千上万个碱基对。所以我们引入了“千碱基对”这样的尺度。然后再做到基因组的时候,我们都知道基因组它是非常大的尺度,所以又发明了一些新的尺度单位,像Mb指的是百万碱基对。

这个是基因组计划之前的,我们对人类基因组的一些了解。我们知道人类基因组的长度,一个单倍体的基因组的长度大概是30亿个碱基对。一般的教科书上都说,序列当中编码序列,也就是说我们刚才说的,发生转录表达的,可以被称之为基因的序列。大概实际上是指成熟的MRNA,发生加工以后的MRNA当中的序列,大概小于5%。也就是说,非编码序列占了绝大多数。在人体细胞核里面,遗传信息它是以染色体的方式进行组织的,分布于22个常染色体和2条性染色体。我们都知道以前的生物科学的特点,基本上是师傅带徒弟、作坊式的操作。那么到了80年代中期的时候,我想一个是生命科学的这个科学思维的大大扩展,第二个是技术的这个进步。比方说当时遗传工程已经非常成熟了,当时DNA测序也相对成熟,然后PCR的技术在那里开始产生了。因此使得科学家们,生命科学家们的雄心壮志,在那里萌发了,决心要冲破原来的这种作坊式的被物理学界甚至化学界不太看得起的那种运作方式,搞一点可以称为是大科学的东西。

当然我想科学研究的条件,思维这是一个方面。但是实际上回顾一下科学史的话,很多重大的事件它还是需求在那里拉动的。我们有的科学家批评这样的做法,意思是说我们要注意把基础研究和社会重大需求结合在一起。我觉得实际上这有点失之偏颇的,就是说有各种各样类型的研究:有的是一种自由的探索,那么这个可以非常小心,一个人的脑瓜里都可以产生诺贝尔奖的构思。但是也有一些研究的确是希望能够造福人类的。但是这样的研究提出的挑战,实际上又可以孕育着不知道多少人的诺贝尔奖的思想在里面。那么人类基因组计划,就是这样一个典型。

我们看第一份,可以认为是正式的标书。我们做这个课题,一般来说首先要有标书。那么人类基因组计划的第一个标书,可以被认为是诺贝尔奖获得者Dulbecco 1986年发表在《科学》杂志的一篇短文。它的这个短文的题目是什么呢?《肿瘤研究的转折点——人类基因组研究》。事实上我们知道美国有一位雄心勃勃的年轻总统肯尼迪上台以后,当时他在科学上有两大计划:一个是实现人类登月,还有一个战胜癌症。那么人类登月随着阿波罗计划的比较顺利地实施,1969年人类实现了登月。但是攻克肿瘤的计划是一个失败的。为什么?原来科学家把问题想得太简单了,以为肿瘤就是一两个基因的问题。但实际上绝大多数的肿瘤,都是多基因的问题。它涉及的面是整个基因组的问题,是遗传信息的整体上面紊乱的这样一些问题。就是刚才讲的,我们不要以为好像一个融合基因打到小鼠里面去,就足以引起一个白血病,不是那么简单的。因为如果那样的话,你一打进去就要产生白血病,事实上我们PML罗拉白血病,在受精卵里面注射进这个融合基因以后,需要等待一年的时间才会出现白血病而且不是每一个小时都会发生白血病。所以就提示有其他的决定因素在里面。我们现在知道有时候几个基因一起传染的时候,它发生白血病的速率就会大大加快。

Dulbecco这个文章它就说,如果我们想更多地了解肿瘤,我们从现在开始必须关注细胞的基因组。从哪那个物种着手努力?如果我们想理解人类肿瘤,那就应该从人类开始。人类肿瘤研究将因对DNA的详细知识而得到巨大的推动。实际上绝大多数的人类疾病都是多基因的。人类基因组计划正式起动,现在一般的说法是1990年。那么1990年因为是美国国会通过了正式启动这样一个计划。这个计划雄心勃勃就是要用15年的时间,到2005年完成DNA的全序列的测定。这个投资量是多少呢?30亿美元。当时计算的依据是测一个碱基对大概需要一美元。整个计划在这个地方实际上是一个比较狭义的一个计划,这个计划实际上就是一个测序计划。实际上我们讲测序,读出天书只是理解人类自身的第一步,最重要的是读懂天书。但是即使是这样读出天书一个计划的话,它也要经历很多的磨难,很多的困难。也就是说,到今天为止,我们还没有这样的技术说,拿来一条染色体,我们就能够直接测序,从一头测到另外一头我们没有办法这样做。所以整个人类基因组计划,实际上可以简单地说就是由复杂到简单再由简单又回归复杂,最后大概还是回归到简单。也就是说把不能直接测序的一条染色体拿来给它进行分解,分解成比较小的可以操作的这样的单位。那么怎么分解呢?那就是作图,你可以用遗传学的方法去作图,也可以用物理学的方法来作图。我们知道遗传学作图,就是利用遗传学的标志来确定DNA标志间相对的距离。另外一个概念就是说要构成一些所谓的DNA连续的克隆系,那么这些片断,它互相之间重叠,它可以覆盖整个的染色体,从一端覆盖到另外一端。这样就把一个不能直接拿来测序的单位,就给它解析成比较小的、可以操作的这样一个单位。最后给它重新组合成忠实于原来染色体里面生命信息这个排列的,这样一个状况在这里面,识别全部的人类基因。所以人类基因组就是作图,或者狭义的人类基因组计划,就是作图的计划,遗传图、物理图、序列图,然后基因图。

在人类基因组计划进行大规模测序的策略有两种,一种就是我刚才说的那种思路,实际上叫逐个克隆。我刚才说了,你把DNA克隆的连续克隆系建起来了,覆盖整条染色体了,然后你就把一个一个的克隆,用得最多的就是叫BAC--细菌的人工染色体,大概100多个KB这样的长度。那么把这个克隆一个一个挑出来,挑出来以后再进行亚克隆。这种亚克隆就是这样的,就可以测序了,测序以后再给它组装起来、还原起来。这样一个策略,是国际上公共领域的测序计划所采取的策略。实际上它是历史的沿革,就是说从作图,遗传、物理作图演化过来的。我们都知道美国的瑟拉尔公司,也知道奎克曼特。那么它搞了一个叫全基因组鸟枪法,在一定作图信息基础上,绕过大片段连续克隆系统的构建而直接将基因组分解成小片段随机测序,然后利用超级计算机来进行组装。能够使得人类基因组,在初步完成作图以后,很快地迈入到测序,尤其是大规模测序。并且使得整个进度朝向人们的预期。这里面有两个重大因素的贡献,不得不承认这里面,工业界的贡献是非常大的。比如说在人类基因组起步的时候,当时用的这个DNA序列的分析方法,还是凝胶电泳仪为主的方法,基本上还是手工运作的。但是在20世纪90年代上半段的时间里面,新的一个测序技术出现了,毛细管电泳仪。另外把自动化的运作和包括工业界的管理这种系统,都引进来。所以使得测序的速度大大加快。你像这样一个测试仪,它的名字就叫做Megabace。什么意思?就是毛细管电泳,它差不多两小时就可以进行读出一个序列,大概能够读到几百个碱基,那么它一天可以做十班,那么它是96道,所以一天可以做960道。每一道按照他们的宣传,都可以达到一个KB的话,实际上是很难做到的,这是最理想的状态下。所以一天就可以有100万个碱基对的产出。但是曾经使学术界感觉比较困惑的另外一个问题,就是说如果我们现在处于一个知识爆炸的这样一个时代,可以说生物信息的爆炸,是最最给人印象深刻的。

我们看在基因组计划起步之前,在公共数据库里边DNA序列增长非常缓慢。然后1990年以后,就是指数增长期。而且这个东西我是统计到去年、2000年两家世界的公共领域,测序计划和瑟拉尔分别宣布完成了所谓的工作草图。这个时候是这样一个情况,现在大概是这样的情况。1999年当时面对着瑟拉尔的强行挑战,它是1998年成立的,号称三年要拿下人类基因组,国际人类基因组计划决定迎接挑战。就由国际上16个组,分担了人类基因组测序的任务,中国也加入这样一个测序计划。当然我们承担的是1%的任务,1%还是很重要的。因为对于一个发展中的国家来说,能够挤入到这种属于发达国家的俱乐部里面,应该说还是很不容易的。有些事情我们想挤也不一定挤得进去的,像空间站的计划,人家还防范你。

在这里我想介绍一下什么叫工作框架图?因为都在说工作框架图,什么叫工作框架图?其实就是一个工作草图。那么它的意思呢?就是说通过对染色体位置明确的BAC(细菌人工染色体)连续克隆系4—5倍覆盖率的测序,获得基因组90%以上的基因序列,其错误率应该低于1%。也就是说你的覆盖面要达到基因组的90%以上。第二个呢,错误率应该低于1%。100个碱基对立面允许你有一个以下的碱基对的错误。虽然这只是一张草图,但是它已经有用途,就是对基因组结构的基本认识,基因的识别和解析、疾病基因的定位克隆、单个核苷酸的多态性的发现等。

那么讲到草图就一定有一个最终完成图了,所以这张图的定义,要求测序所用的克隆能忠实地代表常染色质的基因组结构,覆盖率要达到99.9%以上,然后序列的错误率应该低于万分之一。与工作框架图的关系呢,实际上就是在工作框架图的基础上再加大测序的覆盖率,填补空隙,使得序列的精度增加,能够达到这样一个标准。也就是说,它是草图的下一步。2000年6月25号,当时的测序的情况是怎么样的呢?我们看当时在公共领域就是说各国政府支持的六各国家,美国、英国、德国、日本、法国、中国,六国政府支持的公共领域的计划,当时是覆盖了大概人类基因组的86.8%。其中包含一部分已经完成,就是我们刚才说的最终序列图这样标准的序列大概是20%多一点点,然后66%左右的序列处于所谓的工作草图这样的阶段。那么也可以说,还没有完成。因为我们说要达到90%以上,但是同时瑟拉尔他号称他的覆盖率已经超过了95%。当然他的覆盖率其实包括了所有的公共领域的这个贡献,再加上他的贡献,所以两者相加起来。我想我们应该相信大概90%以上的序列,都是被工作草图以上的这样一个序列的质量所覆盖着。我们看看公共领域测序计划当时的情况,在24条染色体上分布的情况。我们知道,实际上1999年12月份,22号染色体作为人类最小的染色体之一,它的全序列被测定,或者说是它的常染色体,指部分的全序列。我们注意到它的短臂这个地方,就是易染色体区域,实际上非常难测。因为都是大量的空序列,又没有多少基因。2000年4月份21号染色体全序列完成了,也是同样的定义,就是说常染色体的这个部分。我们看这里是用深红的颜色来表示,差不多就是最终完成的。而这种黄颜色表示的是我们刚才说的工作草图,在大部分染色体区域,是工作草图部分。实际上现在我们讲的,完成人类基因组全序列的测定,都是指的常染色体部分,所以有的人说也许人类基因组序列永远也不能被结束。

2001年2月15日,我们知道公共领域在《自然》上,都是有一种分庭抗礼的,兵对兵、将对将的感觉。2月16号就登了瑟拉尔序列,显然,经过新的一轮角逐,比2000年6月份的时候,完成序列的质量又要高得很多。所以这样的话,应该认为,两家加在一起的信息,应该说比我刚才说的一般的定义又要进一步了。所以就产生了一个在工作草图和最终完成图之间的一个中间状态,这个中间状态就叫做高质量的草图。但是就是这样一个高质量的草图,让我们已经基本上知道我人体生命信息的家当到底有多大。弄到最后我们发现我们的家当好像还是比较可怜的,比我们原来的想像,因为我们的基因数量大概只有线虫,只有900多个细胞的一个生命体的大概一倍左右,我们就比那么一个小虫多一倍。从低等生物到高等生物它的基因组的复杂度,与其说是由基因的数量来决定的,还不如说更主要的是由基因的长度来决定的。我们最近完成了一个细菌的测序,叫钩端螺旋体,可以引起传染病的。它平均一个KB就有一个基因,这么小的一个东西,500万个碱基对的一个基因组,有5000个基因。我们人30亿个碱基对,我们不过就3万个,顶多接近4万个这样一个数字。但是你看到了酵母,到了真核细胞的话,那它就是平均大概5到10个KB一个基因。然后到了果蝇的话,虽然它的基因数量好像还没有线虫的多。但是它的基因长度已经达到10个KB以上,然后到了哺乳类一个基因,大概像人类现在是100多个KB才有一个基因。所以替换、剪接这种可能性就大大增加了。另外跟时间和空间,也就是发育阶段和组织特异性表达的调控相关这些序列复杂大大增加了。虽然基因在高等生物可以达到十的五次方数量级,几万到十万个这样的比较高等的生物。但是实际上它的蛋白质的结构域,实际上如果把基因组比成一个大厦的话,组成这个大厦的预制件,这个数量实际上是比较有限的。那么另外有一些高级生物中有更为丰富的结构域组合,神经功能、组织特异发育、调控、止血和免疫系统的基因,在脊椎动物大量扩展。数以百计的人类基因源于脊椎动物进化过程中某个时间点上,细菌基因的横向转移。基因组在不同个体之间差异很大——单核苷酸多态性,单倍体的基因差异为1/1250,能够导致蛋白质变异的不到1%。

这本遗传天书,已经放在我们面前了,接下来就是要读懂它。要读懂它,一定要从大的系统的概念来考虑怎么样读懂。一个这个基因组的信息,和外界的环境,是在那里相互作用。另外这个基因组的信息不是从天上掉下来的,它是通过一个漫长的几十亿年进化的过程发展过来的,所以要用比较的方法去读它。另外要考虑到在个体之间和群体之间又是有变异的,这种变异也受到外界环境的一些调节。所以功能基因组学的研究内容,虽然现在没有一个严格的定义,但是我个人认为,至少包括这几个方面:人类基因组DNA序列变异性研究,其核心的内容是SNP,因为这是最常见的变异类型,当然还有很多其他的变异。然后基因组表达调控的研究,这个是发育阶段组织器官的变异,然后模式生物体的研究,这个里面包括进化的意思,和利用模式生物进行功能研究。当然从事所有这些研究,就像我们进行测序研究一样。生物信息学,它既是一个基本的工具,又是一个新兴的学科。因为最后要把这些信息整合起来,搞成一个我们所说的,系统生物学的话,你一定要用理论的手段,和大规模信息处理的手段。

人类基因组计划正式启动于1990年,其目的是测定人类基因组的全部DNA序列,解读其中包含的遗传信息。美国、英国、德国、日本、法国和中国参加了这项工作。中国承担了1%的测序任务。2001年2月,人类基因组工作草图公开发表。截止2003年,人类基因组的测序任务已顺利完成。测序结果表明,人类基因组由大约31.6亿碱基对组成,已发现的基因约为2.0万~2.5万个。

截止2003年,人类基因组的测序任务已顺利完成。现在已经进入了后基因组时代,也就是功能基因组的研究

郑州九中的?

基因控制着细胞中的蛋白质合成,控制着生物的各种遗传性状。人体是一个多细胞体系,每个细胞中都包含46条两两配对的染色体,每23条染色体构成一个染色体组。控制性状的基因,就定位于这些染色体上。DNA(脱氧核糖核酸)是染色体的主要组分,每个染色体组的DNA,就构成一个基因组(genome)。据估计,人类基因组中约含有10万个基因。
通过几十年来的人类遗传学研究,人们已搞清了1.6万个基因在染色体上定位。但是,对整个基因组所包含的10万个基因而言,这只是一小部分。为使人们对整个基因组的结构和功能,有一个全面的了解,这得益于人类基因组计划(HGP)的实施。HGP与曼哈顿原子弹计划和阿波罗登月计划一起被称为本世纪三大科学工程。而HGP因其涉及面更广、影响力更大,又适逢世纪之交,成为承前启后、将贯穿于未来整个21世纪的最伟大的科学工程。
人类基因组计划(Human Genome Project,HGP)自1990年正式启动以来,经过全球科学共同体的努力,提前完成了遗传和物理作图,于2000年春天获得了基因组序列的工作草图,预计在2003年获得完成序列图。届时,人类10万个基因的信息以及相应的染色体位置将被阐明,成为医学和生物制药产业知识和技术创新的源泉。人类基因组研究包括遗传图绘制、物理图构建、测序、转录图绘制和基因鉴定等方面的工作。通过几年来的发展,基因组学(genomics)作为一门专门学科,已应运而生。它涵盖以下几个方面:结构基因组学,着重遗传图、物理图、测序等研究;功能基因组学,包括以转录图为基础的功能制图(基因组表达图);比较基因组学,包括对不同进化阶段生物基因组的比较研究,也包括不同人种、族群和群体基因组的比较研究。此外,工业基因组学、环境基因组学、药物基因组学、疾病基因组学等分支学科也不断发展起来。
这一计划科学意义重大,因此,欧共体、日本、加拿大、澳大利亚、俄罗斯等国也相继提出各自的人类基因组计划,并建立了国际协作的人类基因组组织(HUGO),以协调国际合作。我国的人类基因组计划(CHGP)也已于1993年启动。几年以来,人类基因组研究已取得令人瞩目的进展。最近,我国在国家科技部和上海市、北京市的大力支持下;成立了国家人类基因组南方和北方研究中心。在研究领域内的一个重大事件是展开了大规模的基因组测序,在国家科技部和中国科学院的支持下;由中科院遗传所基因组中心、国家人类基因组南、北研究中心共同承担了全球人类基因组测序计划的1%(3号染色体短臂从D353610至端粒的30Mb区域)。经过半年的拼搏,取得了重大进展,工作草图于2000年4月底结束。除此以外,对若干致病微生物如钩端螺旋体、痢疾杆菌等的研究工作已在国家人类基因组研究中心展开,钩端螺旋体的全基因组最终完成序列可望在2000年底前获得。

  • 浠涔堟槸浜虹被鍩哄洜缁勮鍒?浜虹被鍩哄洜缁勮鍒掔殑鎴愭灉鏈夊摢浜?
    绛旓細12鏈1鏃 鍥介檯浜虹被鍩哄洜缁勮鍒掕仈鍚鐮旂┒灏忕粍瀹e竷锛屽畬鏁寸牬璇戝嚭浜轰綋绗22瀵规煋鑹蹭綋鐨勯仐浼犲瘑鐮侊紝杩欐槸浜虹被棣栨鎴愬姛鍦板畬鎴愪汉浣撴煋鑹蹭綋瀹屾暣鍩哄洜搴忓垪鐨勬祴瀹氥2000骞 4鏈6鏃 缇庡浗濉炶幈鎷夊叕鍙稿甯冪牬璇戝嚭涓鍚嶅疄楠岃呯殑瀹屾暣閬椾紶瀵嗙爜锛屼絾閬埌涓嶅皯绉戝瀹剁殑璐ㄧ枒銆4鏈堝簳 涓浗绉戝瀹舵寜鐓у浗闄呬汉绫鍩哄洜缁勮鍒掔殑閮ㄧ讲锛屽畬鎴愪簡1锛呬汉绫诲熀鍥...
  • 绠杩颁汉绫鍩哄洜缁勮鍒掔殑涓昏鍐呭鍜鎰忎箟?
    绛旓細涓昏鍐呭锛欻GP鐨勪富瑕佷换鍔℃槸浜虹被鐨凞NA娴嬪簭锛岄仐浼犲浘璋便佺墿鐞嗗浘璋便佸簭鍒楀浘璋 銆佸熀鍥犲浘璋憋紝姝ゅ杩樻湁娴嬪簭鎶鏈佷汉绫鍩哄洜缁搴忓垪鍙樺紓銆佸姛鑳藉熀鍥犵粍鎶鏈佹瘮杈冨熀鍥犵粍瀛︺佺ぞ浼氥佹硶寰嬨佷鸡鐞嗙爺绌躲佺敓鐗╀俊鎭鍜岃绠楃敓鐗╁銆佹暀鑲插煿璁瓑鐩殑銆傛剰涔夛細1銆丠GP瀵逛汉绫荤柧鐥鍩哄洜鐮旂┒鐨璐$尞 浜虹被鐤剧梾鐩稿叧鐨勫熀鍥犳槸浜虹被鍩哄洜缁勪腑缁撴瀯鍜...
  • 浜虹被鍩哄洜缁勮鍒掔殑鐮旂┒杩涘睍
    绛旓細鏈変汉鎺ㄦ祴涓涓熀鍥犲钩鍧囧彲浠ョ紪鐮2-10绉嶈泲鐧借川,浠ラ傚簲浜虹被澶嶆潅鐨勫姛鑳姐傛ā寮忕敓鐗:閰垫瘝(yeast)銆佸ぇ鑲犳潌鑿(Escherichia coli)銆佹灉铦(Drosophila melanogaster)銆佺嚎铏(Caenorhabditis elegans)銆佸皬榧(Mus musculus)銆佹嫙鍗楄姤銆佹按绋汇佺帀绫崇瓑绛夊叾瀹冧竴浜涙ā寮忕敓鐗╃殑鍩哄洜缁勮鍒涔熼兘鐩哥户瀹屾垚鎴栨鍦ㄩ『鍒╄繘琛屻傜洰鍓嶅熀鍥犵粍瀛鐨勭爺绌鍑虹幇浜嗗嚑涓...
  • 绠杩颁汉绫鍩哄洜缁勮鍒掔殑杩涘睍鎯呭喌鍙婁汉绫诲熀鍥犵粍璁″垝鐨勬剰涔夈
    绛旓細绛旓細1銆佷汉绫诲熀鍥犵骇璁″垝鐨勮繘灞鎯呭喌锛氱敱浜庡綋浠i珮鏂版妧鏈殑椋為熷彂灞曪紝鐗瑰埆鏄疍NA鍏嬮殕鎶鏈拰DNA娴嬪簭鎶鏈殑鍙戝睍锛屼负鐮旂┒浜虹被鍩哄洜缁鎻愪緵浜嗗彲鑳姐備粠鐩墠鏉ョ殑杩涘睍鏉ョ湅锛岃鍒掍腑鐨勬煇浜涘浘宸茬粡瀹屾垚銆2000骞6鏈26鏃ワ紝6鍥界瀛﹀鍚戝叏涓栫晫瀹e竷锛氣滀汉绫诲熀鍥犵粍鑽夊浘鈥濈殑缁樺埗宸ヤ綔宸茬粡鍏ㄩ儴瀹屾垚锛2003骞达紝鈥滀汉绫诲熀鍥犵粍绮惧浘鈥濈粯鍒...
  • 浜虹被鍩哄洜缁勮鍒鐜板湪鐨勮繘灞濡備綍
    绛旓細浜虹被鍩哄洜缁勮鍒(human genome project, HGP)鏄敱缇庡浗绉戝瀹朵簬1985骞寸巼鍏堟彁鍑猴紝浜1990骞存寮忓惎鍔ㄧ殑銆傜編鍥姐佽嫳鍥姐佹硶鍥姐佸痉鍥姐佹棩鏈拰鎴戝浗绉戝瀹跺叡鍚屽弬涓庝簡杩欎竴棰勭畻杈30浜跨編鍏冪殑浜虹被鍩哄洜缁勮鍒掋傛寜鐓ц繖涓璁″垝鐨璁炬兂锛屽湪2005骞达紝瑕佹妸浜轰綋鍐呯害2.5涓囦釜鍩哄洜鐨勫瘑鐮佸叏閮ㄨВ寮锛屽悓鏃剁粯鍒跺嚭浜虹被鍩哄洜鐨勫浘璋便傛崲鍙ヨ瘽璇...
  • 绠杩颁汉绫鍩哄洜缁勮鍒掔殑瑕佺偣鍜屽奖鍝
    绛旓細浜虹被鍩哄洜缁勬槸涓庢浖鍝堥】璁″垝鍜岄樋娉㈢綏璁″垝涓璧疯绉颁负20涓栫邯鏈浼熷ぇ鐨勭瀛﹀伐绋嬭鍒掋傚畠浜х敓浜嗙涓涓汉绫诲熀鍥犵粍瀹屾暣鍙傝冨簭鍒,涓轰互鍚庣殑涓汉鍩哄洜缁勬椂浠e瀹氫簡鍩虹銆傞氳繃瀵逛汉绫鍩哄洜缁勮鍒掔殑鐮旂┒,鎴戜滑浜嗚В鍒扳淟ife is Sequece鈥濈敓鍛芥槸鐢卞簭鍒楁瀯鎴愮殑,鈥淟ife is Digital鈥濈敓鍛芥槸鏁板瓧鐨勩傚畠鏈閲嶈鐨勫奖鍝嶆潵鑷袱鏂归潰锛1銆...
  • 涓浗2000骞6鏈堜互鍚庝汉绫鍩哄洜缁寰楀伐浣杩涘睍
    绛旓細涓銆 浜虹被鍩哄洜缁勮鍒掔殑涓昏鐮旂┒鍐呭1.浜虹被鐨勯仐浼犱俊鎭串瀛樹簬缁嗚優鏌撹壊浣撶殑鑴辨哀鏍哥硸鏍搁吀(绠绉癉NA)涓侱NA鍩烘湰缁勬垚鍗曚綅鏄牳鑻烽吀,鏍歌嫹閰告湁鍥涚,鎸夊叾纰卞熀鎴愬垎鐨勪笉鍚屽垎鍒О涓篈(鑵哄槍鍛)銆丟(楦熷槍鍛)銆丆(鑳炲槯鍟)鍜孴(鑳歌吅鍢у暥),瀹冧滑浠ヤ笉鍚岀殑椤哄簭渚濇鎺掑垪,褰㈡垚鐢变袱鏉$嚎鎬ч暱閾剧粍鎴愮殑鍙岃灪鏃嬬粨鏋;涓ゆ潯閾句互鍏剁⒈鍩洪棿鐨勬阿閿淮绯荤潃...
  • 鏈鏂扮殑浜虹被鍩哄洜缁勮鍒掑唴瀹鏄粈涔?
    绛旓細鎴戝浗浜1999骞9鏈堢Н鏋佸弬鍔犲埌杩欓」鐮旂┒璁″垝涓殑锛屾壙鎷呭叾涓1%鐨勪换鍔★紝鍗充汉绫3鍙锋煋鑹蹭綋涓婄害3000涓囦釜纰卞熀瀵圭殑娴嬪簭浠诲姟銆傛垜鍥藉洜姝ゆ垚涓哄弬鍔犺繖椤鐮旂┒璁″垝鐨鍞竴鐨勫彂灞曚腑鍥藉銆2000骞6鏈26鏃ヤ汉绫诲熀鍥犵粍宸ヤ綔鑽夊浘瀹屾垚銆傛渶鏂扮殑浜虹被鍩哄洜缁勮鍒掑唴瀹鏄細鍚庝汉绫诲熀鍥犵粍璁″垝 鍚庡熀鍥犵粍璁″垝灏辨槸浜虹被瀹屾垚浜虹被鍩哄洜缁勮鍒掞紙缁撴瀯鍩哄洜...
  • 浜虹被鍩哄洜璁″垝鐨勫唴瀹瑰強瀹炴柦鏂规?
    绛旓細浜虹被鍩哄洜缁勮鍒锛圚uman Genome Project锛岀畝绉癏GP锛塇GP鐨勭爺绌跺唴瀹 HGP鐨勪富瑕佷换鍔℃槸浜虹被鐨凞NA娴嬪簭锛屽寘鎷笅鍥炬墍绀虹殑鍥涘紶璋卞浘锛屾澶栬繕鏈夋祴搴忔妧鏈佷汉绫诲熀鍥犵粍搴忓垪鍙樺紓銆佸姛鑳藉熀鍥犵粍鎶鏈佹瘮杈冨熀鍥犵粍瀛︺佺ぞ浼氥佹硶寰嬨佷鸡鐞嗙爺绌躲佺敓鐗╀俊鎭鍜岃绠楃敓鐗╁銆佹暀鑲插煿璁瓑鐩殑銆1銆侀仐浼犲浘璋憋紙genetic map锛夊張绉拌繛閿佸浘璋(...
  • 鍥介檯浜虹被鍩哄洜缁勮鍒掔殑鏍稿績鍐呭鏄粈涔?
    绛旓細鍥介檯浜虹被鍩哄洜缁勮鍒鏄汉绫婚娆″叏闈佺郴缁熷湴鐮旂┒浜虹被閬椾紶鐗╄川DNA鐨勪竴椤瑰浗闄呭悎浣滃叕鐩婅鍒掋傚畠鐨勬牳蹇鍐呭鏄紝娴嬪畾浜虹被鍩哄洜缁勭殑鍏ㄩ儴DNA搴忓垪锛屼粠鑰岃幏寰椾汉绫绘渶鍩烘湰鐨勭敓鐗╁淇℃伅锛屾垚鏋滃皢鐢卞叏浜虹被鑷敱鍒嗕韩锛屾槸21涓栫邯鐢熷懡绉戝鐨勫熀纭鍜屽厛瀵笺傜洰鍓嶇敱鑻卞浗鍓戞ˉ澶у銆佹棩鏈簡搴斿ぇ瀛︺佷笢娴峰ぇ瀛﹀尰瀛﹂櫌銆佺編鍥界殑鍗庣洓椤垮ぇ瀛﹀拰涓栫晫鍚勫湴...
  • 扩展阅读:基因组学最新研究方法 ... 基因组计划最新进展 ... 基因组学主要研究内容 ... 基因组的基本研究内容 ... 人类基因组计划的发展 ... 基因组学的研究进展 ... 基因组计划的主要内容 ... 人类基因组测序计划 ... 后基因组时代研究内容包括 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网