在
生物学中,一个生物体的
基因组是指包含在该生物的
DNA(部分病毒是
RNA)中的全部
遗传信息。
基因组包括
基因和
非编码DNA。
1920年,
德国汉堡大学植物学教授汉斯.温克勒(Hans Winkler)首次使用
基因组这一名词。
更精确地讲,一个生物体的
基因组是指一套
染色体中的完整的
DNA序列。例如,生物个体
体细胞中的
二倍体由两套
染色体组成,其中一套
DNA序列就是一个
基因组。
基因组一词可以特指整套
核DNA(例如,
核基因组),也可以用于包含自己DNA序列的
细胞器基因组,如
线粒体基因组或
叶绿体基因组。当人们说一个
有性生殖物种的基因组正在
测序时,通常是指测定一套
常染色体和两种
性染色体的序列,这样来代表可能的两种性别。即使在只有一种性别的物种中,“一套基因组序列”可能也综合了来自不同个体的染色体。通常使用中,“遗传组成”一词有时在交流中即指某特定个体或物种的基因组。对相关物种全部基因组性质的研究通常被称为
基因组学,该学科与
遗传学不同,后者一般研究单个或一组
基因的性质。
基因组的种类
大部分生物体比
病毒复杂,除了
染色体,有时或总是包含额外的遗传物质。某些情况下,比如对致病微生物的基因组测序,这里
基因组就包含了在
质粒中的遗传物质。在这种情况下
基因组就包含了所有的基因和非编码DNA。
而对于像人类这样的
脊椎动物,
基因组通常指的只是染色体DNA。因此,尽管人类
线粒体里包含了基因,但这些基因并不作为基因组的一部分。事实上,有时候称线粒体拥有自己的基因组,通常叫做
线粒体基因组。
基因组和遗传变异
必须指出仅有一个基因组并不能获得物种的遗传差异或遗传
多态性。例如,原则上讲,人类基因组序列可以仅仅从某个个体的一个细胞的一半DNA中测定。要知道是哪些DNA变异导致特定性状或疾病则需要进行个体间比较。这一点也解释了通常使用“基因组”(与通常使用“基因”相提并论)不仅仅指某特定DNA序列,也指某物种整个家族的序列。
尽管这个概念看上去与直觉相抵触,其实这与说没有任何一个特定的形状是
印度豹的形状是相同的概念。印度豹形状各异,它们的基因组序列也并不相同。然而各动物个体和它们的序列都有共性,因此可以从单一实例中来了解印度豹和“豹性”。
最小基因组
既然基因组和相应生物体如此复杂,一种研究策略就是减少基因组中的基因数目至最小但仍可以使生物体理论上可以生存。对于单细胞生物和多细胞生物最小基因组的实验研究已经开展(见
发育生物学)。这些工作在
体内和
体外进行。通过理解最小生物体的功能,然后不断增加其复杂性,从而理解诸如
癌症等多细胞疾病。(见
#参考资料)
不同基因组大小的比较
要得到已测序基因组以及大小的最新列表,请访问
DOGS 注:一个人类细胞的DNA长度约爲1.8米。
-->