蛋白质是一种复杂的有机化合物。蛋白质是由氨基酸分子呈线性排列所形成,相邻氨基酸残基羧基氨基通过形成肽键连接在一起。蛋白质的氨基酸序列是由对应基因所编码。除了遗传密码所编码的20种“标准”氨基酸,在蛋白质中,某些氨基酸残基还可以被翻译后修饰而发生化学结构的变化,从而对蛋白质进行激活或调控。多个蛋白质可以一起,往往是通过结合在一起形成稳定的蛋白质复合物,发挥某一特定功能。

与其他生物大分子(如多糖核酸)一样,蛋白质是生物体中的必要组成成分,参与了细胞生命活动的每一个进程。是最常见的一类蛋白质,它们催化生物化学反应,尤其对于生物体的代谢至关重要。除了酶之外,还有许多结构性或机械性蛋白质,如肌肉中的肌动蛋白肌球蛋白,以及细胞骨架中的微管蛋白(参与形成细胞内的支撑网络以维持细胞外形)。另外一些蛋白质则参与细胞信号传导免疫反应细胞黏附细胞周期调控等。同时,蛋白质也是人们日常饮食中必需的营养物质,这是因为动物自身无法合成所有必需氨基酸;通过消化所摄入的蛋白质食物(将蛋白质降解为氨基酸),人体就可以将吸收的氨基酸用于自身的蛋白质合成

蛋白质这一概念最早是由瑞典化学家永斯·贝采利乌斯于1838年提出,但人们对于蛋白质在机体中的核心作用并不了解。1926年,詹姆斯·B·萨姆纳揭示尿素酶是蛋白质,首次证明了酶是蛋白质。第一个被测序的蛋白质是胰岛素,由弗雷德里克·桑格完成,他也因此获得1958年度的诺贝尔化学奖。首先被解析的蛋白质结构包括血红蛋白和肌红蛋白的结构,所用方法为X射线晶体学;该工作由马克斯·佩鲁茨约翰·肯德鲁于1958年分别完成,他们也因此获得1962年度的诺贝尔化学奖。

历史

在18世纪,安东尼奥·弗朗索瓦(Antoine Fourcroy)和其他一些研究者发现蛋白质是一类独特的生物分子,他们发现用酸处理一些分子能够使其凝结絮凝。当时他们注意到的例子有来自蛋清血液血清白蛋白纤维素小麦面筋里的蛋白质。荷兰化学家Gerhardus Johannes Mulder对一般的蛋白质进行元素分析发现几乎所有的蛋白质都有相同的实验公式。用“蛋白质”这一名词来描述这类分子是由Mulder的合作者永斯·贝采利乌斯于1838年提出。Mulder随后鉴定出蛋白质的降解产物,并发现其中含有为氨基酸的亮氨酸,并且得到它(非常接近正确值)的分子量为131Da

对于早期的生物化学家来说,研究蛋白质的困难在于难以纯化大量的蛋白质以用于研究。因此,早期的研究工作集中于能够容易地纯化的蛋白质,如血液蛋清、各种毒素中的蛋白质以及消化性和代谢酶(获取自屠宰场)。1950年代后期,Armour Hot Dog Co.公司纯化了一公斤纯的牛胰腺中的核糖核酸酶A,并免费提供给全世界科学家使用。目前,科学家可以从生物公司购买越来越多的各类纯蛋白质。

着名化学家莱纳斯·鲍林成功地预测了基于氢键的规则蛋白质二级结构,而这一构想最早是由威廉·阿斯特伯里于1933年提出。随后,Walter Kauzman在总结自己对变性的研究成果和之前Kaj Linderstrom-Lang的研究工作的基础上,提出了蛋白质折叠是由疏水相互作用所介导的。1949年,弗雷德里克·桑格首次正确地测定了胰岛素的氨基酸序列,并验证了蛋白质是由氨基酸所形成的线性(不具有分叉或其他形式)多聚体。原子分辨率的蛋白质结构首先在1960年代通过X射线晶体学获得解析;到了1980年代,NMR也被应用于蛋白质结构的解析;近年来,冷冻电子显微学被广泛用于对于超大分子复合体的结构进行解析。截至到2008年2月,蛋白质数据库中已有接近50,000个原子分辨率的蛋白质及其相关复合物的三维结构。

生物化学性质

主条目:氨基酸


蛋白质是由不同的L型α氨基酸所形成的线性聚合物。目前在绝大多数已鉴定的天然蛋白质中发现的氨基酸有20种(参见标准蛋白氨基酸列表)。不过在自然界中还存在着一些特殊的氨基酸,例如在一种海洋寡毛纲小蠕虫Olavius algarvensi'以及与之存在共生关系的细菌δ1(该细菌属于δ变形菌)中存在着高含量的硒代半胱氨酸Selenocysteine),由原本为终止密码子的UGA编码,和吡咯赖胺酸Pyrrolysine),由终止密码子UAG编码。

所有氨基酸都有共同的结构特征,包括与氨基连接的α碳原子,一个羧基和连接在α碳原子上的不同的侧链。但脯氨酸有着与这种基本结构不同之处:它含有一个侧链与氨基连接在一起所形成的特殊的环状结构,使得其氨基在肽键中的构象相对固定。 标准氨基酸的侧链是构成蛋白质结构的重要元素,它们具有不同的化学性质,因此对于蛋白质的功能至关重要。多肽链中的氨基酸之间是通过脱水反应所形成的肽键来互相连接;一旦形成肽键成为蛋白质的一部分,氨基酸就被称为“残基”,而连接在链的碳、氮、氧原子被称为“主链”或“蛋白质骨架”。由于肽键有两种共振态,具有一定的双键特性,使得相邻α碳之间形成肽平面;而肽键两侧的二面角确定了蛋白质骨架的局部形态。

由于氨基酸的非对称性(两端分别具有氨基和羧基),蛋白质链具有方向性。蛋白质链的起始端有自由的氨基,被称为N端或氨基端;尾端则有自由的羧基,被称为C端或羧基端。

“蛋白质”、“多肽”和“肽”这些名词的含义在一定程度上有重叠,经常容易混淆。“蛋白质”通常指具有完整生物学功能并有稳定构象的分子;而“肽”则通常指一段较短的氨基酸寡聚体,常常没有稳定的三维结构。然而,“蛋白质”和“肽”之间的界限很模糊,通常以20-30个残基为界。“多肽”可以指任何长度的氨基酸线性单链分子,但常常表示缺少稳定的三级结构

合成

每一种蛋白质都有自己独特的氨基酸序列,而氨基酸序列的组成信息则由编码对应蛋白质的基因核苷酸序列所决定。遗传密码是一套由三个核苷酸组成的密码子,每一种三个核苷酸的组合可以编码一种特定氨基酸,如mRNA上的AUG(在DNA中为ATG)编码甲硫氨酸。由于DNA含有四种核苷酸(ATCG),所以对应的可能的密码子有4×4×4=64种;而标准氨基酸只有20种,因此有部分密码子是冗余的,即部分氨基酸可以由多个不同的密码子所编码。DNA中的基因首先在RNA聚合酶等蛋白质的作用下被转录为前mRNA。在大多数生物体中,前mRNA(或初始转录产物)要经过转录后修饰以形成成熟的mRNA,随后mRNA就可以经由核糖体被用作蛋白质合成的模板。在原核生物中,mRNA可能可以在生成后被直接用于蛋白质合成,或者在离开类核后就结合核糖体。而在真核生物中,mRNA在细胞核中被合成,然后通过核膜被转运到细胞质中;在细胞质中,mRNA才可以被用于蛋白质合成。原核生物的蛋白质合成速率可以达到每秒20个氨基酸,要高于真核生物。

从一个mRNA模板合成一个蛋白质的过程被称为翻译。在翻译过程中,mRNA被一些蛋白质携带到核糖体上;然后核糖体在mRNA上从5'端到3'端寻找起始密码子(大多数情况下为AUG);找到起始密码子后,即核糖体上起始tRNA反密码子与起始密码子配对后,翻译就可以开始进行;在起始密码子后,核糖体每一次阅读三个核苷酸(或一个密码子),同样是通过携带对应氨基酸的tRNA上反密码子与密码子配对。其中,氨酰tRNA合成酶可以将tRNA分子与正确的氨基酸连接到一起。不断延长的多肽链通常被称为“新生链”。生物体中的蛋白质合成总是从N-端到C-端。

合成的蛋白质的大小可以通过其含有的氨基酸数目或者其分子量(以道尔顿或千道尔顿,即kDa为单位)来衡量。酵母蛋白的平均长度为466个氨基酸或平均分子量为53kDa。

化学合成

除了生物合成外,一些小的蛋白质可以通过多种化学途径来合成,这些合成方法又被称为肽合成,其依赖于有机合成技术,如化学连接来高通量生产肽。化学合成允许在合成的肽链中引入非天然氨基酸,如加入荧光标记的氨基酸。这些合成方法所合成的产物被大量应用于生物化学细胞生物学实验。但是,化学合成无法有效合成残基数多于300的蛋白质,而且合成的蛋白质可能不具有天然的三级结构。大多数化学合成方法都是从C-端到N-端进行合成,刚好和生物合成反应的方向相反。

结构

主条目:蛋白质结构

大多数的蛋白质都自然折叠为一个特定的三维结构,这一特定结构被称为天然状态。虽然多数蛋白可以通过本身氨基酸序列的性质进行自我折叠,但还是有许多蛋白质需要分子伴侣的帮助来进行正确的折叠。在高温或极端pH条件下,大多数蛋白质会失去它的天然状态,这一现象就称为变性。生物化学家常常用以下四个方面来表示蛋白质的结构:
  • 一级结构:组成蛋白质多肽链的线性氨基酸序列。
  • 二级结构:依靠不同氨基酸之间的C=O和N-H基团间的氢键形成的稳定结构,主要为α螺旋和β折叠。
  • 三级结构:通过多个二级结构元素在三维空间的排列所形成的一个蛋白质分子的三维结构,使单个蛋白质分子的整体形状。蛋白质的三级结构大都有一个疏水核心来稳定结构,同时具有稳定作用的还有盐桥、氢键和二硫键等。常常可以用“折叠”一词来表示“三级结构”。
  • 四级结构:用于描述由不同多肽链(亚基)间相互作用形成具有功能的蛋白质复合物分子的形态。
蛋白质并不完全是刚性分子。许多蛋白质在执行生物学功能时可以在多个相关结构中相互转换。在进行功能型结构重排时,这些相关的三级或四级结构通常被定义为不同“构象”,而这些结构之间的转换就被称为“构象变换”。例如,酶的构象变换常常是由底物结合到活性位点所导致。在溶液中,所有的蛋白质都会发生结构上的动态变化,主要表现为热振动和与其他分子之间碰撞所导致的运动。

蛋白质可以由三级结构的不同大致分为三个主要类别:球蛋白纤维蛋白膜蛋白。几乎所有的球蛋白都是水溶性的,许多酶都是球蛋白;纤维蛋白多为结构蛋白;膜蛋白常常作为受体或分子通道,是细胞与外界联系的重要介质。

要了解特定蛋白质的功能,获得其三级结构或四级结构可以提供重要的结构信息。目前用于蛋白质的原子分辨率结构测定的方法主要是X射线晶体学和NMR光谱学。冷冻电子显微学也可以提供超大蛋白质复合物(如病毒核糖体等)的低分辨率结构信息。解析的结构(包括原子坐标和结构解析的相关信息)通常存放到蛋白质数据库(PDB),供全世界研究者免费下载。结构预测也可以为未知结构(实验结构)的蛋白质提供结构信息。