- 2022-08-12 发布 |
- 37.5 KB |
- 249页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
《生物学基础》课件
第2章生物学基础2021/7/24BIOINFORMATICS1数理与生物工程学院本章提要:作为生物信息学学习的基础,本章简要介绍了基本的生物学知识。包括细胞生物学、蛋白质结构和功能、DNA结构和功能;重点介绍了分子生物学的中心法则,基因表达的调控机理;简要学习基因组结构、新生肽链折叠、基因工程等有关内容。\n2021/7/24BIOINFORMATICS数理与生物工程学院2生物信息学的主要研究对象是生物大分子,分子生物学是生物信息学的必备基础知识。分子生物学是从分子水平研究生物大分子的结构与功能从而阐明生命现象本质的科学。自20世纪50年代以来,分子生物学一直是生物学的前沿与生长点,其主要研究领域包括蛋白质体系、蛋白质-核酸体系和蛋白质-脂质体系。生物大分子,特别是蛋白质和核酸结构功能的研究,是分子生物学的基础。\n2021/7/24BIOINFORMATICS数理与生物工程学院3现代化学和物理学理论、技术和方法的应用推动了生物大分子结构功能的研究,从而出现了分子生物学的蓬勃发展。Sanger于1953年首先完成牛胰岛素的氨基酸序列分析,同年Watson和Crick提出著名的DNA双螺旋结构模型,标志分子生物学的诞生。半个多世纪来,分子生物学得到迅速发展,迅速融入生物学各领域,成为生物学各个领域的基础和核心。\n2021/7/24BIOINFORMATICS数理与生物工程学院4§2.1细胞世界上的生物体具有多样性,各种生物体之间的差异是由其基因组的差异决定的。尽管生物体的基因组差异很大,但是所有生物体都具有共同的成分——细胞。细胞是组成生物体的基本单位,是生物体活动的基础,细胞是生物体的遗传控制中心,是生物体生长发育的基础。\n2021/7/24BIOINFORMATICS数理与生物工程学院52.1.1细胞的概念细胞学说可以归纳为以下两点:⑴所有生物体都由细胞和细胞的产物组成。⑵新的细胞必须经过已存在的细胞的分裂而产生。\n2021/7/24BIOINFORMATICS数理与生物工程学院6生物体是由一个或者多个细胞所组成的。绿藻、衣藻是单细胞的生物,即单个细胞含有生命活动所需要的全部物质。与单细胞生物相比,多细胞生物的一个主要优点是细胞类型的分化。分化的细胞具有各自特定的功能,执行特定的任务;而不同的细胞可以相互合作,完成单个细胞所不能完成的工作。\n2021/7/24BIOINFORMATICS数理与生物工程学院7特定功能的细胞聚集在一起,形成组织。人类有上皮组织、结缔组织、肌肉组织、神经组织等多种主要的组织类型。典型的脊椎动物有200多种分化的细胞。当一个细胞分化后,不能再转变成其他类型的细胞。虽然各种细胞的功能不同,但是它们具有相同的遗传物质、相同的基因,不同的仅仅是基因的表达模式。\n2021/7/24BIOINFORMATICS数理与生物工程学院8一个细胞发展到一定时间就要分裂,变成两个细胞。在有丝分裂中,每个子细胞都得到一套完整的与亲细胞相同的遗传物质。在细胞真正分裂之前,细胞核中的每一条染色体都复制为两份。在细胞分裂过程中,这些复制的染色体彼此分开,并准确地分为完整的两组染色体,分别进入两个子细胞。\n2021/7/24BIOINFORMATICS数理与生物工程学院9细胞从一次分裂开始到下一次分裂开始所经历的全过程称为一个细胞周期。一个细胞的有丝分裂周期包括有丝分裂期(M期)和分裂间期,而分裂间期又分为合成期(S期)以及合成期前后的两个间期(G1期,G2期)。有丝分裂为单细胞生物提供了一种繁殖的机制,为多细胞生物提供了生长、发育的机制。\n2021/7/24BIOINFORMATICS数理与生物工程学院10另一种细胞分裂方式是减数分裂,它是生物体有性繁殖的基础。二倍体生物的体细胞中含有两套遗传物质,其中一套来自于母体,另外一套来自于父体。在减数分裂过程中,细胞首先进行遗传物质的复制,然后进行两次分裂,产生4个新的细胞,即性细胞。每个性细胞中的遗传物质只有1套,故性细胞又被称为配子。\n2021/7/24BIOINFORMATICS数理与生物工程学院11当不同类型的配子(如精细胞、卵细胞)结合以后,形成合子(二倍体细胞),即受精卵。受精卵是一个新生命的开始,从受精卵出发,通过细胞反复不断的有丝分裂和分化,逐步成长发育成新的个体。例如,人类的体细胞是二倍体,有46条(23对)染色体,其中44条(22对)为常染色体,另外2条为性染色体。经过减数分裂所产生的性细胞(精子和卵子)是单倍体,仅有23条染色体。当精子和卵子结合以后,形成二倍体的受精卵,孕育出一个新的生命。\n2021/7/24BIOINFORMATICS数理与生物工程学院122.1.2细胞的类别按照结构的复杂程度及进化顺序,细胞可分为两类,一类是原核细胞,另一类是真核细胞。在真核细胞中,按照细胞的营养类型,即自养与异养还可将大部分真核细胞分为植物细胞和动物细胞。真菌类细胞也是真核细胞,它们既有植物细胞的某些特征,如有细胞壁,又行异养生长。\n2021/7/24BIOINFORMATICS数理与生物工程学院13原核生物细胞缺乏真正的细胞核,通常比真核生物细胞小。原核生物一般是单细胞的生物体,在原核细胞中,遗传物质DNA通常分布于一定的区域,该区域称为核区或拟核,即核酸物质没有特别的膜包被。原核细胞的遗传信息量较少,内部结构较简单,除了没有细胞核外,也没有以膜为基础的具特定结构与功能的细胞器。原核细胞外层是双层脂类构成的质膜,质膜内的所有细胞内容物称为原生质。\n2021/7/24BIOINFORMATICS数理与生物工程学院14在一些原核细胞中,质膜可以向内折叠延伸形成复杂的膜片层,细胞内的许多能量转化反应就发生在这些膜片层上。有些原核细胞如蓝藻和细菌还具有紧贴质膜外的细胞壁,原核细胞的细胞壁主要化学成分是肽聚糖,区别于以纤维素为主的植物细胞壁。原核细胞的细胞壁具保持细胞形状的作用及保护细胞的功能。原核细胞也是地球上起源最早、细胞结构最简单的生命形式。\n2021/7/24BIOINFORMATICS数理与生物工程学院15图2-1细菌细胞模式图\n2021/7/24BIOINFORMATICS数理与生物工程学院16除了原核生物界外,其他各界生物的细胞都是真核细胞。真核细胞具有真正的细胞核,其遗传物质DNA包被在双层膜的特殊结构中。细胞核包括核仁、核质和核膜等部分。另外真核细胞还具有许多由膜包被或组成的细胞器,它们包括线粒体、叶绿体、高尔基体和内质网等等。这些以膜为基础分化的结构使得真核细胞比原核细胞复杂许多,导致了真核细胞功能的多样性。\n2021/7/24BIOINFORMATICS数理与生物工程学院17图2-2植物细胞示意图\n2021/7/24BIOINFORMATICS数理与生物工程学院18图2-3动物细胞示意图\n2021/7/24BIOINFORMATICS数理与生物工程学院192.1.3细胞的结构下面简述细胞的主要构成部分。细胞膜和细胞壁细胞膜又称质膜,它是细胞的表面边界,任何物质出入细胞必须要通过细胞膜。其主要构成物质是磷脂分子,而磷脂是一种双亲分子,其中拥有磷酸基团的一端亲水,而拥有脂肪酸长链的另一端疏水。从结构上看,细胞膜由两层磷脂构成,两层磷脂分子都是疏水端向内,亲水端向外。这样可以保护水和其他物质,防止其流失。\n2021/7/24BIOINFORMATICS数理与生物工程学院20当然,细胞有特殊的通道与外界进行物质交换。细胞膜最重要的特性之一是半透性,即有选择地允许物质通过扩散和主动运输等方式出入细胞,从而保证细胞的正常代谢。细胞膜有许多功能,例如与外界进行物质交换,接受外界传导信号等。植物细胞在细胞膜之外还有细胞壁,它是无生命的结构,其组成成分是细胞分泌的产物,其功能是保护细胞。\n2021/7/24BIOINFORMATICS数理与生物工程学院21图2-4质膜结构\n2021/7/24BIOINFORMATICS数理与生物工程学院22细胞核细胞核是真核细胞的特征,所有真核细胞都具有细胞核。细胞核包含以染色质形式而存在的遗传物质。染色质上有处于不同构象的DNA长链,这些DNA长链被核蛋白所包裹。一层核膜包围着细胞核,使之与细胞的其他部分分离。细胞核在细胞的代谢、生长和分化中起着重要的作用,它是细胞的控制中心。\n2021/7/24BIOINFORMATICS数理与生物工程学院23细胞核内的核仁是随细胞分裂周期性产生和消失的圆形小体,核仁的中心是核仁组织区的特定DNA片段,这是一些转录rRNA的基因。核仁实际上是rRNA合成、加工以及装配成核糖体亚单位的场所。此外,细胞核内还有核骨架和核液等。\n2021/7/24BIOINFORMATICS数理与生物工程学院24图2-5细胞核示意图\n2021/7/24BIOINFORMATICS数理与生物工程学院25除了细胞核外,细胞膜内是透明粘稠可流动的细胞质基质,细胞器分布在细胞质基质中。细胞器主要包括线粒体、质体、内质网、核糖体、高尔基体、溶酶体、微体、液饱、微管、微丝等。有的细胞表面还有细胞膜的特征结构如鞭毛或纤毛。\n2021/7/24BIOINFORMATICS数理与生物工程学院26线粒体在几乎所有真核生物细胞内都有发现,少数情况下一个细胞仅有一个线粒体,多数情况一个细胞有几十、几百甚至上千个线粒体。细胞中线粒体的数目与其生物代谢活性成正比。线粒体的长度为1-10μm,在细胞中不断移动并不时改变着自身形状。线粒体是由内膜和外膜包裹的囊状结构,在磷脂双分子层上还有一些特殊的蛋白质。\n2021/7/24BIOINFORMATICS数理与生物工程学院27囊内是液态的基质,这些液态基质中含有催化柠檬酸循环的多种酶。线粒体外膜平整,内膜向内折入形成一些嵴,增加了内膜的表面积,从而增加了内膜上的代谢反应总量。内膜面上有许多带柄的小球,它们是ATP酶复合体。\n2021/7/24BIOINFORMATICS数理与生物工程学院28线粒体的内膜与外膜之间的间隙称为膜间隙,约6-8nm,其中的液体含有多种可溶性的酶、底物和辅助因子,膜间隙中最主要的酶是腺苷酸激酶。线粒体是细胞呼吸和能量代谢中心,有能量代谢工厂之称,细胞呼吸中的电子传递过程及ATP的合成就发生在线粒体内膜的表面。\n2021/7/24BIOINFORMATICS数理与生物工程学院29图2-6线粒体\n2021/7/24BIOINFORMATICS数理与生物工程学院30质体是植物细胞的细胞器,包括白色体和有色体。植物根或茎细胞中的白色体含有淀粉、油类或蛋白质。植物色彩丰富的花或果实的细胞具有有色体,有色体内含有各种色素。\n2021/7/24BIOINFORMATICS数理与生物工程学院31叶绿体是另一类最重要的有色体,是植物进行光合作用产生食物分子的细胞器。叶绿体中含有大量的叶绿素和各种与光合作用相关的酶。叶绿体为透镜状,大小为2-5μm,大量存在于在绿色植物叶肉细胞和藻类细胞中。叶绿体也有两层膜,内部是一些扁平囊组成的膜系统,这些扁平的囊称为类囊体。扁平的类囊体有规则地探叠在一起形成基粒,基粒外围的部分称为基质。\n2021/7/24BIOINFORMATICS数理与生物工程学院32各个基粒通过基质类囊体彼此相连通。植物光合作用的色素和电子传递系统位于类囊体的膜上,而催化糖类合成的酶特别是1,5—核酮糖二磷酸羧化酶则主要分布于基质中。叶绿体中许多基粒及其多层类囊体膜片层大大增加了植物细胞光合作用的总面积。叶绿体也含有环状的DNA和核糖体。\n2021/7/24BIOINFORMATICS数理与生物工程学院33图2-7叶绿体\n2021/7/24BIOINFORMATICS数理与生物工程学院34内质网是细胞质内以脂类双分子层为基础形成的囊状、泡状和管状结构。内质网与核膜、高尔基体或溶酶体等在发生上或功能上相互联系,构成了细胞质的内膜系统。根据内质网上是否具有核糖体,可区分出光面内质网和糙面内质网。\n2021/7/24BIOINFORMATICS数理与生物工程学院35光面内质网通常为小囊和分支管状,无核糖体附着,是脂类合成和代谢的重要场所,它还可将内质网上合成的蛋白质和脂类转运到高尔基体。糙面内质网膜上附有颗粒状的核糖体,通常为平行排列的扁平囊状。核糖体是细胞合成蛋白质的场所,因此糙面内质网是核糖体与内质网共同组成的复合机能结构,并可与核膜相连,在蛋白质的合成与运输方面起重要的协同作用。\n2021/7/24BIOINFORMATICS数理与生物工程学院36图2-8内质网\n2021/7/24BIOINFORMATICS数理与生物工程学院37高尔基体是一些聚集的扁的小囊和小泡。高尔基体是内质网合成产物和细胞分泌物的加工和包装场所,最后形成分泌泡将分泌物排出细胞外。高尔基体本身还可合成一些生物大分子如多糖等。高尔基体还与植物分裂时的新细胞膜和新细胞壁的形成有关。\n2021/7/24BIOINFORMATICS数理与生物工程学院38图2-9高尔基体\n2021/7/24BIOINFORMATICS数理与生物工程学院39溶酶体是动物细胞内的一种细胞器,为单层膜小泡,大小为0.2-0.8µm。溶酶体由高尔基体断裂而产生,内含多种水解酶,可催化蛋白质、核酸、脂类、多糖等生物大分子分解,消化细胞碎渣和从外界吞入的颗粒。溶酶体对细胞营养、免疫防御、清除有害物质、应激等具有重要的作用。\n2021/7/24BIOINFORMATICS数理与生物工程学院40图2-10溶酶体\n2021/7/24BIOINFORMATICS数理与生物工程学院41微体与溶酶体类似,包括过氧化物酶体和乙醛酸循环体,含有氧化酶、过氧化氢酶或其他酶等。\n2021/7/24BIOINFORMATICS数理与生物工程学院42液泡是植物细胞中单层膜包被的充满水溶液的泡,未成熟的植物细胞通常有许多小液泡,随着细胞的扩大,这些小液泡不断扩大融合成一个大的中央液泡,可占据90%的细胞体积。液泡的主要成分是水,还有盐、糖类和可溶性蛋白。液泡有时含有花青素,还会出现某些高浓度物质的结晶。液泡是植物细胞代谢废物囤积的场所,还与大分子的降解和细胞液组成物质的再循环有关,因此被认为具有类似动物细胞溶酶体的功能。\n2021/7/24BIOINFORMATICS数理与生物工程学院43细胞骨架是细胞内以蛋白质纤维为主要成分的立体网络结构,维持着细胞的形态结构及内部结构的有序性,同时在细胞的运动、物质运输、能量转换、信息传递、细胞分化方面起一定的作用。细胞质中的细胞骨架主要由微管、微丝和中间丝等构成。有些细胞表面还有鞭毛和纤毛,可帮助细胞自主运动。\n2021/7/24BIOINFORMATICS数理与生物工程学院44图2-11细胞骨架\n2021/7/24BIOINFORMATICS数理与生物工程学院45§2.2蛋白质的结构和功能蛋白质是一类结构极其复杂的生物大分子,是生命活动的主要承担者,是生命现象的主要物质基础。可以说,几乎在所有的生物过程中都起着关键的作用。生物体内的蛋白质种类极其繁多,分布也极其广泛,所担任的任务也是多种多样的,20种氨基酸按不同顺序排列产生长达数千氨基酸的多肽链。生物界中蛋白质种类估计1010~1012数量级,蛋白质顺序的多样性是其生物功能多样性和种属特异性的基础。\n2021/7/24BIOINFORMATICS数理与生物工程学院46其功能主要有催化功能、运输功能、营养储存功能、收缩和运动功能、结构功能、防御功能和调控功能。2.2.1.蛋白质的生物学功能\n2021/7/24BIOINFORMATICS数理与生物工程学院47(1)催化功能:蛋白质在生物体内最主要的生物学功能是作为体内各种生化反应的催化剂—酶。几乎所有的酶都表现出巨大的催化能力,它们一般把反应速率提高至少100万倍。没有酶的催化作用,化学转化在活体中几乎是不可能的。具有催化功能的生物大分子有两类:蛋白质,称为Enzyme;另一类是核酸,称为Ribozyme。\n2021/7/24BIOINFORMATICS数理与生物工程学院48(2)运输功能:某些蛋白质具有运输功能。脊椎动物的血红细胞和非脊椎动物的血蓝蛋白在呼吸过程中起运输氧的功能。细胞色素起电子传递体的功能。血液中脂蛋白随血液流动输送脂从肝到其它器官。跨膜蛋白结合葡萄糖分子、氨基酸分子或其它物质并转运他们跨膜。\n2021/7/24BIOINFORMATICS数理与生物工程学院49生物细胞从外界吸收的各种离子(Ca+2,K+)和水分子都是通过细胞膜上的离子通道进行跨膜运输的。而离子通道(包括水通道)都是由蛋白质组成的。(3)营养储存功能:有一类蛋白质具有储存氨基酸的功能,用作幼体生长发育的营养。如麦、谷和稻中的种子蛋白,蛋类中的卵清蛋白,乳中的酪蛋白等。\n2021/7/24BIOINFORMATICS数理与生物工程学院50(4)收缩和运动功能:肌动蛋白和肌球蛋白行使生物体收缩、变形和运动功能。微管中的微管蛋白和鞭毛与纤毛中的动力蛋白共同作用推动细胞运动。\n2021/7/24BIOINFORMATICS数理与生物工程学院51(5)结构功能:蛋白质的另一个主要功能是作为有机体的结构成份。皮肤和骨骼的高抗张强度,是由于称为胶原的一种纤维蛋白质在生物体所起的机械支持作用。在所有真核生物细胞中都存在一个细胞骨架,它是由肌动蛋白组成的微丝,由微管蛋白组成的微管和由角蛋白组成的中间纤维构成的一个网状结构,使细胞具有一定的形状和结构。细胞膜里的片层结构如细胞膜、线粒体、叶绿体和内质网等都是由蛋白质和脂类组成。\n2021/7/24BIOINFORMATICS数理与生物工程学院52皮革几乎就是纯的胶原蛋白。头发、指甲和羽毛主要由角蛋白组成。丝纤维和蜘蛛网的主要成份是丝纤蛋白\n2021/7/24BIOINFORMATICS数理与生物工程学院53(6)防御功能免疫球蛋白或抗体能识别外来细菌或病毒,具有免疫功能。纤维原蛋白和凝血酶是凝血蛋白,血管受到伤害时,可保护血液的流失。\n2021/7/24BIOINFORMATICS数理与生物工程学院54(7)调控功能:有些蛋白可调节细胞生长、分化及遗传信息的表达。如组蛋白、阻遏蛋白、DNA聚合酶、RNA聚合酶等。\n2021/7/24BIOINFORMATICS数理与生物工程学院552.2.2蛋白质的基本组成单位氨基酸是蛋白质分子的基本结构单位。自然界有100多种氨基酸,但组成蛋白质的只有20种。所有氨基酸的化学结构形式极为相似:中间为α碳原子。它以共价键形式一侧与氨基(-NH2)相连,另一侧与羧基(-COOH)相连。它的第三个键总与H相连。20种氨基酸的区别在于各自有不同的R基团。在中性溶液中,羧基失去一个质子而带负电,氨基得到一个质子而带正电,而成为带有双重电荷的兼性离子。\n2021/7/24BIOINFORMATICS数理与生物工程学院56图2-12氨基酸分子基本化学结构\n2021/7/24BIOINFORMATICS数理与生物工程学院57(a)非极性、脂肪族R基团\n2021/7/24BIOINFORMATICS数理与生物工程学院58(b)极性、不带电荷R基团\n2021/7/24BIOINFORMATICS数理与生物工程学院59(c)芳香族R基团(d)带正电荷R基团\n2021/7/24BIOINFORMATICS数理与生物工程学院60(e)带负电荷R基团图2-13生物体中的20种氨基酸(a)非极性、脂肪族R基团(b)极性、不带电荷R基团(c)芳香族R基团(d)带正电荷R基团(e)带负电荷R基团\n2021/7/24BIOINFORMATICS数理与生物工程学院612.2.3多肽链在蛋白质合成时,一个氨基酸的羧基和另一个氨基酸的氨基连接起来成为酰胺键,通常称为肽键。肽键由第一个氨基酸的羧基和第二个氨基酸的氨基通过脱水反应形成。很多氨基酸由肽键相连形成一个多肽链,它是一个没有分支的结构。多肽链具有方向性,按惯例,氨基末端(N端)被认为是多肽链的头部,多肽链按照氨基酸的顺序从氨基酸氨基末端写起,直至羧基末端(C端)。\n2021/7/24BIOINFORMATICS数理与生物工程学院62图2-14肽键的形成\n2021/7/24BIOINFORMATICS数理与生物工程学院632.2.4蛋白质的结构新生的肽链必须折叠成唯一的、特定的三维结构,才能发挥生物活性,成为真正的蛋白质。每一种蛋白质都有自己特定的空间结构,称为“构象”。蛋白质分子的结构大致可以分为如下几个层次:一级结构、二级结构、超二级结构、结构域、三级结构和四级结构。Linderstrom-Lang于1952年提出了蛋白质三级结构的概念。\n2021/7/24BIOINFORMATICS数理与生物工程学院64一级结构指多肽链中氨基酸的一定的顺序,靠共价键维持多肽链的连接,而不涉及其空间结构。这一定义对只含氨基酸的简单蛋白质是适用的。对复合蛋白,完整的一级结构概念应包含肽链以外的其它成分(例如糖蛋白上的糖链,脂蛋白上的脂质部分等)以及这些非肽链部分是以何种方式,接在肽链中的哪些残基上。蛋白质的一级结构是一个无空间概念的一维结构。\n2021/7/24BIOINFORMATICS数理与生物工程学院65蛋白质二级结构是指多肽链借助于氢键沿一维方向排列成具有周期性的空间结构。主要有:α-螺旋、β-折叠、转角、环形和无规卷曲等。在一个蛋白质的肽链中,不是所有的肽段都是有规则的二级结构。肽链中的规则的二级结构和其它无规则的肽段一起,构成的完整立体结构则是蛋白质的三级结构。换句话说,蛋白质的二级结构是构成蛋白质三级结构的部件。\n2021/7/24BIOINFORMATICS数理与生物工程学院66二级结构和三级结构之间,还存在一些被公认的过渡的结构层次。一个是超二级结构,另一个是结构域。当然并不是所有蛋白质中都一定存在这些过渡结构层次。一般地说,分子量较大的蛋白质出现多个过渡性结构层次,特别是结构域的可能性更大。超二级结构是1973年Rossman提出的,相邻的二级结构单元组合在一起,彼此相互作用,排列成规则的、在空间上能够辨认的二级结构组合体,并充当三级结构的构件,称为超二级结构。常见的几种超二级结构。\n2021/7/24BIOINFORMATICS数理与生物工程学院67a.α-loop-αb.β-α-βc.β-loop-β\n2021/7/24BIOINFORMATICS数理与生物工程学院68图2-15几种常见的蛋白质超二级结构d.Rossmann折叠e、f、g.“希腊钥匙”拓扑结构\n2021/7/24BIOINFORMATICS数理与生物工程学院69结构域概念是免疫化学家Porter提出的,介于二级结构与三级结构之间,多肽链在超二级结构的基础上进一步折叠成紧密的近乎球状的结构,称为结构域。\n2021/7/24BIOINFORMATICS数理与生物工程学院70图2-16结构域\n2021/7/24BIOINFORMATICS数理与生物工程学院71为了理解蛋白质和结构域在形成三级结构时,分子内含有哪些二级结构单元和超二级结构,以及它们又是如何排列和相互作用的,人们提出了折叠子(folds)的概念。折叠子反映了一个蛋白质核心结构的拓扑结构模式,包含了蛋白质分子空间结构组成的三个主要方面:即二级结构单元,二级结构单元的相对排列位置关系,以及多肽链的走向。\n2021/7/24BIOINFORMATICS数理与生物工程学院72蛋白质折叠子是近几年出现的新概念,其定义和解释尚存在一些不同的看法。尽管蛋白质序列数目数以百万计,折叠的种类却极为有限,很可能不超过100种。折叠子主要有4种结构类型,全α蛋白、全β蛋白、α/β蛋白和α+β蛋白。蛋白质4种折叠类型的定义为:\n2021/7/24BIOINFORMATICS数理与生物工程学院73全α蛋白—α螺旋含量大于40%,β折叠含量小于5%。全β蛋白——α螺旋含量小于5%,β折叠含量大于40%。α/β蛋白——α≥15%,β≥15%。而且两种构象单元在肽链中是交替出现的。α+β蛋白——α≥15%,β≥15%。两种构象单元分别聚集和分布在不同的区域。对只有单个结构域的蛋白,结构域就是三维结构。对多结构域蛋白质,结构域与结构域之间以松散的肽段连接起来,组装成蛋白质的三级结构。\n2021/7/24BIOINFORMATICS数理与生物工程学院74蛋白质的四级结构这个概念最早是由Bernal于1958年提出的,是指亚基与亚基之间通过疏水相互作用,结合成为有序排列的空间结构。\n2021/7/24BIOINFORMATICS数理与生物工程学院75图2-17蛋白质四级结构\n2021/7/24BIOINFORMATICS数理与生物工程学院76§2.3遗传信息的载体—DNA核酸最早是在1869年由瑞士科学家Miescher发现的。他先学医,后在其叔父(解剖学家)的影响下,学习组织化学,从事细胞化学组份的研究。他使用绷带上的脓液,用稀硫酸溶液洗涤绷带,分离细胞,再用稀碱抽提细胞,发现这些物质的磷含量很高(2.5%),命名为核素(nuclein)。\n2021/7/24BIOINFORMATICS数理与生物工程学院77自Miescher发现核酸后,吸引了不少化学家。他们对组成核酸的成份感兴趣,用各种方法分离核酸,并从中得到嘌呤和嘧啶碱基。Kossel发现了腺嘌呤、尿嘧啶、胞嘧啶和胸腺嘧啶,Levene则对核糖、2`-脱氧核糖核苷和核苷酸的鉴定作出了重要贡献。1944年,Avery证明遗传物质是DNA,而不是蛋白质。1945年以后,研究大分子的手段有了重大进展。\n2021/7/24BIOINFORMATICS数理与生物工程学院78是由4种“单体”核苷酸聚合而成的一维、有方向、不分岔的大分子。每个核苷酸有一个5碳糖、一个磷酸根和一个碱基。4种不同的碱基导致4种核苷酸:腺苷酸、鸟苷酸、胞苷酸和胸苷酸,分别用A,G,C,T等4种字母代表。2.3.1核酸的组成\n2021/7/24BIOINFORMATICS数理与生物工程学院79图2-18核苷酸组份的化学结构示意图\n2021/7/24BIOINFORMATICS数理与生物工程学院80图2-19核苷酸化学结构简图\n2021/7/24BIOINFORMATICS数理与生物工程学院81根据5碳糖上特定位置的羟基(OH)是否脱氧剩下一个氢(H),相应大分子称为核糖核酸(RNA)或脱氧核糖核酸(DNA)。RNA中对应胸苷酸的字母T换成尿苷酸U,还是4种字母。\n2021/7/24BIOINFORMATICS数理与生物工程学院822.3.2DNA的结构Watson和Crick在1953年提出的DNA分子双螺旋结构模型对整个生命科学产生了强烈的影响,DNA双螺旋结构的发现是生物学革命中最为人熟知的标志。按照WatsonCrick模型,DNA是一多聚链,基本单元是核苷酸。每一核苷酸由5-碳环(脱氧核糖),连接在核糖上的含氮碱基和磷酸基团组成。连接在核酸的糖环上的是四种碱基中的一个:腺嘌呤(A),鸟嘌呤(G),胸腺嘧啶(T)和胞嘧啶(C)。嘌呤是双环的,尺寸较大;嘧啶是单环的,尺寸较小。\n2021/7/24BIOINFORMATICS数理与生物工程学院83碱基配对有特异性,A与另一链上的T配对,G与另一链上的C配对。DNA通常以双链形式存在,分处在两个链上的G和C以三个氢键相联,而两个链上的A和T以两个氢键相联,维系整个双链结构。两条链上字母的这种对应关系,称为Watson-Crick配对。这样,一条链上的核苷酸顺序就决定了另一条链的顺序。DNA结构本身就揭示了DNA是怎样储存和传递信息的。因此,就信息含量而言,两条链是等价的,知道其中一条,就可以推测出另一条。然而,就基因含量而言,两条链是不等价的,每条链编码的基因不同,基因的数目也可以不同。\n2021/7/24BIOINFORMATICS数理与生物工程学院84在脱氧核糖核苷中,其C1`与嘧啶的N-1或与嘌呤的N-9相连接。下图为两种碱基配对的方式。图2-20碱基对化学结构\n2021/7/24BIOINFORMATICS数理与生物工程学院85下图直观地说明DNA结构的伸展平面示意图和立体结构示意图图2-21DNA的伸展平面示意图、带状图和堆积球模型\n2021/7/24BIOINFORMATICS数理与生物工程学院86RNA通常以单链存在,但其局部碱基可以配对,形成各种二级结构,如内环、膨胀环、发卡等。图2-22RNA结构\n2021/7/24BIOINFORMATICS数理与生物工程学院87DNA是遗传信息的载体,RNA则既可能传递信息,也可能形成结构或发挥催化作用。历史上可能有过只存在RNA的时期,后来才进化出DNA及其与蛋白质的精巧的编码关系,而RNA至今还在许多方面起着重要的中介作用。真核生物的DNA在组蛋白的帮助下形成一定数目的染色体,染色体藏在细胞核内。\n2021/7/24BIOINFORMATICS数理与生物工程学院88§2.4分子生物学中心法则生物体除了某些病毒或噬菌体是以RNA分子作为其遗传信息的载体外,绝大多数生物是以DNA分子作为其遗传信息的载体。有些基因编码的最终产物是RNA分子,如rRNA基因、tRNA基因以及其它小分子RNA基因等,而其它一些基因编码的最终产物则是蛋白质。蛋白质是生命活动的主要实现者。蛋白质分子之间、蛋白质与核酸分子(DNA或RNA)之间以及核酸分子之间的相互作用,构成了生命活动的最核心问题。\n2021/7/24BIOINFORMATICS数理与生物工程学院89编码在DNA或RNA上的遗传信息是如何传递的呢?DNA双螺旋结构的发现者之一英国科学家Crick在实验数据尚不充分的情况下,于1958年提出了遗传信息传递的中心法则,后来为众多实验事实所证实和补充,成为图2-23所示的中心法则。\n2021/7/24BIOINFORMATICS数理与生物工程学院90图2-23Crick于1958年提出的中心法则\n2021/7/24BIOINFORMATICS数理与生物工程学院91简单地说,DNA双螺旋是遗传信息的携带者,它在一定条件下可以准确地自我复制。遗传信息只能通过最终的蛋白质产物体现。为此要先把信息“转录”到单股的信使RNA,即mRNA链上。后者与前者的差别,仅在于把DNA序列中的T换成了mRNA中的U,然后经过可变剪切,成为成熟的mRNA。细胞中有大量的核糖体,它们是根据mRNA上的信息制造蛋白质的加工厂。\n2021/7/24BIOINFORMATICS数理与生物工程学院92新生的蛋白质要折叠成特定的三维形状,才能有生物活性,在生命过程中发挥功能。复制、转录、转译作为生物学中心法则的三个关键步骤,一直是分子生物学研究的核心问题。\n2021/7/24BIOINFORMATICS数理与生物工程学院93中心法则认为,遗传信息一旦转移到蛋白质后,就不能反向传递。但是,这只是细胞中发现的信息传递的一般路线,而没涉及反转录等特殊问题。随着分子生物学研究的深入,人们发现有很多RNA病毒,如小儿麻痹症病毒、流行性感冒病毒以及大多数单链的噬菌体,都能进行RNA复制。\n2021/7/24BIOINFORMATICS数理与生物工程学院941970年Temin和Baltimore发现,有一些RNA肿瘤病毒如劳斯氏肉瘤病毒,在寄主细胞中的复制过程中,先以病毒的RNA分子为模板,在反转录酶的作用下合成DNA互补链,然后以DNA链为模板合成新的RNA链。也就是说,遗传信息可以从RNA反向传递到DNA。1971年Crick根据新的进展修改了中心法则,提出了更为完整的模式:\n2021/7/24BIOINFORMATICS数理与生物工程学院95图2-241971年Crick修改的中心法则\n2021/7/24BIOINFORMATICS数理与生物工程学院96图中的实线箭头所示的是三种普遍存在于绝大多数生物细胞中的遗传信息的传递方向。虚线箭头表示的是特殊情况下遗传信息的传递方向,只存在于极少数生物中。而遗传信息从DNA直接到蛋白质的传递,只是理论上的可能性,迄今尚未在活细胞中得到证实。下面分别对中心法则中的关键步骤作一简要说明。\n2021/7/24BIOINFORMATICS数理与生物工程学院972.4.1DNA的复制单细胞是生命的基本单位,DNA自我复制是细胞周期中的重要事件。通过称之为细胞分裂的过程的不断重复,细胞可不断扩增。在细胞分裂前,必须先完成DNA的复制,这样保证遗传信息可传到子代。复制过程靠许多种酶的帮助,其中最重要的是DNA聚合酶。该酶以DNA链为模板,以dATP、dTTP、dCTP和dGTP4种脱氧核糖核苷三磷酸为原料,按照碱基配对原则合成与模板DNA链互补的新链。DNA聚合酶有两个特性对理解复制过程十分重要。\n2021/7/24BIOINFORMATICS数理与生物工程学院98第一,它作用的方向,只能从5`端往3`端发展。第二,它必须以一条单链DNA作模板,模板的3`端要先有一小段耦合好的双链引物(primer)。这些引物是引物酶(primase)协助合成的小段RNA。引物的3`端悬在那里,DNA聚合酶就从那里开始根据模板的要求,把适当的核苷酸按5`→3`方向聚合上去,形成双链。DNA连接酶催化双链DNA切口处的5`-磷酸基和3`-羟基生成3`,5`-磷酸二酯键,使两个DNA片段连接在一起。\n2021/7/24BIOINFORMATICS数理与生物工程学院99在细胞内部,DNA复制发生在称为复制叉的Y型结构处。在DNA解旋酶的作用下,DNA双链解螺旋。双链解旋后,形成称为复制叉的Y型结构。复制叉沿亲代双螺旋稳定地滑动,叉后形成的是子代DNA(Y的两臂)。因此,随着复制叉的移动,DNA聚合酶只能在Y的一个臂上按5`→3`产生子代单链,这条链称为先导链。另一条链从5`→3`方向,其上RNA引物在DNA聚合酶帮助下只能向着与复制过程相反的方向延长,长出一个小片段。\n2021/7/24BIOINFORMATICS数理与生物工程学院100这时,复制叉后面的空白单链上已经形成又一小段引物,继续长出新的小片段。这些不连续的小片段称为冈崎片段(Okazakifragments),要在特定的酶协助下修补、连接,同时DNA聚合酶I把引物RNA变成DNA,最终产生完整的双链。这条手续繁杂的链称为后随链。复制过程还有其它一些酶如拓扑异构酶等参与。\n2021/7/24BIOINFORMATICS数理与生物工程学院101图2-25DNA复制叉\n2021/7/24BIOINFORMATICS数理与生物工程学院102a.按照上面股所示,核苷三磷酸是DNA聚合酶的底物。每一核苷三磷酸由三个磷酸(这里用三个黄色小球表示)、一个脱氧核糖环(矩形)和四个碱基之一(柱体)组成。三个磷酸由高能键相互连接在一起,在聚合反应过程中,这些键裂解释放每一核苷酸加入DNA链所需要的能量。下面股所示的导致DNA链按3`→5`方向延伸实际上不会发生。\n2021/7/24BIOINFORMATICS数理与生物工程学院103b.DNA聚合酶催化链只能沿5`→3`方向延伸,但两条新生链都在复制叉处生长,所以一个佯谬是下面股的新生链如何合成?早在20世纪70年代就发现了复制叉的反对称性,现在知道先导链连续合成,而后随链采用图示的倒缝机制。这样,两股都按5`→3`方向延伸。\n2021/7/24BIOINFORMATICS数理与生物工程学院104图2-26DNA复制叉处的核心蛋白a)复制叉处蛋白质的一般机制b)复制叉后随链实际上可能是回折的\n2021/7/24BIOINFORMATICS数理与生物工程学院1052.4.2DNA到mRNA的转录转录是基因表达的第一个阶段。转录就是以DNA分子为模板,合成出与其核苷酸顺序相对应的RNA的过程。双股DNA螺旋的每一股上,都散布着长短不等的包含遗传信息的片段,即“基因”。基因内部还有特定的结构。从5`→3`方向,首先是一段并不翻译成蛋白质的区域,即所谓的5`UTR区(UnTranslatedRegion)。这些区域中有很多保守区域,通常是某些蛋白质(酶、蛋白因子)的结合位点,例如启动子(promoter)、增强子(enhancer)等。\n2021/7/24BIOINFORMATICS数理与生物工程学院106然后是编码区的起始密码子,最常见的是编码甲硫氨酸的ATG,也有不少例外。编码区以三个终止密码子(UAA、UAG及UGA)之一结束。然后3`是UTR区,主要是一些有关结束转录的信息。\n2021/7/24BIOINFORMATICS数理与生物工程学院107原核生物只有一种RNA聚合酶负责转录所有的基因,而真核生物有多种RNA聚合酶。RNA聚合酶需要以4种核苷三磷酸为底物,并需适当的DNA作为模板。与DNA聚合酶不同的是RNA聚合酶无需引物,它可以直接在模板上合成RNA链,合成方向为5`→3`。真核细胞中的RNA聚合酶有I、II、III3类,分别催化rRNA、mRNA和tRNA的合成。\n2021/7/24BIOINFORMATICS数理与生物工程学院108原核生物的转录基因表达是从转录开始的,借助RNA聚合酶生成基因的RNA拷贝。实际上,原核生物的RNA聚合酶由几种不同的蛋白质组装而成,每种蛋白质在酶的功能中扮演独特而重要的角色。\n2021/7/24BIOINFORMATICS数理与生物工程学院109蛋白是负责识别启动子的亚单元,不同的σ因子形成了不同的RNA聚合酶,这是决定细胞开放和关闭基因表达的直接原因。例如,大肠杆菌中有7个不同的σ因子,它们帮助RNA聚合酶结合到DNA上-35位和-10位的序列。大肠杆菌在响应热休克而表达相应基因时,就通过含σ32的RNA聚合酶来搜出那些带有σ32启动子的基因。大肠杆菌中约有70%的基因在正常的生长和发育过程中都要表达,这些基因由含σ32的RNA聚合酶转录。\n2021/7/24BIOINFORMATICS数理与生物工程学院110RNA聚合酶识别基因启动子能力的高低直接关系着它启动转录过程的难易。由特定σ因子识别的-35位和-10位序列通常称为一致序列——本质上是含相同σ因子的RNA聚合酶转录的基因在相应位置上最常出现的核苷酸片段。基因的-35位和-10位序列与一致序列越匹配,RNA聚合酶就越有可能与启动子结合以开启转录。\n2021/7/24BIOINFORMATICS数理与生物工程学院111许多基因的蛋白质产物需要与其他基因的蛋白质产物结合在一起才能发挥作用。在原核生物DNA序列中,编码蛋白质和RNA的几个基因往往聚集在基因组的一个连续区域,形成一个功能单位或转录单元,它们可以被一起转录为含多个mRNA的分子,形成多顺反子mRNA。多个功能相关的基因共享一个启动子,这些基因排列成的结构称为操纵子(operon)。这提供了一个简捷的方法,保证当其中一个基因被转录时,其他具有相关功能的基因也被转录。\n2021/7/24BIOINFORMATICS数理与生物工程学院112正如通过RNA聚合酶识别紧接启动子下游的转录起始位点来开启转录一样,绝大部分原核生物操纵子(大于90%)也包含标志转录终止的特异性信号,称作固有终止子(intrinsicterminator)。固有终止子有两个主要的结构特征:\n2021/7/24BIOINFORMATICS数理与生物工程学院113①包括反向重复的核苷酸序列(即序列5`-CGGATG|CATCCG-3`,其中包含了以“|”为中心的反向重复序列,因为对于5`-CGGATG-3`,按照其互补链的读法为5`-CATCCG-3`);\n2021/7/24BIOINFORMATICS数理与生物工程学院114②紧跟着反向重复序列有连续6个左右的尿嘧啶。虽然一般认为典型的RNA分子是一条单链,但由于反向重复序列中的分子内碱基配对作用,RNA分子有可能形成稳定的二级结构。\n2021/7/24BIOINFORMATICS数理与生物工程学院115真核生物的转录RNA聚合酶在基因表达起始阶段和基因5`-端上游区域的某一段核酸序列结合,然后开始转录,合成基因的RNA拷贝,这一段核酸序列称为启动子。启动子决定了DNA转录的方向、速度和准确性。启动子是RNA聚合酶的结合位点,由此开始启动转录。\n2021/7/24BIOINFORMATICS数理与生物工程学院116启动子前后还有若干其他起控制作用的DNA片段。特别是在真核生物中,这些控制片段更为多样。典型的启动子常包含TATA片段、CAAT片段等,但没有这些片段的启动子也不少。\n2021/7/24BIOINFORMATICS数理与生物工程学院117通过对许多基因的启动子进行解析、比较,发现了相当保守的启动子序列。如前面所述,对于原核基因,在转录起始点上游l0bp处,有一个嘌呤盒(box)序列,即T80A90T45A60A50T96。这里,字母右下角的数字为相应碱基出现的频率。另外,在转录起始点上游35bp处,有一段保守序列:T82T84G78A65C54A45。对于真核基因,在转录起始点上游30bp处,有TATA盒(TATAbox);在上游80bp处有一个CAAT盒(CAATbox);而在上游80~ll0bp附近含有GCCACACCC或GGGCCGGG序列,这称为GC盒(GCbox)。\n2021/7/24BIOINFORMATICS数理与生物工程学院118启动子的定义是相对于转录起始点上游有相对固定位置的DNA序列,包括TATACAAT盒和GC盒,一般在从转录起始点到上游150bp这段范围内。这些上游保守序列统称为上游启动子元件(upstreampromoterelement,UPE)。\n2021/7/24BIOINFORMATICS数理与生物工程学院119RNA聚合酶必须准确识别基因转录的起始位置。RNA聚合酶在寻找基因的起点时不能寻找任意一个特定的核苷酸,因为在细胞的DNA分子中,单一核苷酸出现的频率非常高。然而,核苷酸间的特定组合却不容易随机出现,并且,涉及的核苷酸的数目越多,该组合出现的几率变得越小。如果所有核苷酸以相同概率出现,那么特定核苷酸串单独出现的概率为p=(1/4)n,n是核苷酸的数目。\n2021/7/24BIOINFORMATICS数理与生物工程学院120原核生物的RNA聚合酶扫描整条DNA,寻找标记基因起点的约为13个核苷酸长度的特定核苷酸序列(一个核苷酸是转录起始位点,6个核苷酸位于距起始位点上游10个碱基处,另6个核苷酸位于起始位点上游35个碱基处),这些启动子序列之间的相对位置固定。由于多数原核生物的基因组只有几百万个核苷酸,这些启动子序列结合在一起的几率约为1/7000万,这足以让RNA聚合酶可靠地、惟一地识别基因的起始位置。\n2021/7/24BIOINFORMATICS数理与生物工程学院121真核生物的基因组比原核生物大几个数量级,相应地,真核生物的RNA聚合酶要识别更为复杂和更长的启动子序列,以便也能可靠地识别基因的起始位置。\n2021/7/24BIOINFORMATICS数理与生物工程学院122原核生物的RNA聚合酶几乎不依赖其它蛋白质因子就能识别并结合到启动子DNA序列上,从而开始转录合成。但真核生物RNA聚合酶则必须依赖一系列蛋白质因子才能识别启动子,与之结合并启动转录。\n2021/7/24BIOINFORMATICS数理与生物工程学院123这些蛋白质因子称为转录因子。转录因子分为两类:一类是结合在启动子核心部位如TATA盒的因子,称为普通转录因子,如TFIIA、TFIIB、TFIIIA、TFIIIB等;另一类是结合在启动子上游和增强子部位的因子,称为转录调控因子,如SP-1、CTF、AT-1、Oct-1等。各种转录因子帮助RNA聚合酶结合到控制片段上,启动和完成RNA转录。\n2021/7/24BIOINFORMATICS数理与生物工程学院124\n2021/7/24BIOINFORMATICS数理与生物工程学院125图2-27基因激活的最新模型集中在没有组蛋白的DNA上,基因包含着一个专司蛋白质氨基酸序列的编码区(1中最右边的带)和决定是否制造被编码的蛋白质的两个主要调节区—最贴近的启动子和上游激活子顺序。模型指出,如果某个基因需要被起动(2),那么叫做基本因子的那些蛋白质必须装配在启动子的TATA单元上(最左边的带)。这样的装配把一个基本因子—RNA聚合酶—配置在转录-起始1的位置上(最右边的带),使这个酶得以把编码区里的信号拷贝(即转录)成信使RNA(模板,被编码的蛋白质就是根据此模板合成的)。所谓的激活子蛋白和上游激活子顺序相结合可产生基本复合物的刺激作用和最大的转录。\n2021/7/24BIOINFORMATICS数理与生物工程学院126TATA盒与其他两个UPE的作用不同。前者的主要作用是使转录精确地起始,如果去除TATA盒或进行突变,转录产物下降的相对值不如CAAT盒或GC盒突变后的明显,但发现所获得的RNA产物的起始点不固定。\n2021/7/24BIOINFORMATICS数理与生物工程学院127CAAT盒和GC盒主要控制转录的起始频率,基本不参与起始位点的确定。CAAT盒对转录起始频率的影响最大,该区域任意一个碱基的改变都将极大地影响靶基因的转录强度,而启动区其他序列中一两个碱基的置换对转录强度则没有太大的影响。此外,在TATA盒和相邻的UPE之间插入核苷酸也会使转录减弱。尽管上述3种UPE序列都有着重要的功能,但并不是每个基因的启动子区都包含这3种序列。\n2021/7/24BIOINFORMATICS数理与生物工程学院128启动子对转录固然重要,但是启动子上游部位的序列是否和转录就没有关系呢?人们在研究SV40病毒时发现,启动子上游的某些序列如果发生变化,则可能大大降低转录的活性。这些序列在正常的情况下能对转录起增强作用,所以称为增强子(enhancer)。增强子一般能使转录频率增加10-200倍。增强子有几个显著的特征:\n2021/7/24BIOINFORMATICS数理与生物工程学院129(1)增强子的序列较长,可达数百个碱基对。有时是重复序列,其内部常含有一个核心序列“(G)TGGA/TA/TA/T(G)”。(2)作用距离比较远,可以远离它所作用的基因,达数千个碱基之远。(3)作用没有方向性,序列正反颠倒过来,同样起作用。(4)位置不固定,可以是在某个基因的5`—端上游,也可以是在3`—端下游,甚至可以在基因的内含子内。(5)一般具有组织或细胞特异性。(6)增强子的活性与它在DNA双螺旋结构中的空间方向性有关。\n2021/7/24BIOINFORMATICS数理与生物工程学院130除了启动子和增强子之外,还有一种负调控元件,即沉默子(silencer)。通过沉默子可以抑制基因的表达,或对基因进行有选择性的表达。\n2021/7/24BIOINFORMATICS数理与生物工程学院131图2-28转录装置的卡通图\n2021/7/24BIOINFORMATICS数理与生物工程学院132真核生物刚从DNA转录出来的mRNA前体还要继续加工,才能作为成熟的mRNA,经过核孔送到细胞质中的核糖体去翻译成蛋白质。加工的主要内容是剪去不表达的内含子(intron),把将来要表达的外显子(exon)连接起来。\n2021/7/24BIOINFORMATICS数理与生物工程学院133图2-29真核基因转录后加工机制示意图\n2021/7/24BIOINFORMATICS数理与生物工程学院1342.4.3mRNA翻译为蛋白质蛋白质合成本质上将mRNA的核苷酸序列转换为蛋白质的氨基酸序列,是两种不同语言的转换,所以把这一过程称为“翻译”。核糖体是根据mRNA上的编码信息制造蛋白质的生物化学工厂。细菌细胞里大约有两万个核糖体,而真核细胞里则多达百万。\n2021/7/24BIOINFORMATICS数理与生物工程学院135他们的结构大同小异,都是由相当复杂的rRNA骨架和许多蛋白质组成的复合物,由大小两个亚基组成。大肠肝菌的核糖体大亚基由一个23SrRNA和一个5SrRNA作骨架,上面结合了31个蛋白质,而小亚基的16SrRNA骨架上结合了21个蛋白质。哺乳动物核糖体大亚基有28S、5.8S和5S三个rRNA以及49个蛋白质,小亚基有一个18SrRNA和33个蛋白质。\n酵母tRNAAla的二级结构DHU环IGC反密码子反密码环氨基酸臂可变环TψC环CCAAla3´5´\n2021/7/24BIOINFORMATICS数理与生物工程学院137下面以原核生物为例,考察一下根据mRNA所携带的信息制造蛋白质的“翻译”过程。首先,有一批酶协助mRNA和核糖体完成蛋白质的生产:起始因子帮助mRNA先和空闲的小亚基结合,找到携带第一个甲硫氨酸的tRNA,再把它们和大亚基拼接到一起,开始翻译;延长因子使翻译过程一直继续下去,新生的肽链不断延长;最后达到终止密码子时,由结束因子终止翻译过程;新生的蛋白质肽链和mRNA离开核糖体,大小亚基分开,等待下一轮合成任务。\n2021/7/24BIOINFORMATICS数理与生物工程学院138真正的“翻译”过程是由一大类tRNA完成的。每个tRNA有一只三个相连的“反”密码子组成的“脚”,和一只抓住与相应密码子对应的氨基酸的“手”。当它的脚踩住mRNA上恰好合适的密码子时,那个氨基酸就被带来接到新生肽链的末端。一般地说,同一时间在核糖体里,有三个tRNA:一个携带着下一步需要的氨基酸;一个带着已经合成的肽链,准备把新的氨基酸接上去;\n2021/7/24BIOINFORMATICS数理与生物工程学院139第三个tRNA在上一步里已经把接好氨基酸的肽链转交给带来氨基酸的那个tRNA,现在空着手准备离开核糖体到细胞质里去寻找合适的氨基酸,继续执行运输任务。由于遗传密码的“简并”,tRNA有许多种。据说,细胞质中至少要31种tRNA和相应的氨基酸,翻译过程才能不断进行。\n2021/7/24BIOINFORMATICS数理与生物工程学院140图2-30真核基因的转译与调控\n2021/7/24BIOINFORMATICS数理与生物工程学院1412.4.4遗传密码当我们仔细分析转录和转译这两个过程时会发现,转译与转录不同,它不是简单的核苷酸顺序的抄写,而是将RNA分子上的核苷酸语言翻译成蛋白质分子上的氨基酸语言的复杂过程,涉及到两种不同语言信号之间的更换问题。因此,在转译过程中,必定存在着一种特殊的遗传密码系统,才能够将RNA分子上的核苷酸顺序,同蛋白质分子上的氨基酸顺序联系起来。\n2021/7/24BIOINFORMATICS数理与生物工程学院14220世纪50年代末和60年代初,关于遗传密码的研究是基因分子生物学中最活跃的课题之一。经过许多人共同的努力,到1961年底有关遗传密码的若干最主要问题已经得到了解决。\n2021/7/24BIOINFORMATICS数理与生物工程学院143第一个问题是碱基三联体密码子编码一个氨基酸。第二个问题是确定密码子不重叠的确定。第三个问题是明确了密码子之间不存在逗号的确定。解决了上述这些问题后,剩下的问题就是设法弄清楚每一种氨基酸到底是由哪一种三联密码子编码的。破译这些密码子的最有效的办法是,利用合成的已知其核苷酸顺序的mRNA作模板,在体外无细胞体系中进行转译反应。\n2021/7/24BIOINFORMATICS数理与生物工程学院144然后分析合成的蛋白质多肽链的氨基酸顺序,并同mRNA的核苷酸顺序作比较,从而测定出密码子中3个核苷酸的顺序,及其对应的氨基酸。1964年Nirenberg及其合作者采用新的体外转译体系,可用三核苷酸短链代替合成的mRNA来识别氨基酸。\n2021/7/24BIOINFORMATICS数理与生物工程学院145这样,只要合成已知顺序的三核苷酸就可测定出相应的氨基酸的密码子。1966年,Khorana发明了利用重复的共聚体破译密码子的途径,并因此发现了3个终止密码子。至此,64个密码子便全部破译出来了。下表所列的为通用的遗传密码。\n2021/7/24BIOINFORMATICS数理与生物工程学院146图2-31遗传密码表\n2021/7/24BIOINFORMATICS数理与生物工程学院14720世纪90年代初发现,有些新生肽链要剪去中间一段,把两边连接起来,才变成为成熟的功能蛋白,这称为蛋白质的剪接。与内含子(intron)和外显子(exon)类比,被剪切掉的肽链称为“内质”(intein)或“蛋白质内含子”,而保留下来的部分称为“外质”(extein)。2.4.5蛋白质的剪接\n2021/7/24BIOINFORMATICS数理与生物工程学院148§2.5基因组基因组(genome)是细胞或生物体的全套遗传物质,或载有遗传信息的全体核酸,包括所有染色体上的核酸,对于真核生物,其基因组还包括线粒体上的核酸。各种生物体之间存在着差异,这种差异正是由基因组所决定的。各种生物体基因组的大小变化很大,最小的只有5000bp(basepair),如最简单的病毒,最大的有1011bp,如一些高等植物。\n2021/7/24BIOINFORMATICS数理与生物工程学院149人类基因组由3.2×109bp的DNA组成,包括细胞核染色体基因组和细胞质内线粒体基因组。细胞核染色体基因组中大约有一半为不同的重复序列,含基因2.5万~3.5万个。基因组控制着生物体的生长发育,控制着生命活动。要想认识生物的本质,就必须首先认识基因组,掌握基因组的所有核酸序列,解析基因组的全部遗传信息,理解遗传信息的组织结构及其在生物体内的表达。\n2021/7/24BIOINFORMATICS数理与生物工程学院150染色体是基因的载体,染色体包括DNA和蛋白质两部分。原核生物的染色体实际上就是一个裸露的DNA分子,其中只含有极少量的蛋白质。真核生物的染色体位于细胞核的核仁内,由DNA和蛋白质结合而成,DNA和蛋白质完全融合在一起,其比例约为1:2,蛋白质在染色体的结构中起着重要的作用。2.5.1染色体结构\n2021/7/24BIOINFORMATICS数理与生物工程学院151每条染色体所携带的DNA量是一定的,但是不同染色体或不同物种对应染色体之间变化很大,从上百万到几亿个核苷酸不等。此外,同一物种每条染色体的蛋白质种类和含量也是十分稳定的。由于细胞内的DNA主要集中在染色体上,所以说遗传信息的主要载体是染色体。真核生物由于富含DNA,因而具有原核生物所没有的许多潜能。\n2021/7/24BIOINFORMATICS数理与生物工程学院152作为遗传物质,染色体具有几个明显的特征:①分子结构相对稳定;②能够自我复制,使亲代和子代之间保持连续性;③能够指导蛋白质合成,从而控制整个生命过程;④能够产生可遗传的变异。\n2021/7/24BIOINFORMATICS数理与生物工程学院153真核细胞染色体上的蛋白质主要包括组蛋白和非组蛋白。组蛋白是一类较小而带有正电荷的核蛋白,与DNA有很高的亲和力。组蛋白是染色体的结构蛋白,它与DNA组成核小体。由DNA和组蛋白组成的染色质(chromatin)纤维细丝是许多核小体连接而成的念珠状结构。人们发现,染色质DNA的杂交解链温度比自由DNA的高,说明在染色质中DNA极可能与蛋白质分子相互作用。\n2021/7/24BIOINFORMATICS数理与生物工程学院154组蛋白在进化上极端保守,不同生物的组蛋白的氨基酸组成十分相似。非组蛋白的种类较多,包括酶类,如RNA聚合酶、包装蛋白、加工蛋白、与细胞分裂有关的收缩蛋白、骨架蛋白、核孔复合物蛋白以及与基因表达有关的蛋白等。在DNA方面,真核细胞基因组的最大特点是它含有大量的重复序列,而且功能DNA序列大多被不编码蛋白质的非功能DNA序列隔开。\n2021/7/24BIOINFORMATICS数理与生物工程学院155图2-32染色质与染色体结构\n1562021/7/24\n1572021/7/24polII与组蛋白修饰的相互关系?\n1582021/7/24常见的组蛋白修饰包括乙酰化、甲基化、磷酸化、泛素化、糖基化、ADP核糖基化、羰基化等等,它们都是组蛋白密码的基本元素。\n1592021/7/24\n1602021/7/24\n1612021/7/24\n2021/7/24BIOINFORMATICS数理与生物工程学院162正常人类体细胞有46条染色体,其中44条(22对)为常染色体,另外2条为性染色体。性染色体在女性中为XX型,在男性中为XY型。染色体在生殖细胞中均为23条,其中卵细胞为22+X,精细胞为22+Y或22+X。\n2021/7/24BIOINFORMATICS数理与生物工程学院163从分子生物学角度看,基因是合成有功能的多肽或RNA分子所必需的所有核酸序列,除了为蛋白质或RNA编码的序列之外,还包括控制基因转录的序列。一般来说,基因是负载特定生物遗传信息的DNA分子片段,在一定条件下能够表达这种遗传信息,产生特定的生理功能。有的生物基因是RNA分子。2.5.2基因的结构\n2021/7/24BIOINFORMATICS数理与生物工程学院164基因具有以下几个重要的特征:(1)基因是一种相对独立的遗传信息单位,这些信息单位可以通过各种方式在生物个体之间进行重新组合,并向后代传递;(2)基因是一段DNA分子,遗传信息储存在DNA序列之中;(3)基因的信息内容通过相应的形式表现出来,即指导合成蛋白质或RNA,进而产生生理功能,或影响其他基因的表达。\n2021/7/24BIOINFORMATICS数理与生物工程学院165按照功能可以将基因分为结构基因和调控基因。结构基因可被转录形成mRNA,并被翻译成多肽链,构成各种结构的蛋白质、酶和激素。调控基因是指某些可调节、控制结构基因表达的基因,其突变可能影响一个或者多个基因的功能,导致蛋白质产物量的改变。此外,还有一些只转录而不翻译的基因,如核糖体RNA基因,也称为rRNA基因,专门转录rRNA。同样,也有转运RNA基因,称为tRNA基因,专门转录tRNA。\n2021/7/24BIOINFORMATICS数理与生物工程学院166在DNA链上,从基因的起始密码子开始到终止密码子为止的一个连续编码序列称作开放阅读框(openreadingframe,ORF)。基因内部还有特定的结构。\n2021/7/24BIOINFORMATICS数理与生物工程学院167基因内部还有特定的结构。从5`→3`方向,首先是一段并不翻译成蛋白质的区域,即所谓的5`UTR区(UnTranslatedRegion)。这些区域中有很多保守区域,通常是某些蛋白质(酶、蛋白因子)的结合位点,例如启动子(promoter)、增强子(enhancer)等。\n2021/7/24BIOINFORMATICS数理与生物工程学院168然后是编码区的起始密码子,最常见的是编码甲硫氨酸的ATG,也有不少例外。编码区以三个终止密码子(UAA、UAG及UGA)之一结束。然后是3`UTR区,主要是一些有关结束转录的信息。\n2021/7/24BIOINFORMATICS数理与生物工程学院169转录区基因启动子终止子转录ATGTAA5`UTR3`UTR转录终止位点核糖体结合位点RNA起点图3-33一种典型的原核蛋白质编码基因的结构示意图\n2021/7/24BIOINFORMATICS数理与生物工程学院170基因的编码区(即转录区)是连续不断的序列,包括一个起始密码子ATG和一个终止密码子TAA。编码区的两侧是转录而不转译的侧翼序列区,其中5`非转译区简称5`-UTR,含有一个核糖体结合位点及一个转录起始信号;3`UTR含有一个转录终止信号。\n2021/7/24BIOINFORMATICS数理与生物工程学院171转录区基因启动子终止子转录ATGTAA5`UTR3`UTRRNA起点初级RNA转录本多聚腺苷酸化位点图3-34一种典型的真核蛋白质编码基因的结构示意图\n2021/7/24BIOINFORMATICS数理与生物工程学院172与原核的蛋白质编码基因相比,最主要的特点是其转录区的编码序列是间断的不连续的,其中编码氨基酸的序列叫外显子,非编码序列叫内含子。转录产生的初级RNA转录本,经过剪切加工(即去掉内含子)后形成功能的mRNA分子。\n2021/7/24BIOINFORMATICS数理与生物工程学院173原核生物的基因组比较小,DNA量低。原核生物基因组的许多信息都是为了维持细胞的基本功能(housekeepinggene),如构建和复制DNA,产生新蛋白质,以及获得和存储能量。在原核基因组中,基因分布的密度非常高,其中的DNA分子的绝大部分是用来编码蛋白质的,只有非常小的一部分不转录,这点与真核生物的DNA分子不一样。2.5.3原核生物基因组\n2021/7/24BIOINFORMATICS数理与生物工程学院174细菌含有染色体和染色体外的质粒DNA。大肠杆菌的基因组DNA是单个双链环状DNA分子,有些细菌还含有存在于细胞质中的小型环状双链DNA。染色体外的DNA也可能含有遗传信息,可以进行自我复制,并将遗传信息传递给子代细胞。\n2021/7/24BIOINFORMATICS数理与生物工程学院175基因表达是从转录开始的,借助RNA聚合酶生成基因的RNA拷贝。实际上,原核生物的RNA聚合酶由几种不同的蛋白质组装而成,每种蛋白质在酶的功能中扮演独特而重要的角色。蛋白是负责识别启动子的亚单元,不同的σ因子形成了不同的RNA聚合酶,这是决定细胞开放和关闭基因表达的直接原因。\n2021/7/24BIOINFORMATICS数理与生物工程学院176例如,大肠杆菌中有7个不同的σ因子,它们帮助RNA聚合酶结合到DNA上-35位和-10位的序列。大肠杆菌在响应热休克而表达相应基因时,就通过含σ32的RNA聚合酶来搜出那些带有σ32启动子的基因。大肠杆菌中约有70%的基因在正常的生长和发育过程中都要表达,这些基因由含σ32的RNA聚合酶转录。\n2021/7/24BIOINFORMATICS数理与生物工程学院177作为一种特别的生物体,病毒(包括嗜菌体)的核酸分子量最小。由于病毒依靠宿主细胞的许多功能来复制自身,所以它们所携带的遗传信息要比宿主细胞少得多。\n2021/7/24BIOINFORMATICS数理与生物工程学院178几乎所有植物病毒、某些细菌病毒和动物病毒的基因组都是由RNA组成的,一般特别小。最小的病毒基因组仅有约5kb,如单链嗜菌体ΦX174;最大的有200kb左右,如T2嗜菌体。病毒基因组虽然小,但是它们所编码的蛋白质种类却不少。有些病毒的基因组不够编码自己的蛋白质,于是就采用重叠基因的办法。\n2021/7/24BIOINFORMATICS数理与生物工程学院1792.5.4真核生物基因组真核生物在各个方面都要比原核生物复杂得多,包括丰富的内部膜系统、复杂的遗传信息表达系统等。在基因组方面,真核生物基因组的规模远大于原核生物基因组,组织复杂,信息含量高。\n2021/7/24BIOINFORMATICS数理与生物工程学院180在整个DNA序列中,蛋白质编码区域仅占一小部分,而非编码序列则占了很大一部分。真核基因结构也远比原核基因结构复杂、多变。真核细胞含有细胞器,例如线粒体或叶绿体。这些细胞器中也含有DNA,但是它们不同于细胞核基因组DNA,它们通常是很小的环状双链DNA分子。\n2021/7/24BIOINFORMATICS数理与生物工程学院181大多数真核基因都是由蛋白质编码序列和非蛋白质编码序列两部分组成的。基因中的编码序列称为外显子(exon),而基因中的非编码序列称为内含子(intron)。在一个结构基因中,编码某一蛋白质不同区域的各个外显子并不是连续地排列在一起的,而是常常被长度不同的内含子所隔离,形成镶嵌排列的断裂方式,所以,真核基因有时被称为分裂基因。\n2021/7/24BIOINFORMATICS数理与生物工程学院182不同基因拥有内含子的数量和大小相差非常悬殊。如胶原蛋白基因,长约40kb,至少具有40个内含子,其中短的只有50bp,长的可达到2000bp。许多真核基因具有大量的有时是非常大的内含子,例如,与人类囊性纤维症有关的基因,含有24个内含子,加起来的长度超过1Mb。而少数基因,如组蛋白,根本不带内含子。目前尚不清楚内含子的生理功能。\n2021/7/24BIOINFORMATICS数理与生物工程学院183许多外显子为蛋白质分散的结构和功能单位编码。例如,肌红蛋白和血红蛋白基因的中央外显子为一个与血红素结合的区域编码,此区域能可逆地与O2结合。其他外显子专一地编码α螺旋片段,这些片段使蛋白质插在细胞膜中。蛋白质的一个结构域可能是由单个外显子编码。\n2021/7/24BIOINFORMATICS数理与生物工程学院184有一种假说认为:在进化过程中,新蛋白质的出现是由于外显子的重新排列,这些外显子编码分散的结构单位、结构部位和催化部位。外显子的混合是产生新基因的迅速而有效的方法。分裂基因有另一个优点,即通过不同方式的剪接而新生的RNA,可能产生一系列相关的蛋白质,这组蛋白质是根据一个发育程序而发生的一个基本特性的变异。\n2021/7/24BIOINFORMATICS数理与生物工程学院185真核基因分裂结构的一个重要特点是外显子—内含子连接区是具有高度保守性和特异性的碱基序列。外显子—内含子连接区是指外显子和内含子的交界,又称边界序列。外显子—内含子连接区虽然很短,但却是高度保守的。这一保守序列(conservedsequence)与剪切机制密切相关,它是RNA剪切的信号序列。\n2021/7/24BIOINFORMATICS数理与生物工程学院186序列分析表明,几乎每个内含子5`-端起始的两个碱基都是GT,3`-端最后的两个碱基总是AG。由于这两个碱基序列的高度保守性和广泛存在性,有人将它称为GT-AG法则,即5`-GT···AG-3`。\n2021/7/24BIOINFORMATICS数理与生物工程学院187由于内含子两端的接头序列不同。因此,可定向标明内含子的两个末端,根据剪切加工过程沿内含子自左向右进行的原则,一般将内含子5`-端接头序列称为左剪切位点,3`-端接头序列称为右剪切位点。有时候,也将前者称为供体位点,将后者称为受体位点。\n2021/7/24BIOINFORMATICS数理与生物工程学院188一个完整的基因,不但包括编码区域,还包括5`-端和3`-端两侧长度不等的特异性序列。虽然这些序列不编码氨基酸,却在基因表达的过程中起着重要的作用。所以,严格的“基因”这一术语的分子生物学定义是:产生一条多肽链或功能RNA所必需的全部核苷酸序列。\n2021/7/24BIOINFORMATICS数理与生物工程学院189§2.6基因表达调控DNA转录和RNA翻译,即遗传信息从基因流向RNA又流向蛋白质的过程总称为基因表达。基因表达可以在不同水平上进行调控,如控制基因的开启、关闭和活性的大小,影响和控制转录和翻译等都属于基因表达的调控。基因的表达是高度有序的,这种有序性正是基因精确表达调控的结果。\n2021/7/24BIOINFORMATICS数理与生物工程学院190下面以原核生物乳糖操纵子为例,简单介绍有关原核生物基因表达调控的基本原理。在1961年,Jacob和Monod提出操纵子模型时,将细胞中基本的看家蛋白质,如代谢酶类、转运蛋白和细胞骨架成份的编码基因,叫做结构基因;编码用以控制其它基因表达的RNA或蛋白质产物的基因,叫做调节基因;而操纵基因则是指接受来自调节基因合成的调节蛋白的作用,使结构基因转录活性得以控制的特定DNA区段,因此,有时操纵基因也叫做控制单元。2.6.1原核生物基因的表达与调控\n2021/7/24BIOINFORMATICS数理与生物工程学院191当乳糖进入到肠道后,大肠杆菌会制造出一些特殊的酶,其中最主要的是β-半乳糖苷酶,来吸收和利用作为细胞能源的乳糖;一旦肠道中没有乳糖时,大肠杆菌就立即停止产生β-半乳糖苷酶。大肠杆菌可以制造出β-半乳糖苷酶,是因为它们具有编码这些酶的基因,即β-半乳糖苷酶基因。大肠杆菌利用乳糖的酶由3种酶组成,它们分别是β-半乳糖苷酶(Z)、透性酶(Y)和硫半乳糖苷乙酰转移酶(A)。编码这3种酶的基因统称为结构基因,它们相互连成一组,组成一个被调控的整体单位。\n2021/7/24BIOINFORMATICS数理与生物工程学院192与这一组结构基因相邻的是一小段协助调控它们的DNA序列,包括启动子和操纵基因。启动子是RNA聚合酶结合的位点,一旦RNA聚合酶与启动子结合,便启动了3种结构基因开始转录。在启动子和结构基因之间的DNA片段是操纵基因,它起一种开关的作用,决定着RNA聚合酶能否与操纵基因结合并向结构基因移动,完成转录过程。所谓操纵子就是一种完整的细菌基因的表达单位,由若干个结构基因、一个或数个调节基因及控制单元组成。\n2021/7/24BIOINFORMATICS数理与生物工程学院193当大肠杆菌培养基中没有乳糖时,由操纵子前端的调节基因编码产生的阻遏蛋白便与操纵基因结合,阻止了RNA聚合酶与启动子的结合,使得乳糖操纵子处于关闭状态,不能转录形成编码β-半乳糖苷酶(Z)、透性酶(Y)和硫半乳糖苷乙酰转移酶(A)的mRNA,当然也就不可能合成相应的3种酶。\n2021/7/24BIOINFORMATICS数理与生物工程学院194在阻遏蛋白始终存在的情况下,乳糖操纵子如何启动呢?当大肠杆菌周围有乳糖存在时,乳糖分子首先可以与阻遏蛋白相互结合,改变了阻遏蛋白的形状,使后者不能再与操纵基因结合。这时,操纵基因便开启着,RNA聚合酶便可以结合在启动子上,然后沿操纵子移向结构基因,转录3种酶的结构基因,进一步形成mRNA。这些mRNA进一步翻译,合成了大肠杆菌利用乳糖的3种酶蛋白。\n2021/7/24BIOINFORMATICS数理与生物工程学院195图2-35乳糖操纵子模型\n2021/7/24BIOINFORMATICS数理与生物工程学院1962.6.2真核生物基因的表达与调控真核生物(除酵母、藻类和原生动物等单细胞类之外)主要由多细胞组成。真核生物有细胞核结构,转录和翻译过程在时间和空间上彼此分开,并且在转录和翻译后都有复杂的信息加工过程,其基因表达的调控可以发生在各种不同的水平上。通常包括以下几个水平:DNA水平的调控,转录前水平的调控,转录水平的调控,转录后水平的调控,翻译水平的调控和翻译后水平调控。真核生物的DNA与蛋白质结合在一起,形成十分复杂的染色质结构。\n2021/7/24BIOINFORMATICS数理与生物工程学院197染色质构象的变化、染色质中蛋白质的变化及染色质对DNA酶敏感程度的变化都会对基因表达产生影响。真核生物的染色质包裹在细胞核内,基因的核内转录和细胞质内的翻译被核膜在时间和空间上隔开,核内RNA的合成与运转、细胞质中RNA的剪切和加工等无不扩大了真核细胞基因调控的范围。对大多数真核细胞来说,基因表达调控最明显的特征是能在特定时间和特定的细胞中激活特定的基因,从而实现“预定”的、有序的、不可逆的分化和发育,并使生物组织和器官在一定的环境条件范围内保持正常的功能。\n2021/7/24BIOINFORMATICS数理与生物工程学院198每个真核细胞所携带的基因数量及基因组中蕴藏的遗传信息量都大大高于原核生物。真核生物基因组DNA中有大量的重复序列,基因内部还插入了非蛋白质编码区域,这些都影响真核基因的表达。因此,真核生物基因调控达到了原核生物所不可能拥有的深度和广度。\n2021/7/24BIOINFORMATICS数理与生物工程学院1992.6.2.1DNA水平的基因调控DNA水平的基因调控是通过改变基因组中有关基因的数量和顺序结构而实现的基因调控。从表面上看,真核生物的体细胞都是受精卵通过有丝分裂而来的,应该都保留有全套染色体的基因组,但是实际上并不都是这样。例如,有一种叫小麦瘿蚊的昆虫,卵裂时,只是形成卵一端的细胞保持全部40条染色体,这些细胞将来形成生殖细胞,而其他部位的细胞只保留8条染色体,当然被丢掉的染色体上的基因是不可能再在某些体细胞中表达了,这种调控是不可逆的。\n2021/7/24BIOINFORMATICS数理与生物工程学院200另一方面,一些基因在生物体发育的某一阶段可以扩增。例如,非洲爪蟾的卵母细胞在大量合成蛋白质时,细胞中的rDNA的拷贝数目,可由平时的1500份急剧增加到2×106份,经转录生成大量的核糖体RNA(rRNA),以满足细胞大量合成蛋白质的需要。这一基因扩增仅发生在卵母细胞中,当胚胎期开始时,这些增加的rDNA便失去功能并逐渐消失。\n2021/7/24BIOINFORMATICS数理与生物工程学院201除了基因的丢失和扩增外,还有一种是染色体上基因的重排。例如,哺乳动物产生免疫球蛋白的有关基因有3种:一种是编码恒定区的蛋白质的,另一种是编码可变区的蛋白质的,第三种是编码将它们连接起来的物质的。上述三种基因处于同一条染色体上,但是相距较远。在产生抗体的浆细胞中,这三个DNA序列通过重排而成为一个完整的转录单位,进而产生抗体分子。\n2021/7/24BIOINFORMATICS数理与生物工程学院2022.6.2.2转录前的调控真核生物核染色质的化学组成中,除DNA之外还有组蛋白、非组蛋白和RNA等物质。实验表明在上述几种物质中,组蛋白有抑制基因转录的作用,非组蛋白则可以解除组蛋白对基因的抑制作用。科学家根据染色质重组实验提出了一个“基因活化的组蛋白转位模型”来说明非组蛋白解除组蛋白抑制作用的机理:组蛋白带有正电荷,DNA带有负电荷,带正电荷的组蛋白与带负电荷的DNA结合抑制了基因的转录。\n2021/7/24BIOINFORMATICS数理与生物工程学院203非组蛋白原来连接在DNA的某一特定位置上,当非组蛋白磷酸化以后,磷酸基带负电荷,于是非组蛋白与带正电荷的组蛋白结合成复合物,这个复合物与带负电荷的DNA相排斥,就从DNA上脱离下来。这样,使原来与组蛋白结合的那个区段的DNA暴露出来,裸露的这段DNA可被RNA聚合酶识别而开始转录(图2-36)。\n2021/7/24BIOINFORMATICS数理与生物工程学院204图2-36基因活化的组蛋白转位模型\n2021/7/24BIOINFORMATICS数理与生物工程学院2052.6.2.3转录水平的调控.我们已经知道细菌的代谢作用会直接受环境因素的影响,它的基因调控的信号常来自环境因素。多细胞的高等生物的代谢作用受环境的直接影响较少,它的基因调控信号主要来自体内的激素。真核细胞基因调控系统很复杂,科学家根据实验提出了一个真核生物的基因调控系统的模型(图2-37)。\n2021/7/24BIOINFORMATICS数理与生物工程学院206图2-37真核生物的基因调控系统模型\n2021/7/24BIOINFORMATICS数理与生物工程学院207这个模型提出,真核生物的结构基因受控于其相邻的感受器,感受器相当于原核生物的操纵基因,经常抑制着结构基因的转录活性。此外,整合基因相当于原核生物的调节基因,它可以形成活化物。活化物可能是一种RNA或蛋白质,作用于感受器,使之解除对结构基因的抑制。整合基因又受感受基因的激活。整个调控过程是:当细胞膜上的受体与激素结合成激素受体复合物以后,作用于感受基因,感受基因可激活其邻近的整合基因,整合基因所形成的活化物可解除感受器对结构基因的抑制,从而开始转录。\n2021/7/24BIOINFORMATICS数理与生物工程学院208除此之外,真核细胞基因在具体的转录中,每个基因的5′端都有启动子(TATA框和CAAT框等),能为RNA聚合酶提供附着部位并准确识别转录起始点。增强子的存在更能加强启动子的效应。RNA聚合酶的种类和数量对转录也有重要作用。RNA聚合酶I催化rRNA的转录,RNA聚合酶II催化mRNA的转录,RNA聚合酶III催化tRNA和5sRNA的转录。这些因素对转录水平都有重要影响。\n2021/7/24BIOINFORMATICS数理与生物工程学院2092.6.2.4转录后调控.在真核细胞中,基因转录的最初产物是前体mRNA,其长度比成熟的mRNA长得多,经过剪切、拼接、戴帽和加尾等加工,才能形成成熟的mRNA。这里所说的剪切和拼接是指剪切掉内含子,把几个外显子拼接起来;戴帽是指在转录后的mRNA的5′端加上一个甲基化的鸟嘌呤核苷酸,形成一个所谓的帽子;加尾是指在转录后的mRNA的3′端加上多聚腺嘌呤核苷酸,形成所谓的尾。mRNA的5′端加帽作用和3′端的加尾作用都有助于提高mRNA的稳定性(图2-38)。\n2021/7/24BIOINFORMATICS数理与生物工程学院210图2-38前体mRNA的转录加工过程\n2021/7/24BIOINFORMATICS数理与生物工程学院2112.6.2.5翻译水平的调控.真核生物基因的翻译调控的一个重要作用是控制mRNA的稳定性。在某些真核细胞中的mRNA进入细胞质以后,并不立即作为模板进行蛋白质合成,而是与一些蛋白质结合形成RNA蛋白质(RNP)颗粒。这种状态的mRNA的半衰期可以延长。mRNA的寿命越长,以它为模板进行翻译的次数越多。家蚕的丝芯蛋白基因是单拷贝的,但在几天内,一个细胞中可以合成多达1010个丝芯蛋白分子。\n2021/7/24BIOINFORMATICS数理与生物工程学院212这是它的mRNA分子和蛋白质结合成为RNP颗粒而延长了寿命的结果。真核细胞中mRNA的平均寿命通常为3h,而丝芯蛋白的mRNA的平均寿命却长达4d,从这里可以看出mRNA的寿命控制着翻译活性。不同发育时期,mRNA的寿命的长短不同,翻译的活性也不同。mRNA的寿命除与5′的帽和3′的尾有关外,还与mRNA结合形成mRNA蛋白质颗粒的蛋白质组分有关。\n2021/7/24BIOINFORMATICS数理与生物工程学院2132.6.2.6翻译后调控.真核生物基因翻译的最初产物是一个大的蛋白质分子。有时,必须经酶切成更小的分子才能有生物活性。这个过程属于翻译后修饰。例如,胰岛素基因翻译的最初产物为胰岛素原,由86个氨基酸组成,包括A、B、C三条肽链,生物活性很低。当把C链切掉后,由A、B链相连形成的含有51个氨基酸的胰岛素,才有较强的生物活性。\n2021/7/24BIOINFORMATICS数理与生物工程学院214§2.7新生肽链的折叠在研究中心法则的同时,人们已注意研究翻译过程所产生的多肽链是如何形成具有完全生物活性的蛋白质的问题。Anfinsen根据著名的核糖核酸酶在变性并还原后可以自发地氧化折叠以恢复天然结构和全部生物活性的实验,提出蛋白质中的氨基酸序列决定其空间结构,即蛋白质的一级结构决定其三维结构的假设。虽然该假设已被广泛地接受,Anfinsen本人也因此而获得诺贝尔奖,但按一定的氨基酸序列排列的多肽链是如何决定蛋白质特定的空间结构仍然是分子生物学中有待解决的问题。\n2021/7/24BIOINFORMATICS数理与生物工程学院215蛋白质的生物活性不仅依赖于它们的氨基酸序列,而且与其空间构象密切相关。蛋白质的三维构象的完整性即使受到轻微的破坏,也可以导致其生物活性的丧失。因此,只有透彻地了解在蛋白质合成过程中新生肽链如何通过自身内在所含的信息以及与周围环境(包括多种蛋白质因子)的相互作用,从而形成具有完全生物活性的蛋白质,才能最终阐明遗传信息传递的全过程,才能深入了解蛋白质空间结构的形成与其功能表达之间的关系。\n2021/7/24BIOINFORMATICS数理与生物工程学院2162.7.1新生肽链的加工核糖体新合成的肽链—新生肽链必须经过一系列极其复杂的加工和成熟过程,才能成为有活性的蛋白质。这个过程包括多肽链的切除修饰、多肽链的糖基化修饰、多肽的烷基化和去烷基化修饰以及多肽末端的修饰。有些新生肽链需要剪去中间一段“内质”,将保留下来的部分“外质”连接起来,才能成为成熟的功能蛋白。内质序列的N一端大约有l00个氨基酸,C一端大约有50个氨基酸,共同构成剪接区。这两个剪接区各有一些保守的模式。\n2021/7/24BIOINFORMATICS数理与生物工程学院2172.7.2新生肽链的折叠新生肽链由一级结构形成三维结构,并成为具有生物活性的功能蛋白的过程称为新生肽链的折叠,这一过程包括了新生肽链的整个成熟过程。蛋白质在行使其生物功能时必须具有特定的三维结构,蛋白质折叠本质上是具有一定氨基酸序列的多肽链逐步折叠形成蛋白质的特定空间结构,从而表现其功能的过程。蛋白质折叠不仅包括新合成的肽链的折叠,也牵涉到诸如蛋白质在细胞中、跨膜运送前后的去折叠和再折叠过程。\n2021/7/24BIOINFORMATICS数理与生物工程学院218新生肽链必须进行折叠,才能形成一定的空间结构,才能发挥其生物活性,成为真正的蛋白质。此外,新合成的多肽链必须定向转运到细胞内特定场所或者被分泌到细胞外,其中,跨膜运送过程可能出现蛋白质的去折叠和再折叠过程,由此蛋白质被运送到特定地点,从而发挥其生物学功能。那么多肽链中的氨基酸序列是按照什么规律决定其折叠成为具有特定构象或空间结构的蛋白质呢,是否在核苷酸密码之外还存在着另一套密码决定着这一过程?\n2021/7/24BIOINFORMATICS数理与生物工程学院219邹承鲁院士在1988年提出了新生肽链折叠的假说,认为新生肽链的折叠在合成早期业已开始,而不是在合成完成后才开始进行;随着肽链的延伸同时进行折叠,又不断进行构象的调整,因此,在肽链延伸过程中形成的结构往往不一定是最终功能蛋白中的结构。这样,新生肽链的合成、延伸、折叠、构象调整,直到最终三维结构的形成,都是一个同时进行的、协调的动态过程。\n2021/7/24BIOINFORMATICS数理与生物工程学院220这一新生肽链折叠的假说,将国际上有关新生肽链折叠的长期争论统一起来,强调了新生肽链折叠的结构信息存在于组成多肽链的氨基酸序列中,既考虑到多肽链中特定氨基酸残基的近程相互作用,又重视特定氨基酸残基的远程相互作用在新生肽链折叠中的重要贡献。这一假说的提出,对于最终翻译折叠密码、开辟新生肽链折叠研究的新思路具有重要的指导意义。\n2021/7/24BIOINFORMATICS数理与生物工程学院2212.7.3蛋白质折叠的一般规律蛋白质折叠问题就是研究蛋白质天然结构是如何形成的,即具有一定氨基酸序列的多肽链如何逐步卷曲形成蛋白质的特定空间结构。蛋白质较易受外界因素的影响而丧失活性,这一过程称为蛋白质的变性。高温、高压及溶液中存在变性剂(如酸、碱等),都能引起蛋白质的变性。蛋白质变性时,维系其空间结构的次级键被破坏,原有的空间结构解体,蛋白质肽链调整其结构以适应新环境。\n2021/7/24BIOINFORMATICS数理与生物工程学院222在弱变性条件下,蛋白质部分变性,肽链保持一定的结构;在强变性条件下,蛋白质完全变性,伸展成无规的随机肽链。很多变性蛋白质在去除变性因素后,可以自发地恢复其原有的空间结构和生物活性,这一过程称为变性蛋白的重折叠或再折叠。\n2021/7/24BIOINFORMATICS数理与生物工程学院223维系和稳定蛋白质天然结构的作用力有氢键、疏水作用力、范德华力、电荷相互作用力、二硫键和配位键。疏水作用实质上也是一种范德华力,但是,由于它对蛋白质构象稳定有特殊作用,因此常单独考虑。\n2021/7/24BIOINFORMATICS数理与生物工程学院224对某些蛋白质而言,维系蛋白质结构次级键的形成或破坏都是强协调过程。在此情况下,变性或复性是一个“全或无”的过程,又称蛋白质变性或复性的“二态模型”,即只存在两种状态,要么是具有全部结构的天然态,要么是丧失全部空间结构的变性态。对于可逆变性的体系,天然蛋白(N)和变性蛋白(U)之间的平衡反应可表示如下:\n2021/7/24BIOINFORMATICS数理与生物工程学院225去折叠NU重折叠\n2021/7/24BIOINFORMATICS数理与生物工程学院226蛋白质肽链在溶液中可能取的构象数是一个天文数字。即使假定每个肽键只能有两种构象,那么,由100个氨基酸残基肽链的可能构象也有2100种,经历全部构象的时间要107年以上。但是,一般变性蛋白质的体外重折叠时间只需要几分钟至几小时。这表明;蛋白质的折叠不是一个随机过程,而是通过特定的动力学途径达到天然构象的。\n2021/7/24BIOINFORMATICS数理与生物工程学院227目前,蛋白质结构的测定速度远远低于核酸序列的测定速度,蛋白质结构预测已成为生物信息学的一项重要任务。在蛋白质二级结构和三级结构之间,由α螺旋和β折叠片组装成紧凑折叠单元,这种“单元”对于蛋白质结构的分类和预测有重要的作用,称为“折叠单元”或“折叠”。尽管蛋白质序列数以百万计,但是折叠的种类却极为有限,很可能不超过1000种。\n2021/7/24BIOINFORMATICS数理与生物工程学院228另一方面,蛋白质的氨基酸序列中含有一些在进化过程中最为保守的单元(称为结构域),它们通常可以相对独立地折叠,形成某种特定的局部空间结构或折叠单元。序列相同的结构域对应相同的折叠单元。蛋白质折叠具有很强的规律性,这意味着可以进行蛋白质结构预测。\n2021/7/24BIOINFORMATICS数理与生物工程学院2292.7.4帮助新生肽链折叠的生物大分子现在认识到的帮助新生肽链折叠的蛋白质可以分为两大类:一类是分子伴侣(molecularchaperone),另一类则是催化同折叠过程直接相关的化学反应的酶,现在又称为“折叠酶(foldase)。\n2021/7/24BIOINFORMATICS数理与生物工程学院230分子伴侣是一类相互之间没有关系的蛋白质,它们的功能是帮助含多肽结构的其他物质在体内进行正确的、非共价的组装,但在组装完成后,分子伴侣不作为具有正常生物功能的结构的组成部分。分子伴侣是从功能上定义的,凡是具有这种功能的蛋白质都是分子伴侣,它们的结构可以完全不同,甚至可以是完全不同的蛋白质。与分子伴侣不同,已确定为帮助蛋白质折叠的酶目前只有两种:一种是蛋白质二硫键异构酶,另一种是肽基脯氨酰顺反异构酶。\n2021/7/24BIOINFORMATICS数理与生物工程学院2312.7.5蛋白质构象病问题与蛋白质折叠有关而且是近几年比较引人注意的是“构象病”假说的提出。生物医学研究表明:蛋白质空间构象发生异常变化会引起疾病发生,形成了蛋白质构象病这一新的病理学概念。一般讲,引起构象病的蛋白质分子与正常蛋白质同时存在于肌体内,至少部分蛋白质具有正常折叠的空间构象,并以正常形态释放。当蛋白质构象异常变化时可导致其生物功能丧失,或者引起其后发生的蛋白质聚集与沉积,使组织结构出现病理性改变。\n2021/7/24BIOINFORMATICS数理与生物工程学院232§2.8基因工程初步细胞中的不少生物过程被阐明之后,就被用来在实验室中加工、改造遗传物质,成为特殊的实验甚至生产手段。我们在这里做一点简单介绍。\n2021/7/24BIOINFORMATICS数理与生物工程学院2332.8.1限制性内切酶1960年代末,在大肠杆菌中发现了一种酶,它会识别外来的DNA并在特定的位点把后者剪断,这就是限制性内切酶。现在已经知道成千种内切酶和数百种剪切位点。为了保护自己的DNA不被误切,细菌们还生产特定的甲基化酶,把本身DNA特定位置上的氢原子换成甲基,以防止内切酶接近。限制性内切酶和甲基化酶组成许多细菌的防御系统,也被科学家用来在试管中切割DNA序列。\n2021/7/24BIOINFORMATICS数理与生物工程学院234限制性内切酶的识别位点,多是长度为4-8个字母的“回文”,即正读、反读结果相同的字母串。例如,CCTAGG就是在正链和反链上相同的一个回文,内切酶通常也由上下对称的两个亚基组成,便于在两个DNA链上双管齐下地进行切割。\n2021/7/24BIOINFORMATICS数理与生物工程学院2352.8.2分子克隆克隆意思是用无性繁殖手段,再生产出生物分子、细胞甚至个体。这里只讲分子克隆,即用生物方法而不是化学合成来大量增殖生物大分子。把含有要增殖片段的DNA用限制性内切酶切割好,选取恰当的质粒用同样的内切酶切开(Vector),把所需的DNA连接进去,再把质粒放回大肠杆菌里进行培养,在营养丰富的情况下,大肠杆菌每30分钟就可以繁殖一代,繁殖到一定数量后,用同样的内切酶把感兴趣的DNA片段切割出来,它们的总量已大为增加,这就是分子克隆。\n2021/7/24BIOINFORMATICS数理与生物工程学院236所用载体还可以是人工制备的酵母染色体YAC或细菌染色体BAC,这样就可以克隆更长的DNA片段。\n2021/7/24BIOINFORMATICS数理与生物工程学院2372.8.3聚合酶连锁反应1980年代中期发明了一种可以在短时间内把少量DNA扩增百万倍以上的方法,即聚合酶连锁反应,简称PCR。实现PCR所需要的条件是:微量待扩增的双链DNA片段;从噬热菌提取的耐热的DNA聚合酶;标记扩增段两端的已知的DNA短序列(引物);足量的核苷酸单体.\n2021/7/24BIOINFORMATICS数理与生物工程学院238把以上混合物加热保温,双链DNA解离成单链,降温并保温,引物结合到单链DNA的左右两端,再适当升温和保温,DNA聚合酶从引物开始以单链为模板合成出双链DNA再重复以上热循环,在理想情形下,每一次热循环可以使DNA增值一倍。\n2021/7/24BIOINFORMATICS数理与生物工程学院239图2-39PCR扩增的原理示意图\n2021/7/24BIOINFORMATICS数理与生物工程学院2402.8.4凝胶电泳和印迹法把混合在一起的生物大分子和细胞器等,按分子量大小分离开来,是生物学实验室的常规操作。一般使用超速离心机、质谱仪、凝胶电泳等。\n2021/7/24BIOINFORMATICS数理与生物工程学院241凝胶电泳的思想很简单,在铺平的凝胶平面上,梳出若干平行规整的小槽,小槽一头的“井”中放置需要分离的混合液体,其中一个边上的“井”中放置分子量分布已知的标准混合物,称为“Marker”或“Contron”。加上电场后,液体中的大小分子集团沿小槽向另一端扩散(一般从电场的“-”极向“+”极),各个集团运动的速度同它们质量的对数成反比,轻者跑的快,重者走的慢。一定时间后,混合无分成了一系列条带。把这些条带和标准样品对比,可以推知每个条带分子的分子量。\n2021/7/24BIOINFORMATICS数理与生物工程学院242把“跑”完的凝胶板上的DNA先变性成单链,再覆以硝化纤维素薄膜,上面盖上若干层试纸,水分往试纸扩散,把凝胶条纹转移到硝化纤维素薄膜上。再同用放射性磷32P标记的已知的互补DNA杂交,就可以把特定的DNA片段鉴定和分离出来。这套手续已经发展成强有力的实验方法,称为DNA印迹法,又称Southern印迹法,Southern是发明此方法的人名。\n2021/7/24BIOINFORMATICS数理与生物工程学院243后来人们把Southern印迹法推广到不如DNA稳定的RNA,称为RNA印迹法或Northern印迹法。以后又推广到蛋白质,称为蛋白质印迹法或Western印迹法。Northern和Western都不是人名。\n2021/7/24BIOINFORMATICS数理与生物工程学院2442.8.5测序技术DNA是由4种不同单体聚合而成的一维的生物大分子,要想测定大分子中单体的顺序,原则上有两种方法:一是令聚合反应停止在特定的单体字母上,二是把已经聚合到相当长度的DNA在特定单体处“咬断”。终止聚合过程的Sanger方法和基于化学降解的Maxam-Gilbert方法都是在1977年建议的。真核生物完全基因组的测序,目前有两种策略:\n2021/7/24BIOINFORMATICS数理与生物工程学院245较为传统稳妥的办法,是从各条染色体的遗传图谱开始,经过各种物理图谱(我们只在前面介绍了酶切图谱)和基因标志的测量,最后对基本位置大体清楚的众多的小片段分别克隆增殖,进行测序和拼接。国际人类基因组计划和国际水稻(粳稻)基因组计划都是在此种策略指导下进行的。\n2021/7/24BIOINFORMATICS数理与生物工程学院246另一种日渐流行的测序策略是把各个染色体直接混合、随机地打碎、增殖和测序,然后借助专门算法和强大的计算机,进行拼接。这种被称为“霰弹法”的测序策略,用于细菌基因组是很成功的。国际上前几年完成的果蝇基因组测序,一家私人公司在2001年发表的人类基因组草图,以及中国科学院基因组学研究所暨华大基因中心在2002年4月美国《科学》周刊发表的籼稻全部12个染色体的基因组工作框架图,都是用霰弹法实现的。\n2021/7/24BIOINFORMATICS数理与生物工程学院247问题与练习1细胞学说的基本内容2简述细胞分裂的周期全过程3细胞分裂有哪些方式?4说明细胞的分类5简述原核细胞的基本内容6真核细胞的基本结构7陈述蛋白质的生物学功能8试按你的理解对20种氨基酸进行分类9画图说明肽键的形成过程10何谓蛋白质一级结构?\n2021/7/24BIOINFORMATICS数理与生物工程学院24811何谓蛋白质二级结构?12何谓蛋白质超二级结构?13何谓蛋白质四级结构?14描述核酸的基本组成15叙述DNA结构的基本内容16图示目前公认的中心法则17何为蛋白质剪切18何为GT-AG规则?19说明原核、真核生物基因的结构特征20阐述DNA复制机制的最新进展\n2021/7/24BIOINFORMATICS数理与生物工程学院24921阐述基因转录调控模型22总结蛋白质转译的基本机制23总结遗传密码破译的过程24何谓操纵子?25何谓新生肽链的折叠?26叙述基因表达调控的几个层次查看更多