北京大学 北京大学药学院

基因的复制、转录和翻译

DNA Replication · RNA Transcription · Protein Translation
分子生物学与生物化学基础
Fundamentals of Molecular Biology and Biochemistry
张力勤
北京大学药学院
✉ lqzhang@hsc.pku.edu.cn 🌐 课题组主页 · www.liqinzhanglab.com

生命如此多样,遗传信息如何精确延续?

  • 地球上约有 870 万种生物——形态各异,却共享同一套"语言":DNA
  • 从微小的病毒,到体型庞大的北极熊
  • 从路旁的蒲公英,到深海中的海龟
  • 它们全都面对同一挑战:每次细胞分裂,都要将整个基因组精确复制一遍
  • 你的身体每天复制"30亿个字母"——出错率哪怕只有 1%,就会产生约 3000 万处突变
  • 为什么我们没有每天"变成另一种生物"?

生命系统的第一原则:信息复制必须极其精准。

opening_life_diversity.png
生命多样性

我们能"改写生命的代码"吗?

  • 如果 DNA 是代码,我们能编辑它吗?
  • 能不能修复遗传病?
  • 能不能"设计"一个更好的基因?
  • CRISPR-Cas9 是一种可以"精准剪切 DNA"的分子工具
  • 像"分子剪刀",找到目标序列,精确切断

自然系统:经过数十亿年进化,DNA 复制已达到极致保真。

人类技术:我们刚刚开始学会在这套系统上"动手"。

opening_crispr_mechanism.png
CRISPR-Cas9 工作原理
opening_gene_therapy.png
基因编辑应用场景

一段RNA,为什么能变成疫苗?

  • 如果 CRISPR 是"改写"DNA 密码,mRNA 技术则另辟蹊径——直接调控蛋白质表达,无需触碰基因本身
  • mRNA 疫苗在新冠大流行中数月内研发成功,如今正向肿瘤治疗领域延伸
  • 疫苗并不是"直接提供抗体",而是给出一段可被细胞读取的 mRNA
  • 细胞读取 mRNA 后合成对应蛋白质,免疫系统据此建立识别与记忆
  • 这背后是一条完整的信息处理链:DNARNA蛋白质免疫反应
opening_mrna_vaccine_product.png
mRNA疫苗药品实物
opening_mrna_vaccine.png
mRNA疫苗作用机制

类比:疫苗不是替你"打怪",而是先教会免疫系统如何识别目标。

细胞像一台信息处理系统

生物系统类比功能含义
DNA硬盘长期存储遗传信息
RNA缓存 / U盘临时调用与传递信息
蛋白质程序执行体真正完成细胞功能

关键点:DNA 本身不直接"干活",它提供的是说明书。

为什么需要 RNA:DNA 存于细胞核内需长期稳定保存,RNA 作为中间层让信息调用更灵活、更可调控。

opening_analogy_infographic.png
DNA/RNA/蛋白质计算机类比图

为什么同样的DNA,有的细胞正常分化,有的却失控癌变?

  • 神经、肝、肌肉细胞携带相同DNA,却功能与形态迥异
  • 差异不在"拥有什么基因",而在哪些基因被表达
  • 基因表达调控,是发育与细胞命运的核心开关
  • DNA突变可导致异常RNA异常蛋白质
  • 即使DNA未改变,转录或翻译层面的失衡也可驱动疾病
  • 癌症:"说明书被读错了,且持续被放大执行"

正常调控:细胞选择性读取DNA,精确的开关决定细胞身份。

治疗逻辑:靶向药瞄准异常蛋白,RNA疗法直接干预异常转录本。

opening_cell_types_same_dna.png
同一DNA不同细胞类型
opening_cancer_infoflow.png
癌症信息流失控路径图

AI技术为认识与理解生命语言提供了有力武器

  • 结构解析:AlphaFold 等模型可从氨基酸序列直接预测蛋白质三维结构
  • DNA 4个字母、蛋白质20种氨基酸——语言简单,但"语法"极其复杂
  • AI将数十年才能解析的结构问题压缩至数小时
  • 大数据解读:人类基因组约30亿碱基对,单个样本数据可达100 GB
  • 全球每年产生数EB级基因组数据,远超人工分析能力
  • 变异检测、基因表达分析、单细胞测序——AI已不可或缺

AI是理解生命语言的新工具。但真正的生物学问题仍是:DNA如何一步步变成蛋白质?

opening_ai_sequence_to_structure.png
AI解析序列到结构
opening_ai_genomics_bigdata.png
基因组大数据与AI分析

科学与产业前沿:诺贝尔奖常客,新药研发焦点

  • 近年核酸领域多次摘得诺贝尔奖:
  • 2006年 生理医学奖:RNA干扰(RNAi)——Fire & Mello
  • 2020年 化学奖:CRISPR-Cas9 基因编辑——Charpentier & Doudna
  • 2023年 生理医学奖:mRNA 修饰技术——Karikó & Weissman
  • 2024年 生理医学奖:microRNA 的发现——Ambros & Ruvkun
  • 核酸药物已进入临床:
  • siRNA 药物、反义寡核苷酸(ASO)、mRNA 疫苗与疗法
  • 2023年 首款 CRISPR 基因编辑疗法 Casgevy 获批上市

从基础研究到临床新药,核酸科学正在重塑现代医学。

这一切的底层逻辑,都指向同一个问题:核酸如何携带、传递并执行生命信息?

opening_nobel_nucleic_acid.png
核酸领域诺贝尔奖得主
opening_nucleic_acid_drugs.png
核酸药物研发管线

核酸药物产业:国际与中国领军企业

  • Alnylam(美国):全球 RNAi 药物先驱
  • 已获批6款 siRNA 药物,覆盖罕见病、心血管等多个领域
  • Patisiran——全球首款获批 siRNA 药物(2018)
  • Inclisiran——与诺华合作,皮下注射降低 LDL 胆固醇
  • 瑞博生物(中国):中国核酸药物领域领军企业
  • 由北京大学梁子才教授创立,张礼和院士大力推动
  • 从核酸科研工具起步,布局 siRNA、miRNA、mRNA 多条赛道
  • 核酸药物管线持续推进,多款候选药物已进入临床阶段

核酸药物产业正从"概念验证"走向"规模化落地",中国企业加速追赶国际前沿。

opening_alnylam_drugs.png
Alnylam 及获批 siRNA 药物
opening_ribobio_china.png
瑞博生物及中国核酸药物赛道

生命信息流:DNA → RNA → 蛋白质

  • 经典主线:DNA复制保障遗传传递,RNA转录负责信息调用,蛋白质翻译执行细胞功能
  • 本课程四讲主线:DNA复制 → DNA修复与重组 → RNA转录 → 蛋白质翻译
  • 真实系统更复杂:还包括逆转录、RNA病毒复制与RNA调控网络
  • 结论:中心法则是网络化信息流,而不是单向直线
  • 本节与后续课程将回答三个核心问题:
  • DNA 如何被精准复制?
  • DNA 如何转录为 RNA?
  • RNA 如何翻译为蛋白质?
opening_central_dogma_network.png
中心法则与扩展网络

课程大纲

opening_course_roadmap.png
课程目标路线图
本系列共四讲(点击直接跳转)
LECTURE 1

DNA 复制

DNA Replication
LECTURE 2

DNA 修复与重组

DNA Repair & Recombination
LECTURE 3

RNA 转录

RNA Transcription
LECTURE 4

蛋白质翻译

Protein Translation
Lecture 1

DNA 复制

DNA Replication

Molecular Biology of the Cell
CHAPTER 5 DNA Replication, Repair, and Recombination

本讲大纲点击条目可直接跳转

一、DNA序列的维持

  • 突变率极低
  • 低突变率对生命至关重要

二、DNA复制机制

  • 碱基配对与复制基础
  • 复制叉的不对称性
  • 高保真度与校对机制
  • 5'→3' 方向与纠错
  • 互变异构与非WC错配
  • 链定向错配修复
  • RNA 引物合成
  • 解旋酶与 SSB 蛋白
  • 滑动环(sliding clamp)
  • 复制机器协同
  • DNA 拓扑与拓扑异构酶
  • 真核 vs 原核

三、染色体复制的
起始与完成

  • 复制起点(origin)
  • 原核:单一起点
  • 真核:多复制起点
  • S 期与复制时序
  • ORC 复合物
  • 人类基因组复制起点
  • 核小体组装
  • 末端复制问题与端粒
  • 端粒酶结构与机制
  • G-四链体(G4)
  • 端粒保护性结构
  • 端粒长度调控

四、DNA复制相关
药物开发案例

  • Hydroxyurea(羟基脲)
  • Etoposide / Doxorubicin(依托泊苷 / 多柔比星)
  • Irinotecan / Topotecan(伊立替康 / 托泊替康)
  • Cytarabine / Gemcitabine(阿糖胞苷 / 吉西他滨)
  • Acyclovir(阿昔洛韦)
  • Ganciclovir / Cidofovir(更昔洛韦 / 西多福韦)
  • Ciprofloxacin / Levofloxacin(环丙沙星 / 左氧氟沙星)

DNA 的基本结构

  • 核苷酸:DNA 的基本单元
  • 由三部分组成:磷酸基团脱氧核糖含氮碱基
  • 碱基分两类:嘌呤(A、G)与嘧啶(T、C)
  • 核苷酸通过 3'→5' 磷酸二酯键 连接成链
  • 碱基互补配对
  • A — T(2个氢键);G — C(3个氢键)
  • 配对特异性保证遗传信息精准复制与传递
  • DNA 双螺旋结构
  • 两条链反向平行(antiparallel),右手螺旋
  • 碱基对堆积于内部,磷酸骨架位于外侧
  • 形成大沟小沟——蛋白质识别 DNA 序列的关键位点
review_nucleotide_structure.png
核苷酸结构
review_dna_double_helix.png
碱基互补配对 & DNA双螺旋
Section I

DNA序列的维持

The Maintenance of DNA Sequences

突变率极低

  • 突变率约为每 1010 个核苷酸复制产生一个变化
  • 该突变率在从原核细胞到人类等不同生物中大致相同
  • 人类基因组约 3.2 × 109 个核苷酸对
  • 每次细胞分裂仅改变极少数核苷酸
  • 通过直接测序可测量突变率——比较亲代与子代基因组
  • 生殖细胞将遗传信息传递给下一代
  • 体细胞对生殖细胞的存活至关重要,但不留后代
Figure 5-1.png
生殖细胞与体细胞的基本功能差异

低突变率对生命至关重要

  • 高突变率会限制生物能够维持的 必需基因数量
  • 如果突变率过高,每一代都会积累大量有害突变
  • 基因组越大,对复制保真度的要求越高
  • 生殖细胞稳定性:保证遗传信息准确传给下一代
  • 体细胞稳定性:防止因突变导致的癌症
  • 多细胞生物依赖于 DNA 序列被复制和维持的极高保真度
  • 这一需求推动了精密 DNA复制与修复机制 的进化
低突变率为何对生命至关重要
低突变率:错误阈值 + 生殖/体细胞两根稳定性支柱

小节总结 — DNA序列的维持

1. 极低突变率:在所有细胞中,DNA序列都以极高的保真度进行维护和复制。突变率约为每次DNA复制时每1010个核苷酸发生一个核苷酸变化,从原核细胞到人类等不同生物中大致相同。

2. 基因组稳定性:由于这种惊人的准确性,人类基因组(约3.2 × 109个核苷酸对)在每次典型的人类细胞分裂时保持不变或仅改变极少数核苷酸。

3. 遗传与防癌:这使得大多数人类能够将准确的遗传指令从一代传递到下一代,同时也避免了体细胞中导致癌症的突变。

Section II

DNA复制机制

DNA Replication Mechanisms

碱基配对是DNA复制和修复的基础

  • DNA模板化:用一条链的序列复制出互补序列
  • DNA双螺旋须先 解旋分离 为两条模板链
  • 每个模板核苷酸通过氢键与游离互补核苷酸配对
  • 配对规则:A-T(2个氢键)、G-C(3个氢键)
  • 第一个 DNA聚合酶(DNA polymerase) 于1957年发现
  • 底物为 脱氧核苷三磷酸(dNTPs)
  • 聚合反应需要单链DNA模板
Figure 5-2.png
DNA双螺旋作为自身复制的模板
Figure 5-3.png
DNA合成的化学反应

DNA复制叉是不对称的

  • 每条亲代链都作为新链合成的模板 → 半保留复制
  • 复制叉:复制活跃区的 Y 形结构
  • DNA聚合酶只能沿 5'→3' 方向合成
  • 前导链(leading strand):连续合成,与复制叉同向
  • 滞后链(lagging strand):不连续合成,方向相反
  • 滞后链产生短片段 = 冈崎片段(Okazaki fragment)
  • 原核细胞:1000~2000 nt
  • 真核细胞:100~200 nt
  • 冈崎片段合成后被连接为完整长链
Figure 5-5.png
DNA半保留复制
Figure 5-6.png
环形染色体上的两个复制叉
Figure 5-7.png
复制叉的不对称结构

DNA复制的高保真度需要多种校对机制

  • 最终每 1010 核苷酸只出 1 个错 → 由 三道关卡接力共同实现
  • ① 碱基选择(聚合酶活性中心几何检查)
  • dNTP 入位后聚合酶"手指域"从 开放 → 闭合构象(induced fit),主动夹紧底物
  • 仅当 Watson-Crick 几何正确才贴合催化;错配几何使活性中心张力升高 → 催化被拒绝
  • 原始误掺入率 ~1/10² → 经此关降到 ~1/10⁵
  • ② 3'→5' 外切核酸酶校对(exonuclease proofreading)
  • 错配 3'-端使引物末端"翘起",无法继续延伸 → DNA 滑入同一聚合酶上 独立的外切位点(~3 nm 外)
  • 切除错误核苷酸后,DNA 滑回聚合位点继续合成 → DNA 聚合酶是"自我纠正"酶
  • 再降 100 倍 → ~1/10⁷;Pol δ/ε、T4、Klenow 都自带,但 Pol α 无校对域(其合成的引物随后被替换)
  • ③ 链定向错配修复(strand-directed mismatch repair)
  • 复制完成后扫查双链,识别错配,以 新合成链为修复对象切除重合成
    → 再降 1000 倍 → 1/10¹⁰(机制后面详述)
  • 对照:RNA 合成与翻译错误率约 1/10⁴,比 DNA 复制高 106
    RNA/蛋白产物会被降解,而 DNA 错误一旦未修复将永久遗传
Figure 5-8.png
外切核酸酶校对过程
AT和GC碱基配对晶体结构
AT和GC碱基配对晶体结构
Figure 5-9.png
DNA聚合酶的聚合模式与编辑模式
步骤错误率
5'→3' 聚合选择1 / 10⁵
3'→5' 外切校对1 / 10²
错配修复1 / 10³
总计1 / 10¹⁰

只有5'→3'方向的复制才能高效纠错

  • 5'→3' 合成时,三磷酸基团由新加入的核苷酸提供
  • 错误发生时:切除3'端错误核苷酸,链仍有活性 → 合成可继续
  • 假设存在 3'→5' 聚合酶
  • 链的 5' 端需提供三磷酸
  • 切除错误会同时失去三磷酸 → 合成立即终止!
  • 因此,滞后链的 「回缝」机制 虽复杂,但保证所有合成方向都是 5'→3'
  • 这是外切核酸酶校对的 必要前提
  • 尽管有如此保障,偶尔仍有错误 → 最后一道防线:链定向错配修复
5'→3' vs 3'→5' 纠错能力对比
5'→3' vs 假想3'→5' 纠错能力对比

碱基互变异构与非Watson-Crick错配

  • 碱基存在稀有互变异构体(酮式⇌烯醇式,氨基⇌亚氨基)
  • 稀有异构体的几何形状与正常碱基对几乎相同
  • T*(烯醇式)可与 G 形成类似 Watson-Crick 几何的错配
  • C*(亚氨基)可与 A 形成类似配对
  • 聚合酶通过活性位点的形状互补来筛选碱基对
  • 但互变异构体能"欺骗"聚合酶——形状正确,配对却错误
  • 这是碱基选择错误率停留在 ~10-5 的根本原因
  • 两轮复制后,瞬时错配变为永久突变(转换突变)
  • 因此必须依赖3'→5'外切校对错配修复来弥补
碱基互变异构与非Watson-Crick错配
碱基互变异构与错配机制

链定向错配修复系统

  • 修复逃脱复制机器校对的残余错误(包括互变异构导致的错配)
  • 核心问题:如何 区分新链和旧链?错误一定在新链上
  • 原核细胞中的机制:
  • Dam 甲基化酶在 GATC 序列的腺嘌呤上加甲基
  • 新链刚合成时暂时未被甲基化 → 系统识别未甲基化链为新链
  • MutH(原核细胞特有)切割未甲基化链,启动修复
  • 真核生物中的机制:
  • 没有 MutH,也不依赖甲基化
  • 新链上存在尚未连接的切口(nick)PCNA滑动夹
  • PCNA 的方向性标记新链 → MutLα(MLH1-PMS2)切割新链
  • MutS 和 MutL:原核与真核共有
  • MutS(真核同源物:MSH2-MSH6):识别错配,使 DNA 弯折
  • MutL(真核同源物:MLH1-PMS2):连接识别与切除步骤
  • 错配修复基因缺陷 → Lynch综合征(HNPCC)
Figure 5-19.png
链定向错配修复过程
(A) MutS/MutL修复步骤 (B) MutS蛋白与错配DNA的晶体结构

特殊酶在滞后链上合成短RNA引物

  • 自我纠正的 DNA 聚合酶 无法从头起始 新链
  • DNA引物酶(primase)合成短 RNA 引物
  • 真核中约 10 个核苷酸长
  • 间隔 100~200 nt
  • 合成流程:
  • ① 引物酶合成 RNA 引物
  • ② DNA 聚合酶从引物 3' 端延伸冈崎片段
  • RNase H 清除旧 RNA 引物,用 DNA 替换
  • DNA 连接酶(DNA ligase) 封闭缺口
  • 使用 RNA 而非 DNA 作引物的优势:自动标记为「可疑拷贝」,便于识别和移除
Figure 5-10.png
RNA引物合成示意
Figure 5-11.png
滞后链DNA片段合成步骤
Figure 5-12.png
DNA连接酶催化的反应

特殊蛋白质帮助解开复制叉前方的DNA双螺旋

  • DNA双螺旋在生理条件下极稳定,需接近沸水温度才能分开
  • DNA解旋酶(helicase):
  • 水解 ATP 获取能量
  • 六聚体环状结构 — 类似旋转引擎
  • 速度可达 每秒 1000 碱基对
  • DNA 单链穿过中心孔
  • 单链DNA结合蛋白(SSB 蛋白):
  • 紧密且协同地结合裸露单链 DNA
  • 碱基不被覆盖 → 保持模板功能
  • 拉直单链 DNA,防止形成发卡结构
🖼️
Figure 5-13.png
DNA解旋酶检测实验
🖼️
Figure 5-14.png
DNA解旋酶六聚体结构
🖼️
Figure 5-15.png Figure 5-16.png
SSB蛋白的效果与RPA结构

滑动环将移动中的DNA聚合酶固定在DNA上

  • DNA 聚合酶本身易从模板上 脱落
  • 滑动夹(sliding clamp):环状蛋白,套在 DNA 双螺旋外
  • 一面结合 DNA 聚合酶背面,整个环沿 DNA 自由滑动
  • 原核细胞 vs 真核细胞的滑动夹:
  • 原核细胞β-clamp(β滑动夹) — 由 2 个亚基组成的同源二聚体环
  • 真核细胞PCNA(Proliferating Cell Nuclear Antigen,增殖细胞核抗原) — 由 3 个亚基组成的同源三聚体环
  • 两者结构高度相似(六重对称的环),但氨基酸序列不同 → 趋同进化的经典案例
  • PCNA 还参与错配修复、染色质重塑等多种功能("细胞内的工作平台")
  • 夹载入蛋白(clamp loader)
  • 原核:γ复合体(γ-complex);真核:RFC(Replication Factor C,复制因子C)
  • 消耗 ATP 将滑动夹装载到引物-模板接头处
  • 结构类似螺母,与双链 DNA 的螺纹匹配
  • 前导链:聚合酶 + 滑动夹长时间结合
  • 滞后链:每完成一个冈崎片段,释放旧夹,结合新夹
Figure 5-17.png
滑动夹的结构与装载过程
(A) 环状夹蛋白晶体结构 (B) 夹载入蛋白的工作机制

复制叉上的蛋白质协同形成复制机器

  • 复制蛋白组装为 复制机器 — 一台分子「缝纫机」
  • 总分子量 > 10⁶ Da
  • 核心组件:
  • DNA 解旋酶 — 前方解链
  • 两个 DNA 聚合酶 — 前导链 + 滞后链
  • DNA 引物酶 — 合成 RNA 引物
  • 滑动夹 + 夹载入蛋白
  • SSB 蛋白
  • 滞后链 折回形成环,使所有组件保持紧密联系
  • 复制机器相对固定,DNA 被「穿过」
  • 合成完成后,DNA修复酶 清除残余 RNA 引物
Figure 5-18.png
原核细胞复制叉的蛋白质组装
(A) 复制叉示意图 (B) T4噬菌体复制机器电镜照片 (C) 电镜解读图

什么是DNA的"拓扑"与"拓扑异构"

  • 拓扑(topology)是数学概念:
  • 描述物体在连续变形下保持不变的性质
  • 允许拉伸、弯曲、扭转,但不允许切断或粘合
  • 在 DNA 中,"拓扑"特指两条链的连环数(Linking Number, Lk)
  • 即一条链穿过另一条链的次数
  • 对于环形或两端固定的双链 DNA,Lk 是整数且不可改变,除非切断 DNA
  • 拓扑异构体(topoisomers)
  • 指同一段 DNA 序列,但连环数 Lk 不同的形态
  • 例如:松弛态、正超螺旋、负超螺旋互为拓扑异构体
  • 它们的化学序列完全相同,但物理形态(缠绕程度)不同
  • DNA 复制叉前进时,前方双链不断被"拧紧"形成正超螺旋
  • 拓扑异构酶(topoisomerase)
  • 通过切断-重接 DNA 链来改变 Lk
  • 在不同拓扑异构体之间转换 → 故名"拓扑异构酶"
DNA拓扑与拓扑异构
DNA拓扑与拓扑异构体

DNA拓扑异构酶防止复制过程中DNA缠绕

  • 「缠绕问题」:每复制 10 个碱基对,需解开 1 个螺旋
  • 500 nt/s → 每秒需旋转 50 圈!
  • 拓扑异构酶 I(Topoisomerase I)
  • 切断一条链(单链断裂)
  • 允许两侧相对旋转释放张力
  • 共价键存储能量 → 无需 ATP 自动重新封口
  • 拓扑异构酶 II(Topoisomerase II)
  • 切断两条链(双链断裂)→ 形成「门」
  • 让另一条双链穿过缺口
  • 需要 ATP 水解
  • 可分离互锁的环状 DNA / 姐妹染色单体
  • 拓扑异构酶 II 是 抗癌药物 的重要靶标
Figure 5-20.png
复制时的「缠绕问题」
Figure 5-21.png
拓扑异构酶I的可逆切割反应
Figure 5-22.png
拓扑异构酶II的DNA穿越反应

真核细胞和原核细胞的DNA复制基本相似

  • 复制叉几何构型和多蛋白复制机器的基本特征在进化中高度 保守
  • 真核复制机器的组件更多,但基本功能相同
特征原核细胞真核细胞
SSB蛋白单亚基三亚基(RPA)
引物酶独立 DnaGPol α-引物酶复合物
复制聚合酶Pol IIIPol ε(前导)+ Pol δ(滞后)
滑动夹β-clampPCNA
复制叉速度~1000 nt/s~50 nt/s
冈崎片段长度1000~2000 nt100~200 nt
解旋酶沿模板链滞后链 (5'→3')前导链 (3'→5')
  • 真核复制速度慢约 20 倍 — 需穿越紧密包装的 染色质(核小体)
  • 真核系统更复杂的调控 → 与有丝分裂精确协调

小节总结 — DNA复制机制

1. 复制叉结构:DNA复制发生在Y形复制叉处。具有自我纠错功能的DNA聚合酶催化5’→3’方向的核苷酸聚合。由于两条链反平行,5’→3’合成只能在前导链上连续进行;滞后链上的短片段必须通过「回缝」过程合成。

2. 多蛋白协作:DNA复制需要多种蛋白质协同工作:DNA聚合酶和引物酶催化聚合;DNA解旋酶和SSB蛋白打开双螺旋;DNA连接酶和RNA引物降解酶封接滞后链片段;DNA拓扑异构酶解决螺旋缠绕问题。

3. 复制机器:这些蛋白质在复制叉处相互结合,形成高效的「复制机器」,各组分的活性和空间运动在其中得到精密协调。

Section III

染色体DNA复制的起始与完成

The Initiation and Completion of DNA Replication in Chromosomes

DNA合成始于复制起点

  • 双链 DNA 必须先被打开 → 起始蛋白 结合并撬开双链
  • DNA 首先被解开的位置 = 复制起点(replication origin)
  • 复制起点的特征:
  • 含有吸引起始蛋白的短序列
  • 含有富 A-T 的区域(更容易解链)
  • 复制叉从起点双向移动,形成 复制泡(replication bubble)
  • 两个叉一直移动直到与对向复制叉相遇或到达染色体末端
Figure 5-23.png
复制起点处复制泡的形成

原核细胞染色体通常只有一个复制起点

  • E. coli:单一环形 DNA(4.6 × 10⁶ bp),唯一复制起点 oriC(origin of chromosomal replication)(约245 bp)
  • oriC 含三类标志序列:DnaA box(4-5个 9 bp 重复,TTATCCACA)+ DUE(3个 13 bp 富 AT 重复)+ GATC 位点
  • ① DnaA 识别并结合 oriC
  • 多拷贝 DnaA-ATP 协同结合 DnaA box,弯折并聚拢 DNA
  • ② 打开 DUE 形成复制泡
  • DnaA 的拉伸张力作用于 DUE,富 AT 区(氢键弱)局部熔解 → 暴露单链
  • ③ 装载解旋酶 DnaB
  • DnaC 装载蛋白把 DnaB₆ 环打开并套到单链上,每条单链各一个 → 两个反向复制叉
  • ④ 组装完整复制机器
  • 引物酶 DnaG → RNA 引物;Pol III 全酶 + β滑动夹;SSB 保护单链;gyrase 释放正超螺旋
  • ⑤ 防止重复起始(三道锁)
  • DnaA-ATP → DnaA-ADP:起始后 ATP 被水解,DnaA 失活
  • GATC 甲基化延迟:新链未被 Dam 甲基化 → 进入"不应期"
  • SeqA 封锁:特异结合半甲基化 GATC,物理遮蔽 oriC
Figure 5-24.png
原核细胞基因组的DNA复制
Figure 5-25.png
原核细胞起始DNA复制的蛋白质
Figure 5-26.png
甲基化产生的起始不应期

真核染色体含有多个复制起点

  • 人类基因组远大于原核细胞 → 需要 30,000~50,000 个复制起点
  • 真核复制叉速度仅约 50 nt/s(原核细胞的 1/20)
  • 单条人类染色体约 1.5 × 10⁸ nt → 单叉复制需约 35 天!
  • 实际上多个复制泡 同时工作
  • 实验方法:放射自显影(autoradiography)
  • 3H-胸苷(放射性胸腺嘧啶核苷)短时间脉冲标记活细胞,使其在 S 期掺入新合成 DNA
  • 将含放射性 DNA 的样品平铺在显微载玻片上,覆盖感光乳剂(含 AgBr 颗粒)
  • 3H 衰变释放 β 粒子 → 还原 AgBr → 显影后形成银颗粒(silver grains)
  • 银颗粒密集处即新合成 DNA → 直接看到复制叉与复制泡的位置和方向
  • 脉冲-追踪(pulse-chase)实验可进一步测定复制叉行进方向与速度
  • 基因组中潜在起点比实际使用多约 10 倍 → 多余起点作为「备份」
  • 不同细胞类型使用不同的起点组合(细胞类型特异性)
Figure 5-27.png
真核染色体复制叉的放射自显影实验

真核生物的DNA复制仅在细胞周期的S期进行

  • 原核细胞快速生长时几乎 连续复制 DNA
  • 真核生物 DNA 复制仅限于 S 期(DNA synthesis phase)
  • 哺乳动物 S 期通常持续约 8 小时;酵母 S 期可短至 40 分钟
  • 细胞周期四阶段:
  • G1 期:M期与S期之间的间期
  • S 期:DNA 合成
  • G2 期:S期与M期之间的间期
  • M 期:有丝分裂
  • 进入每个新阶段需要先成功完成前一阶段(检查点把关)
  • 为什么真核细胞要把分裂分成四期?
  • 质量控制:G1/G2 检查点确认基因组完整,损伤时暂停周期修复,避免错误传递
  • 空间隔离:S 期与 M 期分开,避免染色体在复制中途被纺锤体拉扯断裂
  • 每周期仅复制一次:S/M 交替使 ORC/Cdt1 等许可因子不可逆切换,防止重复复制
  • 允许准备时间:G1 细胞生长积累原料;G2 检查复制结果、合成 M 期所需蛋白
  • 应对复杂基因组:大基因组与染色质结构需专门时间窗组织复制和染色质重建
Figure 5-29.png
标准真核细胞周期的四个阶段

同一染色体的不同区域在S期不同时间复制

  • 相邻起点之间的 DNA 约 1 小时 即可复制完成,但整个 S 期持续约 8 小时
  • 并非所有起点同时激活,而是 分时段、分批次 启动
  • 分簇激活(replication factories):
  • 复制起点以 ~50 个为一簇,在核内特定区域被同步激活
  • 同一簇起点共享一个"复制工厂"——空间上聚集的多酶复合体
  • 每簇仅在 S 期的某个 特定时间窗口 内活跃,结束后下一簇接力
  • 时序与染色质状态强相关:
  • 早期复制(S期前段):常染色质(开放染色质、转录活跃区、基因密集区)
  • 晚期复制(S期后段):异染色质(高度浓缩、转录沉默、近着丝粒/端粒)
  • 这是一个 细胞类型特异、可遗传 的属性 → 不同细胞用不同时序模式
  • 关键观察:
  • 一旦某起点被激活,其复制叉速度在整个 S 期 保持恒定(~50 nt/s)
  • 染色质浓缩影响的是 起始时间,而非叉行进速度
  • 复制时序异常(如 ATR 缺陷)→ 与基因组不稳定和肿瘤相关
Figure 5-30.png
酿酒酵母III号染色体的复制起点分布

大型多亚基复合物结合真核复制起点

  • ORC(Origin Recognition Complex):6 亚基环形复合体,全周期持续结合起点 DNA,作为"地标"与"装配平台"
  • 酵母 ARS 起点:A 元件(11 bp 共有序列)= ORC 结合位点;B 元件 = 富 A-T 解链区 + 辅助蛋白位点
  • "一次且仅一次"两步控制:
  • ① G1 许可(licensing):ORC + Cdc6 + Cdt1 装载双 Mcm2-7 解旋酶环 → 形成 pre-RC
  • ② G1/S 激活:CDK + DDK 磷酸化 Mcm,招募 Cdc45 + GINS → CMG 解旋酶 → 双向复制叉建立
  • 三种聚合酶分工:
  • Pol α / 引物酶:RNA 引物 + 短 DNA 起始;低保真,仅起始用
  • Pol ε:前导链连续合成;含 3'→5' 校对活性
  • Pol δ:滞后链冈崎片段延伸;含校对活性,负责链置换
  • 防止重复复制:CDK 磷酸化 Cdc6/Cdt1 使之失活;geminin 封锁 Cdt1;S/G2/M 期无法再装载 Mcm → 每周期精确复制一次
Figure 5-31.png
真核DNA复制起始机制:pre-RC 形成与 CMG 激活

人类基因组复制起点的特征仍待发现

  • 酵母中起点有明确的 DNA 序列特征(ARS 共有序列)
  • 人类起点的 DNA 序列已被鉴定(各含数千 nt)
  • 但将这些序列互相比较 → 未发现共有的特征序列
  • 人类 ORC 与酵母 ORC 非常相似,也结合复制起点
  • 推测人类复制起点由以下因素决定:
  • 染色质结构(开放染色质、核小体空缺区)
  • 转录活性(CpG 岛、启动子附近富集)
  • 其他表观基因组特性(组蛋白修饰、DNA 甲基化)
  • 这或许解释了:
  • 不同细胞类型使用不同起点组合
  • 起点选择可根据细胞状态而改变
  • 这一领域仍有大量未解之谜
酵母 vs 人类起点对比
酵母起点(序列驱动)vs 人类起点(多因素决定)

新核小体在复制叉后方组装

  • 染色体 = DNA + 蛋白质 → 复制需同时复制两者;组蛋白在 S 期 大量合成(mRNA ↑~50×)
  • 复制叉经过时亲代核小体暂时解体:H3-H4 四聚体随机分配到两条子链;H2A-H2B 二聚体释放进入可溶池
  • 叉后方约 600 nt 暂无核小体("裸 DNA 窗口")
  • 组蛋白伴侣快速恢复核小体:
  • CAF1:经 PCNA 锚定在叉上,装载新合成的 H3-H4 四聚体
  • ASF1:中转伴侣,将新 H3-H4 交给 CAF1,并接收解体的旧 H3-H4
  • FACT:与 CMG 同行,叉前松开亲代 H2A-H2B;叉后原位放回子链
  • NAP1:将新合成 H2A-H2B 补装到子链核小体
  • 新旧 H3-H4 混合排布 → 旧组蛋白修饰引导新组蛋白获得相同修饰 → 表观遗传信息跨分裂传递
  • 核小体间距决定冈崎片段长度(~200 nt,约一个核小体重复单位)
Figure 5-32.png
复制叉后方的核小体组装

末端复制问题与端粒

  • 末端复制问题(end-replication problem)
  • 前导链方向:复制叉行进至模板 5' 末端,可连续延伸到底 → 完整复制 ✓
  • 滞后链方向:最末端那段冈崎片段的 RNA 引物被切除后,没有上游 3'-OH 可供 DNA 聚合酶接续填补 → 留下缺口
  • → 每次分裂线性染色体末端丢失 ~50–200 bp
  • 原核解决方案:环形染色体(无末端)
  • 真核解决方案:端粒 + 端粒酶
  • 端粒 = 染色体末端富 G 的短串联重复阵列,3' 端为 G 链单链突出(overhang)
  • 人类(及所有脊椎动物)的重复单元 5'-TTAGGG-3'(G 链方向,即 GGGTTA),约重复 1000 次(~6–10 kb)
  • 其他真核物种各异:植物 TTTAGGG、四膜虫 TTGGGG、酵母为不规则 TG 重复 → 各物种端粒酶 RNA 模板序列也对应不同
  • 特例:果蝇不依赖端粒酶,改用 特殊逆转录转座子(HeT-A、TART)维持末端
  • 生物学意义:绝大多数体细胞端粒酶沉默 → 端粒每代渐短 → 触发复制性衰老(Hayflick limit)
  • 仍表达端粒酶的正常细胞:生殖细胞(精原/卵原)、胚胎干细胞、成体组织干细胞(造血、肠隐窝、表皮基底层等)、活化的淋巴细胞
  • 癌细胞:约 85–90% 重新激活 TERT 转录;其余 ~10–15% 走 ALT(alternative lengthening of telomeres,依赖同源重组)
Figure 5-34.png
端粒酶解决末端复制问题

端粒酶的结构与工作机制

  • 端粒酶(telomerase)= RNP 复合体(ribonucleoprotein,核糖核蛋白)
  • 核心两亚基(最小催化单元):
  • TERT:催化亚基(蛋白),本质是 逆转录酶(以 RNA 为模板合成 DNA)
  • TERC / hTR:RNA 亚基,含 ~11 nt 的模板(5'-CCCAAUC-3',与端粒重复互补)
  • 辅助亚基(全酶 holoenzyme)Dyskerin、NOP10、NHP2、GAR1 稳定 TERC RNA;TCAB1 介导酶向 Cajal 小体 / 端粒的运输
  • 三步循环延伸 G 链:
  • 配对:端粒 3' 突出端与 RNA 模板碱基配对
  • 延伸:以 RNA 为模板,沿 5'→3' 方向加 6 个 nt(一个重复单元)
  • 易位(translocation):酶相对 DNA 滑动一个单元,重新配对再延伸 → 反复多轮
  • 端粒酶只延伸 G 链;其后常规 Pol α-引物酶 + Pol δ 在 G 链上铺设引物 → 补全互补 C 链
Figure 5-33.png
端粒酶结构与工作机制

G-四链体(G4):端粒上的特殊 DNA 二级结构

  • G-四链体(G-quadruplex, G4)= 富 G 单链 DNA 的四链折叠
  • 基本单位 G-tetrad(四联体):4 个鸟嘌呤 G 通过 Hoogsteen 氢键共面成环(不是 Watson-Crick 配对)
  • 多个 G-tetrad 平面堆叠成柱状 → 中央通道由 K⁺ 串联稳定(Na⁺ 也可,K⁺ 最优)
  • 序列模板:G₃N₁₋₇ G₃N₁₋₇ G₃N₁₋₇ G₃ —— 4 段连续 GGG 由短链环(1–7 nt)连接
  • 拓扑可分 平行 / 反平行 / 混合型,取决于序列、loop 长度与离子环境
  • 基因组中 G4 的富集位点:
  • 端粒:人类 TTAGGG × 1000 → 单链 3' 突出端可串联折叠多个 G4(最经典、密度最高
  • 原癌基因启动子:c-MYC、KRAS、BCL-2、VEGF 等 → G4 影响转录因子结合
  • rDNA、复制起点、5' UTR 也常形成 G4 → G4 是普遍的调控性 DNA 二级结构
  • G4 在端粒处的双重作用:
  • 保护:屏蔽 3' 突出端,避免被核酸酶降解或被 DDR 误识为 DSB
  • 调控端粒酶:G4 折叠把 3' 端"封闭" → 端粒酶无法接触模板 → 必须先解开才能延伸
  • G4 还会阻挡复制叉 → 复制压力 → 解构机器缺陷可致基因组不稳定
G-四链体结构
G-四链体(G4)结构

端粒被包装成保护染色体末端的特殊结构

  • 端粒 DNA 的 3' 端有一段 单链突出(G 链 overhang,~50–200 nt)
  • Shelterin 复合物:6 亚基蛋白帽子,特异结合端粒重复
  • TRF1 / TRF2:结合双链端粒;TRF2 还驱动 T-loop 形成、抑制 ATM 激活
  • POT1:覆盖 3' 单链突出 → 既保护 ssDNA,也阻止 G4 自发形成
  • TPP1:连接 POT1 与端粒酶;解构 G4 后通过 TEL patch 招募端粒酶
  • TIN2 / RAP1:内部支架,桥连各亚基、抑制 ATR 信号
  • 保护机制 ①:T-loop 折叠
  • 3' 突出端回折侵入上游双链端粒 → ~10–15 kb 大环 + 局部 D-loop
  • TRF2 驱动;电镜下可直接观察
  • "藏起"末端 → 避免被 DDR 误识为 DSB,阻断 NHEJ / HR
  • 保护机制 ②:G4 自折叠(详见上一页)
  • 3' 突出 G 链折叠为 G4 → 保护单链 + 阻挡端粒酶
  • 解旋酶 BLM、WRN、RTEL1、FANCJ、Pif1 主动解构
  • ↳ 这些基因突变 → Bloom 综合征Werner 早衰Fanconi 贫血
  • 总结:T-loop 与 G4 是 3' 突出的两种互斥构象,共同隐藏末端;端粒酶工作时由 POT1/TPP1 切换到"延展态"完成延伸
Figure 5-35.png
端粒末端结构(T-loop / D-loop)
端粒酶四链体区域示意
端粒酶四链体区域示意

端粒长度受到细胞和生物体的调控

  • 端粒重复数量维持在一定范围内 — 稳态调控
  • 大多数人体细胞中端粒酶活性很低
  • 每次分裂端粒缩短约 100~200 nt
  • 最终触发 复制性衰老(细胞停止分裂)
  • 端粒酶在 生殖细胞和干细胞 中高度活跃
  • 缺乏端粒酶的转基因小鼠:
  • 最初正常,但随代数增加出现表型异常
  • 最终导致组织衰竭和不育
  • 人类 先天性角化不良(Dyskeratosis congenita):
  • 端粒酶基因突变 → 端粒过早缩短
  • 骨髓衰竭,皮肤异常,癌症风险增加
  • 端粒 / 端粒酶与 衰老和癌症 密切相关
端粒长度的稳态调控
端粒长度调控:不同细胞类型 + Tert⁻/⁻ 小鼠 + DC 疾病

小节总结 — 复制起始与完成

1. 复制起始:启动DNA复制的蛋白质结合到复制起点的DNA序列上,催化形成具有两个向外移动的复制叉的复制泡。该过程从起始蛋白-DNA复合物形成开始,随后将DNA解旋酶装载到DNA模板上。

2. 原核与真核:原核细胞通常在环形染色体上有单一复制起点,叉速度可达1000 nt/s,不到30分钟即可复制完成。真核细胞DNA复制仅在S期进行,复制叉速度慢约10倍,因此需要多个复制起点才能在约8小时内完成复制。

3. 起点调控:不同复制起点按顺序激活,部分取决于染色质结构,最浓缩的区域通常最后复制。复制叉经过后,新组蛋白与旧组蛋白一起重新组装染色质。

4. 端粒保护:真核生物通过端粒解决线性染色体末端的复制问题,端粒酶使用自身携带的RNA模板延伸染色体末端的重复序列。端粒具有特殊的保护结构(Shelterin复合物和T-loop),确保其不被误认为断裂的染色体末端。

Section IV

DNA复制相关药物开发案例

From Replication Mechanism to Therapeutic Strategy

Hydroxyurea:抑制核糖核苷酸还原酶,限制dNTP供给

  • 中文药名:羟基脲
  • 作用环节:DNA复制原料层(dNTP池)
  • 抑制RNR(ribonucleotide reductase),减少脱氧核苷酸生成
  • dNTP不足会引发复制压力并降低快速增殖细胞的复制能力
  • 临床应用:骨髓增殖性疾病、镰状细胞病等
  • 重点提示:先“断原料”,再谈复制机器,是药物设计的上游思路
drug_hydroxyurea_mechanism.png
Hydroxyurea作用机制

Etoposide / Doxorubicin:靶向Topo II,阻断DNA解缠结

  • 中文药名:依托泊苷 / 多柔比星
  • 作用环节:复制叉前进时的拓扑应力管理
  • Topo II负责切开并重连DNA双链以解除超螺旋和缠结
  • 药物可“困住”Topo II-DNA复合体,导致断裂累积与复制崩溃
  • 用于多种肿瘤化疗,属于肿瘤药物发展史中的里程碑类别
  • 重点提示:解释“为何有效”与“为何毒性显著”常常同时存在
drug_etoposide_mechanism.png
Etoposide 药理机制
drug_doxorubicin_mechanism.png
Doxorubicin 药理机制

Irinotecan / Topotecan:靶向Topo I,诱发复制叉崩溃

  • 中文药名:伊立替康 / 托泊替康
  • 作用环节:单链切口重连循环(Topo I)
  • Topo I通常切开一条链释放扭转应力后再重连
  • 药物稳定切割中间体,复制叉碰撞后可转化为更严重损伤
  • 临床代表:伊立替康用于结直肠癌等,托泊替康用于多种实体瘤
  • 重点提示:展示“复制叉—DNA损伤响应—细胞命运”这一连锁关系
drug_topo1_inhibitor.png
Topo I抑制剂机制

Cytarabine / Gemcitabine:核苷类似物干扰DNA链延伸

  • 中文药名:阿糖胞苷 / 吉西他滨
  • 作用环节:DNA聚合酶底物层与链延伸过程
  • 药物经细胞内激活后可与天然核苷竞争,掺入DNA
  • 引发链终止或延伸障碍,造成S期阻滞与细胞死亡
  • 阿糖胞苷是白血病经典药;吉西他滨用于胰腺癌等重要肿瘤
  • 重点提示:把“聚合酶选择底物”与“药物结构修饰”直接关联
drug_nucleoside_analogs.png
核苷类似物链终止

Acyclovir:经典抗疱疹药,选择性抑制病毒DNA复制

  • 中文药名:阿昔洛韦
  • 作用环节:病毒DNA聚合酶与病毒复制周期
  • 关键特点:需经病毒相关激酶优先活化,体现良好选择性
  • 活化后抑制病毒DNA聚合酶并终止链延伸
  • 重点提示:说明“同是复制抑制,选择性来源于病原体特有步骤”
drug_acyclovir_selectivity.png
Acyclovir选择性抑制机制

Ganciclovir / Cidofovir:面向CMV等高风险病毒复制抑制

  • 中文药名:更昔洛韦 / 西多福韦
  • 作用环节:病毒DNA复制延伸与聚合酶抑制
  • 更常用于免疫抑制或移植相关高风险人群中的CMV管理
  • 与阿昔洛韦相比,谱系和毒性考量不同,临床权衡更复杂
  • 提示学生:药物选择不仅取决于机制,还取决于患者背景与风险分层
  • 重点提示:把“机制正确”与“临床可用性”连接起来
drug_ganciclovir_mechanism.png
Ganciclovir 药理机制
drug_cidofovir_mechanism.png
Cidofovir 药理机制

Ciprofloxacin / Levofloxacin:靶向细菌DNA复制机器

  • 中文药名:环丙沙星 / 左氧氟沙星
  • 作用环节:细菌拓扑异构酶(DNA gyrase / Topo IV)
  • 抑制细菌DNA复制和染色体分离,对常见细菌感染疗效确切
  • 耐药机制:靶点突变、外排泵上调、用药不规范
  • 重点提示:帮助学生理解“药靶差异决定抗菌药与抗病毒药边界”
drug_fluoroquinolone_mechanism.png
喹诺酮类抗菌药靶向DNA gyrase

小节总结 — DNA复制相关药物开发案例

1. 复制药靶分层:可从原料供给、复制叉拓扑、链延伸、修复依赖和病原体特异复制五个层面进行药物设计。

2. 机制与临床并重:同一机制在不同疾病中疗效与毒性表现不同,必须结合患者分层与治疗目标。

3. 代表药物的教学意义:经典药物不仅是“知识点”,更是连接基础机制与真实临床决策的桥梁。

4. 课程衔接:本节的复制机制为后续DNA修复与重组、RNA转录和蛋白质翻译奠定药理学理解框架。

本讲总结

1. DNA序列的维持:突变率极低(~10⁻¹⁰ /nt/分裂),这对维持大基因组和防止癌症至关重要。

2. 复制叉结构:Y形复制叉中,前导链连续合成,滞后链通过冈崎片段「回缝」合成,两者均为5'→3'方向。

3. 三步保真机制:聚合选择(10⁻⁵)→ 外切校对(10⁻²)→ 错配修复(10⁻³),总计达到 10⁻¹⁰ 的惊人保真度。

4. 复制机器:解旋酶、DNA聚合酶×2、引物酶、滑动夹/载入蛋白、SSB蛋白、连接酶、拓扑异构酶协同工作。

5. 复制起始调控:原核细胞单起点,真核细胞3~5万个起点;ORC/Mcm确保每个起点每周期仅激活一次。

6. 核小体与端粒:复制叉后方核小体由组蛋白伴侣重新组装;端粒酶解决末端复制问题,端粒长度与衰老/癌症密切相关。

Lecture 2

DNA 修复与重组

DNA Repair and Recombination

Molecular Biology of the Cell
CHAPTER 5 DNA Replication, Repair, and Recombination

你的基因组,每天承受约 10 万次化学攻击

  • 每个细胞每天发生约 50,000 – 100,000 次 DNA 损伤事件
  • 脱嘌呤(Depurination):每细胞每天约 18,000 次,碱基与脱氧核糖键水解断裂
  • 胞嘧啶脱氨基:每天约 100 次 C → U,若不修复 → G·C 变 A·T 突变
  • 活性氧(ROS):氧化磷酸化的副产品,形成 8-oxoG 等氧化损伤碱基
  • 紫外线:相邻嘧啶共价交联 → 胸腺嘧啶二聚体,阻断复制与转录
  • 即便如此,实际突变率仅 ~10⁻¹⁰ / 碱基 / 分裂——修复系统几乎将错误清零

核心问题:细胞如何在如此高强度的化学攻击下仍精确维持基因组?答案就是本讲的主题——DNA 修复

DNA damage scale per day
DNA 损伤类型与每日频次

修复失败的代价:癌症、衰老与遗传病

  • 着色性干皮病(XP):核苷酸切除修复(NER)缺陷 → 无法清除 UV 损伤 → 皮肤癌风险 ×2000
  • 遗传性非息肉性结肠癌(HNPCC):错配修复(MMR)基因突变 → 结直肠癌风险极高
  • Fanconi 贫血:跨链损伤(ICL)修复缺陷 → 骨髓衰竭 + 白血病易感
  • BRCA1 / BRCA2 突变:同源重组修复受损 → 乳腺癌、卵巢癌终身风险升至 60–80%
  • 衰老的 DNA 损伤积累理论:体细胞修复错误长期积累 → 细胞功能退化
  • 癌症基因组中约 25% 的驱动突变起源于 DNA 修复基因缺陷

临床意义:理解修复通路直接推动了 PARP 抑制剂(合成致死策略)等靶向药物的开发——本讲后半段将详细介绍。

DNA repair defects and disease
DNA 修复缺陷与癌症、遗传病关联

同源重组与转座:基因组是动态的"活图"

  • 同源重组是最精确的双链断裂修复方式,也是减数分裂产生遗传多样性的分子基础
  • 每次减数分裂,人类基因组平均发生 ~2–3 次交叉互换,重新洗牌遗传组合
  • 转座子(Transposable Elements):占人类基因组约 45%,是最丰富的基因组成分
  • LINE-1 逆转座子在人类中仍保持活性:偶尔转座 → 插入突变(如血友病 A 部分病例)
  • 细菌转座子携带抗生素耐药基因,是耐药性 跨种传播 的重要载体
  • Cre/LoxP 等位点特异性重组系统已成为现代基因工程的 核心工具

宏观视角:DNA 不是静态"蓝图",而是在修复、重组、转座的持续作用下不断演化的动态信息载体。本讲将从机制上揭示这三个过程。

Genome dynamics: repair, recombination, transposition
基因组三大动态过程:修复 · 重组 · 转座

本讲大纲点击条目可直接跳转

一、DNA 修复

  • 自发性损伤会改变DNA序列
  • UV损伤与化学修饰如何致突变
  • 双螺旋结构本身有利于修复
  • 碱基切除修复(BER)
  • 核苷酸切除修复(NER)
  • 直接化学逆转
  • NER与转录偶联(TC-NER)
  • 碱基化学特性与损伤检测
  • 跨损伤聚合酶(TLS)
  • 双链断裂修复(HR / NHEJ)
  • DNA损伤检查点 (ATM / ATR / AT综合征)

二、同源重组

  • 同源重组的共同特征
  • 碱基配对引导同源重组
  • HR精确修复双链断裂
  • RecA / Rad51催化链交换
  • HR拯救断裂复制叉
  • HR三层调控 + LOH / BRCA1/2
  • 背景回顾:有丝分裂 vs 减数分裂
  • 同源重组与减数分裂
  • 程序性DSB启动减数分裂重组
  • Holliday连接结构
  • 交叉互换与非交叉互换

三、转座与保守性
位点特异性重组

  • 转座子可插入任意DNA序列
  • DNA转座子:剪切-粘贴机制
  • 病毒利用转座整合宿主染色体
  • LTR 逆转座子(逆转录病毒样)
  • 非 LTR 逆转座子(LINE / SINE)
  • LTR vs 非LTR 对比表
  • TE类型与分布的跨物种比较
  • TE活跃的进化时间线
  • 位点特异性重组的可逆性
  • 位点特异性重组开关基因
  • Cre / LoxP系统的应用

四、DNA修复相关
药物开发案例

  • Cisplatin / Carboplatin(铂类)
  • Temozolomide(替莫唑胺)
  • Olaparib / Niraparib(PARP抑制剂)
  • ATR / WEE1 抑制剂
  • Bleomycin(博来霉素)
  • CRISPR-Cas9(Casgevy)
  • 腺病毒载体(Gendicine / ONYX-015)
Section I

DNA 修复

DNA REPAIR

没有DNA修复,自发性损伤会迅速改变DNA序列

  • DNA在正常条件下也会发生自发性化学变化
  • 人类细胞每天丢失约18,000个嘌呤碱基(脱嘌呤反应)
  • 每天约100个胞嘧啶自发脱氨基变成尿嘧啶
  • 活性氧(ROS)和S-腺苷甲硫氨酸等活性代谢物也会损伤碱基
  • 紫外线造成相邻嘧啶之间的共价连接——胸腺嘧啶二聚体
  • 环境化学物质(苯并芘等)通过化学修饰碱基导致损伤
  • 未修复的损伤在复制时导致碱基替换突变或缺失
  • 基因组中数个百分点的编码能力专门用于DNA修复
Figure 5-37.png
自发性DNA损伤的类型与脱嘌呤、脱氨基反应示意图
Figure 5-38.png
DNA损伤化学反应详图
Table 5-3.png
哺乳动物细胞24小时内产生和修复的内源性DNA损伤

紫外损伤与化学修饰如何产生突变

  • 脱嘌呤:N-糖苷键水解→嘌呤碱基丢失→AP位点
  • 脱氨基:胞嘧啶(C)→尿嘧啶(U),复制后产生G→A突变
  • 胸腺嘧啶二聚体:UV照射使相邻胸腺嘧啶形成共价键
  • 苯并芘(烟草、柴油废气中的致癌物)——形成大体积加合物
  • 这些损伤的共同特点:改变了碱基的化学结构
  • 所有不能及时修复的损伤都可能在下一轮复制中成为永久性突变
Figure 5-39.png
UV导致胸腺嘧啶二聚体
Figure 5-40.png
化学修饰如何产生突变:(A) C脱氨→U→G-to-A突变 (B) 脱嘌呤→核苷酸缺失

DNA双螺旋结构本身有利于修复

  • 双螺旋携带两份遗传信息——每条链各一份
  • 一条链受损时,互补链可作为精确修复的模板
  • 这是所有细胞都使用双链DNA作为遗传物质的根本原因
  • 只有非常小的病毒才能"负担得起"单链基因组(RNA或ssDNA)
  • 单链基因组无法利用互补链修复→更高的突变率
  • 小基因组是损伤的小靶标,故能承受更高突变率
  • 这一原理是所有DNA修复机制的核心基础
双链DNA修复优势 vs 单链基因组
双链 DNA vs 单链基因组:修复能力对比

DNA损伤可通过多种途径修复 (一) 碱基切除修复

  • 碱基切除修复(BER, Base Excision Repair):修复单个碱基的化学改变
  • 依赖DNA糖苷酶(DNA glycosylase)——至少6种,各识别特定类型的异常碱基
  • 关键机制:碱基翻转(base-flipping)
    • 将受损核苷酸翻出双螺旋
    • 糖苷酶探测碱基的各个面以检测损伤
  • 糖苷酶从糖基上移除受损碱基→产生AP位点(无嘌呤/无嘧啶位点)
  • AP核酸内切酶(AP endonuclease)识别AP位点,切割磷酸二酯键骨架
  • DNA聚合酶(DNA polymerase)填补缺口,DNA连接酶(DNA ligase)封口
  • 自发脱嘌呤产生的AP位点可被AP核酸内切酶直接修复
Figure 5-41A.png
碱基切除修复(BER)通路
Figure 5-42.png
DNA糖苷酶通过碱基翻转识别并移除受损碱基

DNA损伤可通过多种途径修复 (二) 核苷酸切除修复

  • 核苷酸切除修复(NER, Nucleotide Excision Repair):修复大体积DNA损伤
  • 修复对象:苯并芘加合物、嘧啶二聚体等扭曲双螺旋的损伤
  • 大型多酶复合物巡查 DNA → 识别双螺旋构象异常(而非特定碱基改变)→ 可通用修复嘧啶二聚体、苯并芘加合物等结构性损伤
  • 人类 GG-NER:XPC-RAD23B 复合物先结合扭曲位点 → 招募下游修复机器
  • TFIIH 中的 XPB / XPD 解旋酶(helicase)局部解链约 30 bp 形成开口"气泡",XPA + RPA 验证损伤并稳定单链
  • 两侧分别切割:XPG(3' 端切)+ XPF-ERCC1(5' 端切)—— 双切口产生含损伤的寡核苷酸片段
  • DNA解旋酶(DNA helicase)剥离含损伤的寡核苷酸片段
  • 原核细胞中留下12个核苷酸的缺口;人类中留下约30个核苷酸的缺口
  • DNA聚合酶(DNA polymerase)和连接酶(DNA ligase)填补并封口
  • 着色性干皮病(XP):NER缺陷导致的遗传病——阳光敏感、高度皮肤癌风险
Figure 5-41B.png
核苷酸切除修复(NER)通路

DNA损伤可通过多种途径修复 (三) 直接化学逆转

  • 第三种修复策略:直接逆转化学损伤,无需切割骨架
  • O6-甲基鸟嘌呤的修复:
    • 甲基转移到修复蛋白的半胱氨酸残基
    • 修复蛋白在反应中被"自杀式"破坏(一次性使用)
  • 1-甲基腺嘌呤3-甲基胞嘧啶的修复:
    • 铁依赖的去甲基化酶移除甲基,释放甲醛
  • 三种策略对比:BER移除碱基、NER移除寡核苷酸、直接逆转移除化学修饰
BER
碱基切除修复
点击放大 ATUGA TAGCT 单个异常碱基
触发:碱基化学改变
  • 糖苷酶识别并翻转碱基
  • 移除碱基 → AP 位点
  • AP 内切酶切骨架
  • 聚合酶填补 + 连接酶
移除范围:1 个碱基
NER
核苷酸切除修复
点击放大 AT TT GA TAGCT 大体积扭曲损伤
触发:双螺旋构象异常
  • 多酶复合物扫描,识别扭曲
  • 损伤两侧切骨架
  • 解旋酶剥离寡核苷酸
  • 聚合酶填补 + 连接酶
移除范围:~12–30 nt 片段
Direct
直接化学逆转
点击放大 AT G CA TACGT CH₃ 化学修饰(如甲基)
触发:可逆化学基团
  • 修复蛋白直接接触损伤碱基
  • O⁶-甲基 G:甲基转到 Cys(自杀式)
  • 1-甲基 A / 3-甲基 C:去甲基酶移除
  • 无需切割骨架 / 无需重新合成
移除范围:1 个化学修饰

核苷酸切除修复与转录偶联确保重要基因优先修复

  • 细胞优先修复正在转录的基因——转录偶联修复
  • RNA聚合酶在损伤处停滞→偶联蛋白引导NER机器到达
  • 原核细胞(短基因):
    • 停滞的RNA聚合酶被解离
    • 修复DNA后重新从头转录
  • 真核细胞(长基因):
    • 更复杂的反应"回退"RNA聚合酶
    • 修复损伤后重启聚合酶继续转录
  • Cockayne综合征:转录偶联修复缺陷
    • 生长迟缓、骨骼异常、神经退行性变
    • 严重的日光敏感
点击放大 ① 正常转录 RNAP RNA → RNA Pol 沿模板链 5'→3' 合成 ② 撞上损伤 → 停滞 RNAP RNA 无法继续延伸,RNAP 卡在损伤处 ③ CSA / CSB 招募 NER RNAP CSB CSA NER 机器 偶联蛋白识别停滞 → 招募修复机器 ④ 修复完成 → 转录重启 RNAP 损伤切除 + 重合成 → RNAP 继续延伸
转录偶联修复 (TCR-NER) 四步机制
Table 5-2.png
几种与 DNA 修复缺陷相关的遗传性综合征

DNA碱基的化学特性有利于损伤检测

  • 每一种可能的脱氨基产物都是"非天然"碱基,容易被特异性糖苷酶识别
  • 次黄嘌呤(腺嘌呤脱氨产物)→ 非天然,可识别
  • 黄嘌呤(鸟嘌呤脱氨产物)→ 非天然,可识别
  • 为什么DNA使用T而不是U?
    • 如果DNA含U,无法区分天然U和C脱氨产生的U
    • 使用T(5-甲基U)后,尿嘧啶DNA糖苷酶可安全移除DNA中所有U
  • 5-甲基胞嘧啶的问题
    • 脊椎动物CG序列中约3%的C被甲基化
    • 5-甲基C脱氨产生胸腺嘧啶(T)——天然碱基!
    • 形成T-G错配,修复效率较低
    • 虽然只有3%的C被甲基化,但贡献了约1/3的单碱基突变
Figure 5-43.png
DNA核苷酸脱氨基反应

特殊的跨损伤DNA聚合酶用于紧急情况

  • 当DNA损伤过重,常规修复来不及处理时的最后手段
  • 正常复制聚合酶在损伤处停滞
  • 跨损伤聚合酶(translesion synthesis polymerase, TLS pol)可在受损DNA上继续复制
  • 人类有7种跨损伤聚合酶
  • 特点:
    • 缺乏外切核酸酶校对功能
    • 核苷酸选择性较低,比复制聚合酶精确度低
  • 每种只添加1个或几个核苷酸后复制聚合酶重新接管
  • 可能是大多数碱基替换和单核苷酸缺失突变的来源
  • 严格调控至关重要——只能在损伤位点部署
Figure 5-44.png
跨损伤聚合酶部署模型

双链断裂被高效修复

  • 双链断裂(DSB, Double-Strand Break)是最危险的损伤——没有完整模板链
  • 原因:电离辐射、复制错误、氧化剂、细胞代谢产物
  • 非同源末端连接(NHEJ, Non-Homologous End Joining)
    • 断裂末端直接拉拢并连接
    • 通常导致连接处核苷酸丢失(突变)
    • Ku异源二聚体抓住断裂的染色体末端
    • 哺乳动物体细胞中占主导
    • 70岁时典型体细胞含超过2000个NHEJ"疤痕"
  • 同源重组修复
    • 利用姐妹染色单体作为修复模板
    • 仅在S期和G2期可用
    • 精确恢复原始DNA序列,无突变
  • NHEJ的危险:可能连接原本不相邻的末端→染色体重排
Figure 5-45.png
双链断裂的两种修复方式
Figure 5-46.png
NHEJ 机制:Ku 异源二聚体识别断裂末端 → DNA-PK 招募 → 直接连接

DNA损伤延迟细胞周期进程

  • 真核细胞额外保障——DNA 损伤检查点暂停细胞周期直到修复完成,同时上调修复酶表达
  • 三个主要检查点:G1/S(阻止进入复制)、S 期内(减慢合成)、G2/M(阻止进入分裂)
  • 两个核心损伤感受器(PIKK 激酶):
    • ATM:感知 DSB,由 MRN 复合物在断裂处激活
    • ATR:感知 RPA 包覆的 ssDNA(复制压力、停滞复制叉)
  • 下游:ATM → CHK2ATR → CHK1 → 磷酸化 Cdc25 暂停 CDK,激活 p53 触发阻滞 / 凋亡
  • 共济失调-毛细血管扩张症(AT):ATM 双等位失活 → 小脑共济失调、放疗超敏、淋巴瘤 / 白血病易感性显著升高
DNA damage checkpoint simple
DNA 损伤检查点:感知 → 信号 → 阻滞 → 结局

小节总结 — DNA修复

1. 自发性损伤:DNA每天遭受大量自发性损伤(脱嘌呤~18,000次/天、脱氨基~100次/天、氧化损伤、环境因素),但修复系统将永久突变率控制在极低水平。


2. 修复依赖互补链:DNA双螺旋携带两份信息拷贝,使精确修复成为可能——这是所有生物使用双链DNA的根本原因。


3. 三种修复策略:碱基切除修复(BER)修复单碱基损伤;核苷酸切除修复(NER)修复大体积扭曲损伤;直接化学逆转处理特定甲基化损伤。


4. 跨损伤聚合酶:紧急情况下的最后手段,精确度低但可绕过无法及时修复的损伤。


5. 双链断裂修复:NHEJ快速但不精确(产生突变);同源重组精确但需要姐妹染色单体(限于S/G2期)。


6. 细胞周期检查点:ATM 感知 DSB、ATR 感知 ssDNA / 复制压力 → 激活 CHK2 / CHK1 → 暂停细胞周期 + 触发 p53。修复基因缺陷 → 遗传性癌症易感综合征(AT、XP、Lynch、BRCA1/2)。

Section II

同源重组

HOMOLOGOUS RECOMBINATION

同源重组在所有细胞中都有共同特征

  • 同源重组最初作为减数分裂的组成部分被发现
  • 随后在大肠杆菌酵母中发现了相关的生化机制
  • 这些蛋白的近缘同源物存在于果蝇、小鼠和人类中
  • 催化同源重组的基本过程在所有细胞中是相同的
  • 同源重组是理解DNA修复、减数分裂遗传多样性的核心
Homologous recombination conservation across species
同源重组跨物种保守性:RecA / Rad51 核心机制

碱基配对引导同源重组

  • 同源重组需要两个DNA双链之间有大段序列相似性(同源性)
  • 碱基配对是同源性搜索的基础:一条单链与另一个双链的互补链配对
  • DNA复性(杂交)过程:
    • ① 缓慢的螺旋核化步骤(随机碰撞)
    • ② 快速的"拉链式"延伸最大化碱基配对
  • 产生的分子称为异源双链体(heteroduplex)——同源重组的核心中间体
  • 体内同源重组受到精确调控:两条双链DNA可以相互"试探"而不完全解离
Figure 5-47.png
DNA杂交过程

同源重组可以无误地修复DNA双链断裂

  • 与NHEJ不同,同源重组修复不丢失、不改变核苷酸
  • 需要附近有同源的完整DNA作为模板——通常是姐妹染色单体
  • 修复步骤("链之舞"):
    • 末端切除:核酸酶切除5'端→暴露3'单链突出端
    • 链交换/链入侵:3'单链搜索同源双链并以碱基配对方式入侵
    • DNA合成:以完整模板为基础延伸入侵链
    • ④ 链置换、进一步修复合成和连接→恢复两条原始双链
  • 利用来自另一条双链的互补链——这是与其他修复不同之处
Figure 5-48.png
同源重组修复双链断裂的机制

链交换由RecA/Rad51蛋白执行

  • RecA(大肠杆菌)和Rad51(真核生物)催化链交换反应
  • RecA与入侵单链协同结合→形成蛋白-DNA丝状体
  • 丝状体中DNA呈独特构型:
    • 每3个相邻核苷酸保持螺旋构型
    • 三联体之间骨架解旋并拉长
  • 丝状体与双链DNA结合并使其去稳定化
  • 单链以三联体核苷酸为单位"试探"双链序列同源性
  • 至少需要15个核苷酸的配对才能稳定链交换
  • RecA需ATP结合进行搜索,ATP水解仅用于蛋白解离
Figure 5-49.png
RecA催化的链入侵

同源重组可以拯救断裂的DNA复制叉

  • 可能是同源重组最重要的功能:拯救停滞或断裂的复制叉
  • 场景:亲代双螺旋在复制叉前方存在单链切口
  • 当复制叉到达切口时→复制叉崩溃
  • 产生一个断裂的和一个完整的子代染色体
  • 断裂的复制叉通过同源重组反应无误修复
  • 使用的基本反应与双链断裂修复相同
  • 这些反应的组合可以修复多种不同类型的DNA损伤
Figure 5-50.png
同源重组修复断裂的复制叉

细胞精确调控同源重组在DNA修复中的使用

  • HR 是最精确的修复方式(可拯救复制叉、无误修复 DSB),但若失控代价极大 —— 因此细胞必须严格规定 HR "何时启用、用什么模板、招谁来做"
  • 核心风险:若误用同源染色体(而非姐妹染色单体)作模板 → 原本"好/坏"的杂合状态会被改写成"坏/坏"的纯合状态,即杂合性丢失(LOH, Loss of Heterozygosity) —— LOH 可在多类基因座引发疾病(见下表)
  • 三层调控机制:
    • ① 时间:末端切除核酸酶仅在 S / G2 期被 CDK 磷酸化激活 → 保证姐妹染色单体可用
    • ② 空间:损伤处招募 Rad51、Rad52 等聚集形成"修复工厂",反应集中、副反应少
    • ③ 蛋白控制BRCA1(早期决策末端切除 vs NHEJ)+ BRCA2(递送 Rad51 到损伤处并激活)+ Rad52(链交换辅助)
  • 失衡 = 致癌:HR 过少(BRCA1/2 突变)→ DSB 被 NHEJ 错修 → 基因组不稳定;HR 过多 → 染色体异常重排
    • BRCA1/2 突变 → 乳腺癌 / 卵巢癌终身风险升至 60–80%
    • → 后续 PARP 抑制剂"合成致死"策略正建立在此调控失衡之上
点击放大 ⚡ DSB 发生 (DNA 双链断裂) 三层调控闸门 — 决定 HR 能否启动 ① 时间闸 细胞周期是否处于 S/G2 期? CDK 磷酸化 → 末端切除核酸酶激活 姐妹染色单体已存在 G1 / G0 期 → 闸门关 → NHEJ ② 空间闸 修复蛋白能聚集到损伤处? Rad51 / Rad52 / MRN 等 在 DSB 位点局部富集 形成"修复工厂" 弥散状态 → 反应失焦 ③ 蛋白闸 BRCA1/2 + Rad51 是否到位? BRCA1:决策切除 vs NHEJ BRCA2:递送 Rad51 到末端 Rad51:催化链入侵 BRCA 突变 → 闸门坏 → 强行 NHEJ → LOH ✓ HR 精确修复(用姐妹染色单体作完美模板) 无突变 · 无 LOH · 基因组完整 ⚠ 任一闸门失败 → 强行 NHEJ → 错连 / LOH → 染色体不稳定 → 癌症(BRCA 突变 → PARP 合成致死)
HR 三层调控闸门:时间 + 空间 + 蛋白

LOH 在不同基因座上的后果

受影响基因类型 LOH 后果 临床例 / 意义
抑癌基因 残存"好"拷贝丢失 → 蛋白功能完全丧失 RB(视网膜母细胞瘤)、TP53、BRCA1/2、APC
隐性遗传病基因
(杂合携带者)
"杂合无症状"在体细胞水平变成"纯合显病" 体细胞镶嵌型病灶;某些代谢病在特定组织发病
印记基因
(imprinted genes)
仅父或母方表达,丢失活跃那条 → 表达归零 Beckwith-Wiedemann 综合征、Wilms 肿瘤、肾母细胞瘤过度生长
HLA / MHC 等位基因 肿瘤细胞丢失 HLA → 抗原呈递失效 → 免疫逃逸 免疫检查点抑制剂耐药、肿瘤免疫治疗失败
剂量敏感基因 表达量减半 → 单倍剂量不足(haploinsufficiency) 部分发育异常、神经/血液病

背景回顾:有丝分裂 vs 减数分裂

细胞周期 — DNA 复制创造姐妹染色单体 G1 期 2n · DNA = 2c S 期(DNA 复制) 2n · DNA = 2c → 4c · 姐妹染色单体形成 G2 期 2n · DNA = 4c · HR 修复窗口 M 期(细胞分裂) → 有丝分裂 / 减数分裂 关键:S 期复制后才有姐妹染色单体 → HR 修复仅限 S/G2 期

有丝分裂(Mitosis) · 体细胞

  • 1 次复制 + 1 次分裂 → 2 个子细胞
  • 子细胞与母细胞遗传完全一致(2n → 2n)
  • 分裂时姐妹染色单体在着丝粒处分离
  • 同源染色体各自行动,不配对
  • HR 用于修复偶发 DSB,模板 = 姐妹染色单体(防 LOH)
  • 遗传后果:克隆性增殖,维持组织稳态

减数分裂(Meiosis) · 生殖细胞

  • 1 次复制 + 2 次分裂 → 4 个配子
  • 染色体数减半(2n → n),DNA 量 4c → c
  • Meiosis I(前期 I 含 pachytene):同源染色体配对 + HR 交叉互换 → 同源染色体分离
  • Meiosis II:姐妹染色单体分离(类似有丝分裂)
  • HR 由 Spo11 程序性 DSB 启动,模板 = 同源染色体(产生多样性)
  • 遗传后果:遗传多样性 + 染色体正确分离
关键概念 有丝分裂语境 减数分裂语境
姐妹染色单体 S 期产生,分裂前期共同存在;分裂时分离 在 Meiosis II 才分离(贯穿 Meiosis I)
同源染色体配对 不发生(独立分裂) 必须配对(前期 I),形成 bivalent / tetrad
HR 模板选择 姐妹染色单体(防 LOH) 同源染色体(要多样性)
染色体数变化 2n → 2n(不变) 2n → n(减半)

同源重组对减数分裂至关重要

  • 在有性生殖生物中,同源重组是减数分裂不可或缺的部分
  • 产生染色体交叉互换(crossing-over)
    • 两条同源染色体交换片段
    • 生成含有父本和母本基因的混合染色体
  • 产生基因转换(gene conversion):一条同源染色体的短DNA片段复制到另一条上
  • 两种结果都由与双链断裂修复类似的机制产生
  • 减数分裂重组是产生遗传多样性的关键机制
Figure 5-53.png
减数分裂中的染色体交叉互换

概念辨析:减数分裂 HR vs 体细胞 HR 修复(同一机制,两种用途)

维度 减数分裂中的同源重组 体细胞同源重组修复
触发 Spo11 主动制造 DSB(程序性) 偶发 DNA 损伤(被动响应)
配对模板 同源染色体(父-母两条) 姐妹染色单体(自我克隆)
时机 减数分裂前期 I(pachytene) S / G2 期(必须有姐妹染色单体)
频率 每条染色体强制 ≥1 次(保证正确分离) 损伤事件触发,按需进行
主要结果 交叉互换 + 基因转换 → 遗传多样性 精确复原原始序列 → 无 LOH
关键蛋白 Spo11、Dmc1(减数分裂特异)+ Rad51 Rad51、BRCA1 / BRCA2、RPA、MRN
失败后果 染色体不分离 → 三体 / 不育 DSB 累积 → 凋亡 / 染色体不稳定 / 癌症

减数分裂重组始于程序性双链断裂

  • 减数分裂重组始于Spo11蛋白有意造成的双链断裂
  • Spo11与断裂的DNA共价结合(类似拓扑异构酶)
  • 专化核酸酶(含Mre11复合物)迅速降解与Spo11结合的末端
  • 留下突出的3'单链末端
  • 与DSB修复使用许多相同的重组蛋白
  • 减数分裂特异性蛋白使这些反应方向不同:
    • 优先与母本和父本同源染色体配对
    • 而非完全相同的姐妹染色单体
Figure 5-54.png
减数分裂同源重组产生交叉互换

概念辨析:同源染色体 vs 姐妹染色单体

维度 同源染色体(homologs) 姐妹染色单体(sister chromatids)
来源 一条来自母方、一条来自父方 S 期复制同一条染色体产生的两份拷贝
等位基因 基因座相同,等位基因可能不同(如 A vs a) 完全相同(仅复制错误造成极个别差异)
物理结构 独立两条染色体,平时不相连 在着丝粒处相连,呈 X 形
HR 模板用途 减数分裂中故意使用 → 交叉互换 → 遗传多样性 体细胞 HR 修复的标准模板 → 精确复原,避免 LOH

减数分裂中形成Holliday交叉

  • 出现时机:HR 反应中 3' 单链侵入同源双链(链入侵)之后,两条 DNA 双链在交叉点物理"桥接"形成的中间体 —— 1964 年 Robin Holliday 首次提出
  • 生物学意义:
    • 把两条原本独立的 DNA 双链物理连接,是 HR 中"链交换"的可视证据
    • 减数分裂前期 I 显微镜下的交叉(chiasmata),对应的就是 Holliday 交叉
    • 后续如何"剪开"(resolution)决定结果:交叉互换 vs 非交叉互换 —— 是遗传多样性的分子源头
    • 不能正常解开 → DNA 缠结 → 染色体分离失败 → 细胞死亡
  • Holliday交叉(交叉链交换)可采取多种构象;蛋白质稳定其开放对称异构体
  • 蛋白质催化分支迁移(branch migration)
    • DNA 在交叉点中被"滚轴式"推进
    • 打断和重新形成碱基对,需要 ATP 水解
  • 扩展异源双链体区域,可从原始断裂点迁移数千个核苷酸
  • Holliday 交叉通常成对出现→双 Holliday 交叉(dHJ)
  • 大肠杆菌中:RuvA 四聚体 + RuvB 六聚体协同驱动分支迁移
Figure 5-55.png
Holliday 交叉结构与分支迁移
Figure 5-57.png
RuvA / RuvB 驱动 Holliday 交叉分支迁移

同源重组在减数分裂中产生交叉互换和非交叉互换

  • 减数分裂同源重组的两种结果:
  • 非交叉互换 (~90%)
    • 双链分离,仅在断裂位点附近有异源双链体区域
    • 染色体基本不变
  • 交叉互换 (~10%)
    • 双Holliday交叉被专化酶切割
    • 交换两条染色体的上下游部分
  • 交叉互换干涉:一个交叉互换抑制附近形成新的交叉互换
  • 确保交叉互换在染色体上均匀分布
  • 每条染色体每次减数分裂至少1个交叉互换(通常每臂约1个)
  • 非交叉互换产生散在的基因转换位点
Figure 5-58.png
减数分裂中形成的异源双链体

小节总结 — 同源重组

1. 碱基配对引导:同源重组需要DNA双链之间有大段序列同源性,通过碱基配对"试探"和识别同源序列,形成异源双链体。


2. 精确修复DSB:同源重组利用姐妹染色单体作为模板,无误修复双链断裂(末端切除→链入侵→DNA合成→恢复),也能拯救断裂的复制叉。


3. RecA/Rad51蛋白:核心催化蛋白,形成蛋白-DNA丝状体,以三联体核苷酸为单位搜索同源性,需≥15 nt配对稳定链交换。


4. 三层调控:HR 限于 S/G2 期(时间),损伤处聚集形成"修复工厂"(空间),BRCA1/2 + Rad51 协同(蛋白)——共同防止误用同源染色体导致 LOH 致癌;BRCA 突变 → PARP 合成致死的临床基础。


5. 同一机制,两种用途:体细胞 HR 修复用姐妹染色单体(防 LOH),减数分裂 HR 用同源染色体(产生多样性);后者由 Spo11 程序性 DSB 启动,经 Holliday 交叉解析为 ~10% 交叉互换 + ~90% 非交叉互换(伴随局部基因转换)。

Section III

转座与保守性位点特异性重组

TRANSPOSITION AND CONSERVATIVE SITE-SPECIFIC RECOMBINATION

通过转座,可移动遗传元件可插入任何DNA序列

  • 基因组从不是一份"静态蓝图"——人类基因组中近一半的序列源自能在染色体间跳跃的"可移动遗传元件",由 Barbara McClintock 1940 年代在玉米中首次发现(1983 诺奖),是细菌耐药传播、人类某些遗传病、CRISPR 编辑等的分子基础
  • 不同于同源重组——转座不需要序列同源性
  • 通过转座移动的元件称为转座子(transposons)
  • 转座子自身编码转座酶(transposase),作用于转座子两端的特异性DNA序列
  • 大多数转座子对靶位点只有适度的选择性
  • 细菌中转座频率约每105细胞分裂一次
  • 三大类转座元件:
    • 纯DNA转座子
    • 逆转录病毒样逆转座子
    • 非逆转录病毒逆转座子
  • 人类基因组近一半可追溯到这些元件
  • 大多数现在是不活跃的"分子化石"
Table 5-4.png
三大类转座元件

纯DNA转座子通过剪切-粘贴机制移动

  • 纯DNA转座子运动过程中始终以DNA形式存在
  • 在细菌中占主导,主要负责抗生素抗性基因传播(青霉素、四环素等)
  • 剪切-粘贴转座
    • 转座子从原位点被切除
    • 插入到新的基因组位点
  • 插入位点产生短的靶序列重复(target site duplication, TSD)——转座子的"签名"
    • 机制:转座酶错开切割靶 DNA 两条链(如 4–9 bp 间距)→ 留下单链突出 → 转座子插入后宿主修复填补 → 原靶序列在两侧各复制一份
    • 长度因转座子家族而定(IS1 / Tn5 / Tn10:9 bp;Tn3:5 bp;Alu / LINE-1:~4–20 bp)—— 即使转座子序列退化,TSD 仍可识别古老插入事件
  • 切除后留下的"洞"可通过同源重组或NHEJ修复
  • 同一切除机制被脊椎动物"驯化"用于免疫系统中的 V(D)J 重组
    • 淋巴细胞通过随机拼接基因片段,从有限片段库组合出海量抗体 / T 细胞受体多样性
    • 这一切除-拼接反应与转座酶共享分子机制 → 暗示适应性免疫系统起源于一次古老转座子的"驯化"
Figure 5-60.png
三类细菌纯 DNA 转座子结构
Figure 5-61.png
螺旋转座子(helitron)的转座机制——一类纯DNA转座子

某些病毒利用转座机制整合到宿主染色体中

  • 某些病毒本质上是利用转座机制的可移动遗传元件
  • 逆转录病毒(包括HIV/AIDS病毒):
    • 基因组为单链RNA
    • 蛋白质衣壳中含有逆转录酶
  • 生活周期:
    • ① 病毒RNA进入细胞
    • ② 逆转录酶将RNA转变为双链DNA
    • ③ 病毒编码的整合酶将DNA插入宿主染色体
    • ④ 宿主机器转录→翻译→组装新病毒颗粒
  • 整合酶的机制与纯DNA转座子的转座酶类似
Figure 5-62.png
逆转录病毒生活周期

逆转录病毒样逆转座子类似逆转录病毒但缺乏蛋白外壳

  • LTR retrotransposon(长末端重复逆转座子):两端各有一段 ~250–1500 bp 的长末端重复序列(LTR),内含启动子与整合信号
  • 存在于酵母、果蝇和哺乳动物;移动机制与逆转录病毒相似,但不能离开细胞——缺乏 env 蛋白,无法形成病毒颗粒
  • 转座过程(复制-粘贴):
    • ① 5' LTR 启动子驱动转录为 RNA
    • ② RNA 翻译产生逆转录酶,合成双链 DNA 拷贝
    • 整合酶将 DNA 拷贝插入基因组新位点(机制与 DNA 转座酶类似)
  • 原始拷贝保留不动,插入完成后拷贝数净增加一个
Retrotransposon vs retrovirus comparison
逆转座子 vs. 逆转录病毒:env 基因决定细胞外感染能力

人类基因组很大一部分由非逆转录病毒逆转座子构成

  • 非 LTR retrotransposon:两端没有 LTR;整合机制为 TPRT(靶位点引物逆转录)——在目标位点切口后原位逆转录,不需要整合酶
  • LINE(L1 元件)——自主型,自带逆转录酶:
    • 人类基因组约 ~50 万个拷贝,部分仍有活性
    • 插入可致病(如 因子 VIII 基因突变 → 血友病
  • SINE(Alu 元件)——非自主型,"借用" LINE 的逆转录酶:
    • 人类基因组 ~100 万个拷贝,占基因组约 13%
    • 仍保持微弱活性,每 100–200 次出生出现一次新插入
  • LINE + SINE 合计占人类基因组超过 30%;多数已突变失活成"分子化石"
Figure 5-63.png
L1 非 LTR 逆转座子转座机制

LTR 逆转座子 vs 非 LTR 逆转座子:特征对比

特征 LTR retrotransposon 非 LTR retrotransposon(LINE / SINE)
结构特征 两端各有 LTR(250–1500 bp)
5' LTR – gag – pol – 3' LTR
无 LTR;含内部启动子
5'UTR – ORF1 – ORF2 – polyA 尾
整合机制 整合酶切割插入
类似 DNA 转座酶的切-粘机制
TPRT(靶位点引物逆转录)
切口 3'-OH 作引物,原位逆转录
自主性 自主型(编码 gag + pol) LINE 自主;SINE 非自主(借用 LINE 的酶)
典型代表 酵母 Ty1/Ty3;果蝇 copia/gypsy;人类 HERV(内源逆转录病毒) LINE-1(L1);Alu(SINE);SVA
人类基因组占比 ~8%(主要为 HERV 化石) ~30%(LINE ~21%,SINE ~13%)
与逆转录病毒关系 结构高度相似,差异仅在缺乏 env 基因→ 不能出胞 与逆转录病毒无直接结构同源,进化起源独立
当前活性 多数沉默(HERV 已失活) LINE-1 / Alu 仍有微弱活性;每代贡献少量新插入突变

不同生物中转座元件的类型和分布不同

  • 原核细胞:主要是纯DNA转座子
  • 酵母:主要是逆转录病毒样逆转座子
  • 果蝇:三种类型都有(DNA型、逆转录病毒型、非逆转录病毒型)
  • 人类基因组:三种类型都有,但进化历史截然不同
  • 各类转座子的相对丰度反映了不同生物的进化历程
Transposon distribution across species
转座元件跨物种分布:从细菌到人类,TE 占比与类型差异巨大

基因组序列揭示转座元件移动的大致时间

  • 人类基因组含约300万个转座元件残迹——"化石记录"
  • 纯DNA转座子:在人类/旧世界猴分化前(2500-3500万年前)活跃;如今因累积失活突变而沉寂
  • 逆转录病毒样逆转座子:基因组中遍布残迹;目前似乎无活跃元件
  • 非逆转录病毒逆转座子:古老但部分仍活跃
    • Alu元件新移动约每100-200次出生一次
    • 贡献约2/1000的新突变
  • 小鼠中两类逆转座子仍活跃转座(~10%的新突变)
  • 转座子爆发性活动可能驱动了~1.7亿年前哺乳动物辐射性分化
Human transposon evolution timeline
人类基因组 TE 进化时间线:DNA转座子已沉默,Alu/L1 至今仍活跃

保守性位点特异性重组可以可逆地重排DNA

  • 与转座不同的机制:断裂和连接发生在两个特定识别序列
  • 根据位点的方向和位置,可产生三种结果:
    • DNA整合
    • DNA切除
    • DNA倒位
  • 由专化重组酶执行——类似拓扑异构酶
  • 重组酶与DNA形成瞬时共价键,利用储存的磷酸键能量完成重排
  • "保守性"含义:所有磷酸键被恢复,无能量净损失
  • 可逆:同一酶系统可以整合DNA,也可以切除DNA
  • DNA病毒用此机制将基因组移入/移出宿主染色体
  • 与转座的关键区别:
    • 需要供体和受体DNA上都有特定序列
    • 通过共价蛋白-DNA中间体而非留下缺口
Figure 5-64.png
保守性位点特异性重组的两种DNA重排类型

保守性位点特异性重组可用于开关基因

  • 经典例子:沙门氏菌相位变异(phase variation)
  • 一段含启动子的~1000 bp DNA片段可被位点特异性重组酶倒位
  • 正向时:
    • 启动子驱动H2鞭毛蛋白基因表达
    • 同时表达H1鞭毛蛋白抑制子
  • 反向时:H2和抑制子不表达;H1鞭毛蛋白被表达
  • 切换频率约每105细胞分裂一次
  • 整个菌落只表达一种类型
  • 生物学意义:帮助细菌逃避宿主免疫应答——针对一种鞭毛蛋白的抗体对切换后的细菌无效
Figure 5-65.png
沙门氏菌中通过DNA倒位切换基因表达

细菌保守性重组酶成为细胞和发育生物学的强大工具

  • Cre重组酶(来自噬菌体P1)+ LoxP位点:广泛使用的遗传工程工具
  • 用途:在多细胞生物的特定组织中删除特定基因(条件性敲除)
  • 原理:
    • ① Cre重组酶基因置于组织特异性启动子
    • ② 目标基因两侧插入LoxP位点("floxed")
    • ③ Cre仅在特定组织表达时才切除目标基因
  • 例如:Cre在肝脏特异性启动子控制下→仅在肝脏中删除基因
  • 也可用于通过连接强启动子到基因来激活基因表达
  • 特别有用场景:基因在早期发育中必需
    • 全身敲除致死
    • 组织特异性删除允许研究基因在特定环境和时间点的功能
Figure 5-66.png
Cre/LoxP条件性基因删除

小节总结 — 转座与保守性位点特异性重组

1. 可移动遗传元件:人类基因组近一半源自可"跳跃"的可移动遗传元件,由 Barbara McClintock 1940 年代在玉米中首次发现(1983 诺奖)。它们通过转座保守性位点特异性重组移动;插入位点产生短的靶序列重复(TSD)—— 转座的"分子签名"。

2. 三类转座子:① 纯 DNA 转座子(剪切-粘贴);② LTR 逆转座子(逆转录病毒样) —— 两端长重复 + 整合酶;③ 非 LTR 逆转座子(LINE / SINE) —— 内部启动子 + 靶位点引物逆转录(TPRT)。前两类与病毒有密切的进化关系。

3. 保守性位点特异性重组:需要两个特定识别序列,通过重组酶(类似拓扑异构酶)实现 DNA 整合、切除或倒位 —— 可逆且不损失磷酸键能量。

4. 应用:沙门氏菌相位变异展示了位点特异性重组的生物学功能(免疫逃逸);Cre / LoxP 系统被广泛用于条件性基因敲除 —— 现代遗传学的强大工具。

5. 进化"驯化"案例:脊椎动物 V(D)J 重组(适应性免疫)由古老转座子被驯化而来;端粒酶反转录酶、胎盘合胞素 syncytin 等同样源于古老 TE —— 是分子进化的"创意供应商"。

6. 双重视角:TE 在分子层面是"自私 DNA"(自私的复制单元,多数被宿主沉默);但其偶发"驯化"为脊椎动物提供了革命性蛋白创新,并是细菌耐药跨菌株传播、人类某些遗传病、CRISPR 工具的分子基础。

Section IV

DNA修复相关药物开发案例

From DNA Damage Response to Therapeutic Targeting

Cisplatin / Carboplatin:铂类药物引发交联损伤,迫使NER激活

  • 中文药名:顺铂 / 卡铂
  • 损伤类型:铂与嘌呤 N7 位共价结合 → 链内交联(1,2-d(GpG),~65%)+ 链间交联 ICL(~5%,毒性最强)→ 严重扭曲双链,阻断聚合酶
  • NER 的矛盾角色:NER 识别并切除链内交联加合物——这是顺铂耐药的主要机制(高 NER 活性 → 修得快 → 耐药)
  • 凋亡如何发生?治疗剂量下损伤总量超过 NER 修复能力
    • 复制叉在 S 期遭遇未修复加合物 → 叉停滞 → DSB → ATR-CHK1 激活
    • ICL 双链阻断 NER 无法处理 → 需 Fanconi 贫血通路 → 修复失败 → p53 激活 → 凋亡
  • 肿瘤选择性窗口:肿瘤细胞增殖快 → S 期占比高 → 加合物尚未被 NER 修复即遭遇复制叉 → 比正常细胞更易凋亡
  • 广泛用于肺癌、卵巢癌、睾丸癌等;睾丸癌治愈率高达 90% 以上
  • 重点提示:顺铂不是"让NER工作从而杀死细胞",而是"损伤量超过NER修复速度 → 复制叉碰撞 → 凋亡"
cisplatin DNA adduct
顺铂-DNA加合物与NER识别

Temozolomide:烷基化损伤激活BER,MGMT甲基化决定疗效

  • 中文药名:替莫唑胺;损伤谱:主要产生 N7-meG(~70%)N3-meA(~10%)O6-meG(~5%)
  • BER 的角色(非主要杀伤):N7-meG / N3-meA 由糖苷酶切除进入 BER → 修复完成 → 细胞存活;BER 本身不致死
  • O⁶-meG 才是关键致死病灶(虽仅占 5%):
    • MGMT 存在:直接逆转甲基化 → 损伤消除 → 耐药
    • MGMT 缺失(启动子甲基化):复制时 O6-meG 偏好与 T 配对(而非正常的 C)→ MMR 识别 G:T 错配,切除新合成链上的 T → 重新合成时模板仍是未修复的 O6-meG → 再次插入 T → MMR 再次切除 → 如此反复:无效循环(futile cycle,即 MMR 反复切除却无法真正修复,因问题根源在模板链上而非新链)→ 持续单链缺口累积 → DSB → p53 → 凋亡
  • MGMT(O6-甲基鸟嘌呤-DNA甲基转移酶):将 O6-meG 上的甲基直接转移到自身 Cys 残基,实现损伤逆转;每个 MGMT 分子只能工作一次("自杀酶"),修复后不可再生
  • MGMT 启动子甲基化 → MGMT 基因沉默 → 蛋白表达缺失 → 无效循环得以进行 → 疗效大幅提升(胶质母细胞瘤一线伴随诊断)
  • 重点:TMZ 的杀伤机制不是"BER修复失败",而是"O⁶-meG 触发 MMR 无效循环 → DSB → 凋亡";MGMT 是唯一能阻断这条路径的守门人
temozolomide MGMT mechanism
替莫唑胺作用与MGMT修复竞争

Olaparib / Niraparib:PARP抑制与合成致死策略

  • 中文药名:奥拉帕利 / 尼拉帕利
  • 作用环节:抑制PARP1/2介导的单链断裂BER修复
  • 合成致死(Synthetic Lethality):单独失活基因 A 基因 B,细胞均可存活;同时失活两者才致死
    • 为什么叫"synthetic(合成)"?A 缺陷单独存在时,不致死;B 缺陷单独存在时,也不致死——致死性在两者单独存在时根本不存在;只有把两者放在一起,才把这种致死性从无到有地"合成"出来。致死性本身是被创造出来的新性质,而非两个已有伤害的叠加
    • 类比:一张桌子缺任意一条腿还能靠其他腿撑住;缺了两条特定的腿才会倒——"倒"是被这个组合合成出来的,不属于任何单条腿的固有属性
  • 肿瘤细胞已先天损坏一条"备用修复路径"(如 BRCA1/2 突变,无法精确修复 DNA 双链断裂
  • PARP 抑制剂再封掉"主修路径"(PARP 负责修补 DNA 单链断裂,不修则在复制时升级为双链断裂)
  • → 肿瘤两条路径都断 → 选择性死亡;正常细胞备用路径完好 → 不受影响
  • 已批准用于BRCA突变的卵巢癌、乳腺癌、前列腺癌等
  • 重点提示:"两条冗余修复路径互补"→ 靶向其中一条以杀伤缺失另一条的肿瘤细胞
PARP inhibitor synthetic lethality
PARP抑制与BRCA缺陷合成致死

ATR / WEE1抑制剂:阻断DNA损伤检查点,强迫肿瘤进入死亡

  • 中文药名:贝祖色替 Berzosertib(ATR抑制剂)/ AZD1775(WEE1抑制剂)
  • 信号轴:DNA损伤 / 复制压力 → ATR(感知 RPA-ssDNA)→ CHK1 磷酸化 → WEE1 激活 → CDK1-Y15 磷酸化抑制 → G2/M 阻滞(细胞暂停等待修复)
  • 正常细胞有双重保障:
    • G1/S 检查点(p53 依赖)—— 第一道防线
    • G2/M 检查点(ATR-WEE1 依赖)—— 第二道防线
  • p53 突变肿瘤的致命弱点:G1 检查点已失效 → 完全依赖 G2/M 检查点存活;抑制 ATR 或 WEE1 → CDK1 持续活跃 → 细胞强制带着未修复 DNA 进入有丝分裂 → 有丝分裂灾难(mitotic catastrophe)→ 死亡
  • 为什么要联用 DNA 损伤剂?单独抑制 ATR/WEE1 时细胞内损伤量不足——仅靠正常复制压力难以触发足够强的致死信号;联用铂类、放疗等 → 先制造大量损伤 → ATR/WEE1 抑制剂再封锁唯一出路 → 协同杀伤
  • 重点:这是一种利用肿瘤"检查点成瘾性"的策略——p53 缺失使肿瘤比正常细胞更依赖 ATR/WEE1 存活,形成治疗选择性窗口
ATR checkpoint inhibitor
ATR/WEE1抑制旁路DNA损伤检查点

Bleomycin(博来霉素):直接产生 DSB,迫使细胞启动 HR / NHEJ 应答

  • 作用机制:博来霉素–Fe²⁺ 复合物在 O₂ 存在下产生 羟自由基(·OH),攻击脱氧核糖 C4'位氢原子 → 糖环断裂 → DNA 链切割;约 70% SSB + 30% DSB,且常在同一区域产生簇状损伤(clustered lesions)
  • 特殊末端结构:断裂后产生 3'-磷酸乙醇酸(3'-phosphoglycolate)而非正常 3'-OH → 普通连接酶无法直接缝合 → 需 PNKP 或 Tdp1 等末端加工酶预处理后,才能进入 NHEJ / HR 主流程
  • 为何能杀死肿瘤细胞?(与顺铂类似的悖论)
    • DSB 是细胞最致死的损伤形式,而博来霉素产生的是大量簇状 DSB,难以被单次修复循环清除
    • 超量损伤 → ATM 持续激活 → CHK2 → p53 → 细胞凋亡;修复能力不足以跟上损伤积累速率
  • 修复通路选择:
    • G1 期:无姐妹染色单体 → NHEJ 主导 → 错误连接风险高
    • S/G2 期:HR 可发生 → 较精确;但快速增殖肿瘤细胞 HR 效率高 → 部分耐药
  • 临床应用:ABVD方案(霍奇金淋巴瘤);BEP方案(睾丸生殖细胞肿瘤);累积剂量须 < 400 U 以避免肺纤维化
  • 实验工具价值:博来霉素可在任意时间点精确触发 DSB,是研究 γH2AX 焦点形成、检查点激活和修复动力学的经典工具
bleomycin DSB mechanism
博来霉素诱发DSB与修复激活

CRISPR-Cas9基因编辑(Casgevy):利用HDR精准修复致病基因突变

  • 技术类别:基于Cas9核酸酶的基因组编辑工具;Casgevy(2023年首个获批CRISPR疗法)
  • 作用环节:sgRNA引导Cas9切割靶位点 → 诱导DSB → 借助HDR或NHEJ修复实现精准编辑
  • Cas9 可在任意细胞周期时相切割,但修复通路由切割时所处的细胞周期决定:
    • G1 期(复制前):无姐妹染色单体 → NHEJ 主导 → 产生随机插缺(indel)→ 基因敲除,无法精准改写
    • S / G2 期(复制后):姐妹染色单体可用 → HDR 可发生 → 配合外源供体模板实现精准序列替换
  • Casgevy 的解决方案:体外将造血干细胞同步至 S/G2 期后进行编辑,同时提供 AAV 递送的外源供体模板 → HDR 效率大幅提升 → 精准靶向 BCL11A 增强子 → 重新激活胎儿血红蛋白(HbF)
  • 碱基编辑 / 先导编辑(Base / Prime Editing):绕过 DSB,无需 HDR,不受细胞周期限制 → 未来非分裂细胞(如神经元)治疗的关键方向
  • 重点:HDR 依赖 S/G2 期;在 G1 期切割只能得到 NHEJ 产物(敲除)。精准基因治疗的挑战之一就是如何在正确的时相完成编辑
CRISPR Cas9 HDR repair
CRISPR-Cas9切割与HDR精准修复

腺病毒载体(Gendicine / ONYX-015):递送抑癌基因或选择性裂解p53缺陷细胞

  • 技术类别:重组腺病毒(非整合型)作为基因递送载体或溶瘤病毒
  • Gendicine(重组人p53腺病毒):2003年中国首批上市基因治疗药;腺病毒携带野生型p53基因,在头颈部肿瘤中恢复DDR通路功能
  • ONYX-015(dl1520):缺失E1B-55kDa的溶瘤腺病毒,选择性在p53突变/缺失肿瘤细胞中复制并裂解细胞
  • p53是DNA损伤检查点的核心调节因子,腺病毒E1B-55K正常负责阻断p53功能
  • 腺病毒载体容量大(≤36kb),可递送CRISPR成分或修复基因,但免疫原性相对较高
  • 重点提示:腺病毒利用宿主DDR基因作为治疗靶点,是机制认知直接指导病毒改造的典型范例
adenovirus p53 ONYX-015
腺病毒递送p53基因与溶瘤策略

小节总结 — DNA修复相关药物开发案例

1. 诱导损伤策略:顺铂/卡铂通过铂-DNA加合物过载NER通路;博来霉素直接产生DSB激活HR/NHEJ——均以"损伤积累超过修复阈值"为杀伤原理。

2. 修复靶向策略:替莫唑胺联合MGMT甲基化状态评估,首创分子分型指导治疗;奥拉帕利/尼拉帕利通过PARP抑制与BRCA缺陷形成合成致死,实现修复通路互补性的精准利用。

3. 检查点旁路策略:ATR/WEE1抑制剂(贝祖色替/AZD1775)利用p53缺陷肿瘤对S/G2检查点的绝对依赖,强制带损DNA细胞进入有丝分裂而死亡;与DNA损伤剂联用协同增效。

4. 基因组编辑与基因治疗:CRISPR-Cas9(Casgevy)借助内源HDR精准修正镰状细胞病致病突变;腺病毒载体Gendicine递送野生型p53恢复DDR功能,ONYX-015利用p53缺失选择性裂解肿瘤细胞。

5. 共同主线:七种药物均以DNA损伤应答(DDR)通路为核心靶点——从经典铂类化疗到PARP抑制剂合成致死再到CRISPR基因编辑,体现了DDR机制认知驱动药物创新的完整逻辑。

本讲总结

1. DNA修复:细胞通过BER、NER、直接逆转、跨损伤合成与DSB修复共同维持基因组稳定,检查点系统确保修复与细胞周期协调。


2. 同源重组:同源重组以碱基配对和链入侵为核心,既能精确修复双链断裂,也在减数分裂中产生遗传多样性。


3. 转座与位点特异性重组:可移动遗传元件深刻塑造基因组演化,保守性位点特异性重组机制也被发展为Cre/LoxP等关键遗传学工具。

Lecture 3

RNA 转录

RNA Transcription

Molecular Biology of the Cell
CHAPTER 6 How Cells Read the Genome: From DNA to Protein

从"图书馆"到"工厂":信息流的下一步

  • Lecture 1:DNA 复制 → 保证遗传信息代代精准相传
  • Lecture 2:DNA 修复 + 重组 → 保证基因组不变质、可演化
  • 但是 —— DNA 只是"图书馆的藏书":不打开来读,对细胞毫无用处
  • 转录(transcription)= 从基因组"图书馆"中复印出 RNA 工作册的第一步
    • 读取的是基因组的"指定段落",而不是全本
    • 什么时候读、读哪段、读多少 —— 决定了细胞此刻"在做什么"
  • 中心法则的第一个箭头:DNA → RNA
    • 真核细胞还多一步:转录本要经过一系列加工(RNA processing)—— 加帽 / 剪接 / polyA —— 才能出核翻译
    • 部分基因的最终产物本身就是 RNA(非编码 RNA,下页展开)
  • 同一份 DNA,不同细胞读出完全不同的"剧本" —— 神经元、肝细胞、免疫细胞用的是同一基因组的不同章节

本讲核心问题:细胞如何精确、可控、可调节地把 DNA 转换成 RNA?为什么真核细胞的转录如此复杂、还需要那么多加工步骤?

central dogma
中心法则的第一步:DNA → RNA

RNA 远不只是 mRNA

  • 人类基因组 ~80% 的序列会被转录 —— 但只有 ~1–2% 真正编码蛋白质
  • 其余 RNA 各司其职,构成细胞功能的隐形支柱
  • mRNA(信使)—— 编码蛋白质(< 2%)
  • rRNA(核糖体)—— 占细胞总 RNA 约 80%,构成核糖体大/小亚基
  • tRNA(转运)—— 翻译时把氨基酸送上核糖体
  • snRNA / snoRNA —— 剪接 + rRNA 化学修饰
  • miRNA / siRNA —— 调控基因表达(基因沉默)
  • lncRNA / circRNA —— 调控、骨架、海绵效应(许多功能仍在发现中)
  • "RNA 世界"假说:远古生命可能以 RNA 为信息载体 + 催化剂双重身份起源 —— 这一痕迹至今仍刻在剪接体、核糖体的活性中心里(Lecture 4 介绍)

教学要点:"基因表达"远不止"做蛋白质"—— 大量 RNA 本身就是终产物,是细胞调控网络的核心。理解转录机制 = 理解整个细胞功能的"开关系统"。

RNA diversity
RNA 是细胞中最多变的分子家族

转录已经改变了医学和生物技术

  • 抗生素经典靶点利福平(Rifampicin)抑制细菌 RNA 聚合酶 β 亚基 → 结核病一线药物,挽救上亿生命
  • 化疗药物放线菌素 D嵌入 DNA 阻断转录;用于肾母细胞瘤、横纹肌肉瘤等
  • 表观靶向治疗BET 抑制剂阻断超级增强子驱动的转录 → 治疗 MYC 驱动的恶性肿瘤
  • 炎症 / 免疫调节JAK 抑制剂(Ruxolitinib)阻断细胞因子 → STAT 转录响应 → 治疗骨髓增殖性疾病、湿疹
  • RNA 时代的精准疗法
    • mRNA 疫苗(BNT162b2 / mRNA-1273)—— 全球 COVID-19 流行中数十亿剂使用
    • 反义寡核苷酸 ASO(Nusinersen)—— 矫正 SMN2 剪接,治疗婴儿型脊髓性肌萎缩症
    • siRNA 药物(Patisiran)—— 沉默致病基因,治疗遗传性淀粉样变
  • 研究新范式RNA-seq、单细胞转录组、空间转录组 → 把"细胞表型"从形态学定义升级为分子表达谱定义

从这里出发:本讲的每一个机制(启动子识别、剪接、polyA、表观调控)都对应着至少一类已上市的药物或正在研发的疗法 —— 理解转录 = 理解 21 世纪药学创新的核心引擎

mRNA vaccine
mRNA 疫苗:转录生物学走入大众视野

本讲大纲点击条目可直接跳转

一、转录基础与调控

  • RNA分子是单链的
  • 转录产生与DNA互补的RNA
  • RNA聚合酶执行转录
  • 细胞产生不同类型的RNA
  • 启动子与终止信号
  • 转录起始/终止信号的多样性
  • 真核转录起始需要多种蛋白
  • Pol II 与通用转录因子
  • 激活子、Mediator 与染色质修饰
  • 转录产生超螺旋张力
  • 延伸与 RNA 加工的偶联

二、RNA加工与核内组织

  • 5'加帽是 pre-mRNA 第一种修饰
  • RNA 剪接:移除内含子
  • 剪接位点的核苷酸信号
  • 剪接体执行 RNA 剪接
  • 共转录剪接与外显子定义
  • 剪接错误与人类疾病
  • mRNA 3'端加工
  • 成熟 mRNA 的核输出
  • 非编码 RNA 的加工
  • 核仁与亚核聚集体

三、RNA转录相关
药物开发案例

  • Rifampicin(利福平)
  • Actinomycin D(放线菌素D)
  • JQ1 / OTX015(BET 溴域抑制剂)
  • Nusinersen(诺西那生钠)
  • AAV 基因疗法 / mRNA 药物
  • Patisiran / Inclisiran(siRNA)
  • ChAdOx1 / Gendicine(腺病毒载体)
Section I

转录基础与调控

Transcription Basics and Regulation

RNA分子是单链的

  • 将DNA部分核苷酸序列(基因)复制为RNA核苷酸序列的过程称为转录
  • RNA与DNA的化学差异:
    — 糖基为核糖(ribose),而非脱氧核糖
    — 含尿嘧啶 U代替胸腺嘧啶 T
  • 互补碱基配对规则:G-CA-U(偶尔G可与U配对)
  • DNA在细胞中始终以双链螺旋存在;RNA则为单链
  • RNA单链可折叠成特定三维形状(类似蛋白质折叠)
  • 某些RNA分子因此具有精确的结构功能催化功能
Figure 6-5.png
尿嘧啶 vs 胸腺嘧啶
Figure 6-6.png
U-A碱基配对
Figure 6-7.png
RNA三维折叠结构

转录产生与DNA一条链互补的RNA

  • 转录始于DNA双螺旋局部解旋,暴露碱基
  • DNA双链中一条链作为模板合成RNA
  • 碱基配对规则:A配U、T配A、G配C、C配G
  • RNA链逐个核苷酸延伸,方向为5'→3'
  • 与DNA复制不同:RNA链不保持与模板链的氢键结合
    — RNA在合成后立即从DNA模板上释放
    — DNA螺旋随即重新形成
  • RNA分子比DNA短得多:大多数RNA仅几千个核苷酸,DNA可达2.5亿碱基对
Figure 6-8.png
模板链、编码链与RNA转录本

RNA聚合酶执行转录

  • RNA聚合酶催化核苷酸间磷酸二酯键的形成
  • 沿DNA逐步移动,在活性位点前方解旋DNA暴露模板链
  • RNA链沿5'→3'方向延伸,底物为核糖核苷三磷酸(ATP、CTP、UTP、GTP)
  • 与DNA聚合酶的关键差异:
    — 使用核糖核苷酸而非脱氧核糖核苷酸
    无需引物即可起始RNA链
    — 保真度较低(约每104个核苷酸出1个错)
    完全的持续合成性(processive):同一酶分子从头合成到尾
  • 速度约50个核苷酸/秒,同一基因可同时有多个RNA聚合酶转录
  • 具有适度的校对机制:可后退并切除错误的核苷酸
Figure 6-9.png
转录泡结构
Figure 6-10.png
多个RNA聚合酶同时转录同一基因

细胞产生不同类型的RNA分子

  • mRNA(信使RNA):编码蛋白质的氨基酸序列
  • 非编码RNA:基因的最终产物即为RNA本身
    — 酵母中>1200个基因(>15%)产生非编码RNA
    — 人类约产生上万种非编码RNA
  • rRNA(核糖体RNA):构成核糖体核心
  • tRNA(转运RNA):选择并携带氨基酸到核糖体
  • snRNA(小核RNA):指导pre-mRNA剪接
  • miRNA / siRNA:基因表达的关键调控因子
  • 细胞RNA总量中,rRNA占绝大部分,mRNA仅占3-5%
  • 每个细胞中某种mRNA平均仅10-15个拷贝
细胞内 RNA 主要类型及其功能
RNA类型功能
mRNA编码蛋白质
rRNA核糖体结构与催化
tRNA氨基酸转运适配器
snRNAmRNA剪接
snoRNArRNA修饰
miRNA/siRNA基因表达调控
piRNA保护生殖系免受转座子
lncRNA多种(正在发现中)

DNA信号告诉RNA聚合酶何处起始和终止

  • 原核 RNA 聚合酶组成:核心酶(α₂ββ'ω)+ σ 因子 = 全酶(holoenzyme) —— σ 因子是启动子识别的关键
  • 转录循环对应图示四个阶段:
    • 启动子识别(initiation binding):全酶沿 DNA "扫描" → σ 因子识别 -35 / -10 启动子序列 → 形成"封闭复合物"(DNA 未解链)
    • 转录起始 / 转录泡形成:DNA 在启动子下游局部解链 12–14 bp → "开放复合物" → 开始合成 RNA;起始阶段(abortive initiation)常合成 2–9 nt 短转录本反复脱落
    • 启动子清除 + 延伸:合成约 10 nt 后聚合酶"挣脱"启动子 → 释放 σ 因子 → 核心酶进入延伸模式,沿 DNA 移动 ~50 nt/秒
    • 终止:终止子序列(A-T 富集 + 上游回文)→ 新合成 RNA 折叠成 发卡结构(hairpin) → 牵动 RNA 从活性位点脱离;也存在 Rho 依赖性终止(Rho 蛋白追上聚合酶并解离 RNA)
  • 四步循环完成后 → 核心酶游离 + σ 因子回到全酶启动下一轮,转录起始是基因表达调控的核心节点
Figure 6-11.png
原核细胞转录循环:起始 → 延伸 → 终止

转录起始和终止信号在核苷酸序列上是多样的

  • 不同启动子序列差异显著——因为细胞需要对不同基因的表达水平进行精细调控
  • 共有序列(consensus sequence):统计多个启动子序列,取每个位置上出现频率最高的核苷酸,揭示保守骨架
  • E. coli 两个核心识别元件(由 σ70 因子识别):
    • -10 元件(Pribnow box):共有序列 TATAAT,AT 富集→易解链形成转录泡
    • -35 元件:共有序列 TTGACA,σ 因子与其结合介导初始识别
    • 两者间距约 17 bp(可变 15–18 bp);间距偏差 → 聚合酶结合不良 → 弱启动子
  • 启动子强度由序列与共有序列的吻合程度决定:越接近共有序列 → 启动子越强 → 对应高丰度蛋白
  • 不同 σ 因子识别不同共有序列(热休克 σ32、鞭毛 σ28 等)→ 允许细菌在压力下快速切换基因表达程序
  • 终止子序列更多样,共同机制是合成的 RNA 形成发卡结构导致聚合酶脱落
Figure 6-12.png
-35序列和-10序列;序列标志(sequence logo)
Figure 6-13.png
不同基因的转录方向

真核生物的转录起始需要许多蛋白质

  • 真核细胞核含三种RNA聚合酶
    RNA Pol I:转录rRNA基因(5.8S, 18S, 28S)
    RNA Pol II:转录所有蛋白编码基因及多种非编码RNA
    RNA Pol III:转录tRNA、5S rRNA等小RNA基因
  • 与原核细胞仅需σ因子不同,真核RNA Pol II需要通用转录因子(general transcription factors)
  • 真核转录还需在核小体和更高级染色质结构上进行
真核三类 RNA 聚合酶及其转录靶基因
聚合酶转录基因类型
RNA Pol I5.8S, 18S, 28S rRNA
RNA Pol II蛋白编码基因 + 多种ncRNA
RNA Pol IIItRNA, 5S rRNA, 部分snRNA
Figure 6-14.png
原核与真核RNA聚合酶结构比较

RNA Pol II需要一套通用转录因子

  • 通用转录因子(General Transcription Factors,GTFs):TFIIA, TFIIB, TFIID, TFIIE, TFIIF, TFIIH
  • TFIID首先识别并结合TATA盒(TATA box)
    — TATA盒位于转录起始点上游约25 nt
    — TFIID的TBP(TATA-binding protein,TATA 结合蛋白)亚基负责识别TATA序列
    — TBP结合导致DNA大幅弯曲(~80°)
  • 其他核心启动子元件协同 TATA 共同定位 PIC(Pre-Initiation Complex,前起始复合体 = Pol II + 全套 GTFs 装配体):
    BRE(TFIIB Recognition Element):紧邻 TATA 上游(−37~−32),TFIIB 识别 → 锁定转录方向
    INR(Initiator,起始子):跨越 +1(−2~+4),由 TAF1/2(TBP-Associated Factors,TFIID 的 TBP 相关亚基)识别 → 精确定位起始点
    DPE(Downstream Promoter Element):起点下游 +28~+32,常见于TATA-less 启动子,与 INR 严格配对,由 TAF6/9(TFIID 异源二聚体亚基,类组蛋白折叠)识别
  • TFIIH是最复杂的通用转录因子(9个亚基):
    — 含DNA解旋酶活性,ATP水解解开DNA
    — 含蛋白激酶活性,磷酸化RNA Pol II的CTD尾巴(Ser5位)
  • CTD(C-terminal domain):人类RNA Pol II含52个七氨基酸串联重复
  • CTD磷酸化促使聚合酶离开启动子,进入延伸模式
  • 大多数通用转录因子随后释放,可参与下一轮转录起始
Figure 6-15.png
RNA Pol II 前起始复合体(PIC)
的逐步组装
Figure 6-16.png
TFIIE → TFIIH 完成起始复合物组装
Figure 6-17.png
TBP 弯曲 TATA 盒 DNA

RNA Pol II还需要激活子、Mediator和染色质修饰蛋白

  • 在体内(in vivo),转录起始除 GTFs 外还需要三类辅助系统:
  • 转录激活子(activators):
    — 序列特异性结合 DNA 增强子(enhancer,常位于基因数 kb 甚至 Mb 之外)
    — 通过 DNA 成环(looping)把远端调控信号带到启动子
    — 招募 Mediator、组蛋白修饰酶、染色质重塑复合物
  • Mediator 复合物(~25–30 个亚基):
    — 充当激活子 ↔ Pol II / GTFs 之间的"桥梁与翻译器"
    — 直接接触 Pol II CTD,影响 CTD 磷酸化与 PIC 稳定性
    — 把多种激活信号整合为统一的转录输出
  • 染色质重塑复合物(chromatin remodelers)—— ATP 依赖的"核小体推土机":
    — 利用 ATP 水解能滑动 / 弹出 / 重组核小体 → 暴露启动子 DNA
    — 主要家族:SWI/SNF(弹出核小体)、ISWI(精细滑动)、CHD(去除/置换)、INO80(H2A.Z 组蛋白变体置换)
    — 突变与癌症密切相关(如 SWI/SNF 在 20% 人类肿瘤中突变)
  • 组蛋白修饰酶(histone modifiers)—— 在组蛋白尾巴写"表观密码":
    HAT(Histone Acetyltransferase,乙酰转移酶):H3K9ac / H3K27ac → 中和正电荷,松开染色质 → 活化
    HDAC(Histone Deacetylase,去乙酰化酶):去除乙酰 → 染色质收紧 → 抑制
    HMT / HDM(甲基转移酶 / 去甲基酶):H3K4me3 = 启动子活化标记;H3K27me3 / H3K9me3 = 沉默标记
    — 修饰被「阅读器」蛋白(如 BRD4 的溴域读 H3K27ac)识别,进一步招募转录机器
  • 三者协同 → 染色质从"紧密无法接触"切换到"开放可转录"状态
  • 起始转录需组装超过 100 个亚基的蛋白质;组装顺序因基因而异,并非固定路径
  • 释放 RNA Pol II 开始转录时,常需激活子蛋白的原位蛋白水解("用完即拆")
Figure 6-18.png
真核 RNA Pol II 转录起始的
完整调控复合体(体内)

转录产生超螺旋张力 (Transcription Creates Superhelical Tension)

  • DNA双螺旋约每10个碱基对转一个螺旋圈
  • 如果DNA两端固定,每打开10 bp就会产生一个超螺旋(supercoil)
  • RNA聚合酶沿DNA移动时:
    — 前方产生正超螺旋张力(DNA更难打开)
    — 后方产生负超螺旋张力(促进核小体部分解包)
  • 真核生物中,DNA拓扑异构酶快速消除超螺旋张力
  • 细菌中专门的DNA旋转酶(gyrase)利用ATP泵入负超螺旋
    — 使DNA螺旋解开更有利(促进转录起始)
Figure 6-19.png
正超螺旋 vs 负超螺旋;拓扑异构酶的作用

真核转录延伸与RNA加工紧密偶联

  • 转录起始后,Pol II 离开启动子进入延伸(elongation)阶段,沿模板持续合成 RNA —— 此时真核细胞同步启动 mRNA 加工,"边转录边加工"
  • 真核mRNA需要经过多步共转录加工(co-transcriptional processing):
    5'端加帽(capping)
    RNA剪接(splicing,移除内含子)
    3'端切割和多聚腺苷酸化(polyadenylation)
  • CTD(C-terminal domain)磷酸化是偶联加工的关键策略:
    — Pol II 离开启动子前,CTD 在 Ser5 位被 TFIIH 磷酸化 → 启动加帽
    — 延伸过程中 CTD Ser2 位被 P-TEFb 磷酸化 → 招募剪接 + 3' 端加工因子
    — 不同磷酸化模式 = 不同加工酶"乘车上下"的分子条形码
  • 延伸模式的 RNA Pol II 可视为RNA 加工流水线工厂
    — 一边合成 RNA
    — 一边把加工酶"挂在 CTD 上"实时处理 RNA
    — 保证加工顺序正确、加工与转录速度匹配
  • CTD 完全伸展时长度约为 Pol II 其余部分的 10 倍,足以同时挂载多个加工因子
Figure 6-20A.png
RNA Pol II CTD 偶联转录与 mRNA 共转录加工
Figure 6-22.png
CTD 尾巴与 RNA 加工因子

小节总结 — 转录基础与调控

1. 转录基本机制:RNA聚合酶以DNA为模板合成RNA,形成转录泡;转录方向5'→3',模板链3'→5'方向读取;转录单位由启动子、转录区和终止子构成。

2. 转录起始信号:原核细胞σ因子识别-35/-10启动子元件,组装封闭复合物→开放复合物;真核TFIID识别TATA盒,通用转录因子逐步组装RNA Pol II前起始复合物。

3. 真核转录调控:激活子通过增强子远距离发挥作用;Mediator复合体传递信号至RNA Pol II;染色质修饰酶(HAT/HDAC)调控组蛋白乙酰化水平以开放或关闭染色质。

4. 转录延伸与偶联:RNA Pol II的CTD磷酸化将转录延伸与RNA加工(5'加帽、剪接、3'端加工)紧密偶联,确保mRNA成熟有序进行。

Section II

RNA加工与核内组织

RNA Processing and Nuclear Organization

RNA加帽是真核pre-mRNA的第一种修饰

  • RNA Pol II合成约25个核苷酸后,5'端即被修饰
  • 加帽由三种酶依次完成:
    — 磷酸酶:去除5'端一个磷酸
    — 鸟苷酰转移酶:添加GMP(反向5'→5'连接)
    — 甲基转移酶:在鸟苷上加甲基
  • 三种酶均结合在Ser5磷酸化的CTD尾巴上——定位精准
  • 5'甲基帽的功能:
    标识mRNA,区别于其他类型RNA
    — 结合CBC(cap-binding complex),促进后续加工和出核
    — 在翻译中发挥重要作用
  • RNA Pol I 和 III转录的RNA不加帽(无CTD)
Figure 6-21.png
7-甲基鸟苷帽
Figure 6-23.png
5' 帽反向三磷酸连接结构

RNA剪接从pre-mRNA中移除内含子

  • 真核基因的编码序列被内含子(intron)打断,编码区为外显子(exon)
  • 内含子和外显子均被转录为RNA,随后内含子通过RNA剪接被移除
  • 剪接通过两步转酯反应(transesterification)完成:
    — 移除内含子形成"套索"(lariat)结构
    — 连接两侧外显子
  • 剪接机器极其复杂:5种RNA + 数百种蛋白质 + 大量ATP
  • 内含子的进化优势:
    — 促进外显子重排(exon shuffling),加速蛋白质进化
    — 约95%的人类基因存在选择性剪接(alternative splicing)
    — 同一基因可产生不同蛋白质,扩展基因组编码潜力
Figure 6-24.png
外显子-内含子结构
Figure 6-25.png
套索(lariat)中间体
Figure 6-26.png
选择性剪接示例

核苷酸序列指示剪接位点

  • 剪接机器需识别pre-mRNA上的三个位点:
    5'剪接位点
    3'剪接位点
    内含子分支点(branch point,套索的基部)
  • 每个位点都有共有序列(consensus sequence),但变异较大
  • 内含子大小范围极广:约10 nt 到 >100,000 nt
  • 选择性剪接使得仅从基因组序列预测蛋白序列变得困难
  • 这是我们仍仅知道人类基因组编码蛋白质近似数目的主要原因之一
Figure 6-27.png
pre-mRNA 内含子三个剪接信号的共有序列
IUPAC 模糊代码: R = puRine(A/G) ·  Y = pYrimidine(C/U) ·  N = aNy(任意碱基)

剪接体执行RNA剪接 (The Spliceosome)

  • 五种 snRNA(small nuclear RNA,核内小 RNA)U1、U2、U4、U5、U6(均 < 200 nt)+ 蛋白质 = snRNP(核内小核糖核蛋白颗粒),构成剪接体核心
  • 剪接体的 5 个动态阶段
    E(Early/承诺):U1 识别 5'SS;SF1(=酵母 BBP,分支点占位)+ U2AF(U2 Auxiliary Factor)标记分支点 A 和 3'SS
    A(前剪接体):U2 取代 SF1,分支点 A "凸出"
    B(前催化):U4/U6·U5 三联 snRNP 加入 → 五个 snRNP 集合
    Bact(激活):RNA-RNA 重排 —— U1、U4 离开,U6 接管 5'SS、与 U2 配对形成催化中心(2× Mg²⁺)
    C(催化):两步转酯反应 → 释放套索内含子 + 拼接外显子;剪接体解体,snRNPs 回收
  • 识别主要靠 snRNA-pre-mRNA 碱基配对(U1↔5'SS、U2↔分支点、U5↔外显子边界)
  • 剪接体是动态机器:DExD/H box 解旋酶水解 ATP 驱动每次重排,"重排即校验"保证准确性;每次剪接需 ~200 种蛋白
  • 催化由 RNA 完成 → 剪接体本质是核酶(RNA 世界假说证据)
  • 剪接后在外显子接缝上游 ~20-24 nt 沉积 EJC(Exon Junction Complex)—— "剪接历史标签"参与 mRNA 核输出、翻译增强、NMD(详见 Lec 4)
Figure 6-28.png
剪接体的逐步装配(snRNP 招募顺序)
Figure 6-29.png
RNA-RNA 重排驱动剪接体激活

共转录剪接与外显子定义确保剪接准确性

  • 剪接与转录的偶联(co-transcriptional splicing):
    — 剪接组分(U1/U2 snRNP、U2AF、SR 蛋白等)装载在 Pol II CTD(C-terminal domain,磷酸化的 "尾巴",Ser2-P 模式)上 → 待新生 RNA 露出时直接"跳"到 RNA
    — 5'剪接位点的snRNP最初只"看到"下一个3'剪接位点
  • 外显子定义(exon definition)策略:
    核心问题:人类内含子平均 ~3000 nt(最大 1 Mb),外显子仅 ~150 nt —— 剪接机器无法直接跨越巨大内含子识别两端
    解决方案(Berget 1990s 假说):先"框定"每个外显子(跨外显子识别 3'SS 和 5'SS,跨度小、容易),再跨内含子拼接相邻外显子
    — 外显子大小相对均一(~150 nt)正是为了适配剪接机器跨度;蛋白大小靠外显子数量不同(3→ 数百个),不靠单个外显子变长
    SR 蛋白(Serine/Arginine-rich proteins,富含丝氨酸/精氨酸的剪接因子)结合外显子内 ESE(exonic splicing enhancer)→ 桥接两侧 U2AF / U1 → 标定外显子边界
    — SR 蛋白与 hnRNP(结合外显子沉默子 ESS,抑制剪接)竞争性结合,共同决定哪些外显子被选用 → 选择性剪接 + ~10% 致病突变破坏外显子定义导致 exon skipping
  • 染色质结构影响RNA剪接("动力学耦合"模型):
    — 核小体(~147 bp DNA)尺寸恰好匹配外显子(~150 nt),优先定位在外显子上充当"减速带"
    — Pol II 在外显子处暂停减速 → 给剪接机器更多时间识别弱剪接位点 → 倾向保留外显子;反之 Pol II 加速 → 外显子跳跃
    — 特定组蛋白修饰是"剪接邮编":H3K36me3(活跃转录外显子标记,由 SETD2 写入)被 MRG15 阅读 → 招募 PTB → 调控选择性剪接;H3K9me3 抑制剪接;DNA 甲基化和 CTCF 结合也参与定位
  • RNA剪接具有显著的可塑性——约10%致病突变导致异常剪接
Figure 6-31.png
人 / 线虫 / 果蝇基因组的内含子与外显子长度分布
Figure 6-32.png
外显子定义假说(exon definition hypothesis)

剪接错误与人类疾病:剪接体准确性的失误

  • 剪接体虽精密,但仍可能出错;约 10% 致病突变通过破坏剪接发挥作用
  • 两类典型剪接错误
    外显子跳跃(exon skipping):剪接位点被突变破坏 → 整个外显子被剪掉
    隐藏剪接位点激活(cryptic splice site activation):真正剪接位点失效后,剪接体被迫使用附近的"假"位点 —— 位于外显子内 → 外显子被部分截短;位于内含子内 → 部分内含子被错误保留
  • β-地中海贫血(β-thalassemia)经典案例:
    — β-球蛋白基因内含子点突变 → 激活内含子内隐藏剪接位点
    — 产生异常 mRNA → β-球蛋白合成减少或缺失 → 红细胞 Hb 不足 → 贫血
    — 部分突变通过提前终止密码子触发 NMD 进一步降解 mRNA
  • 其他典型剪接病:
    SMA(脊髓性肌萎缩,SMN2 外显子 7 跳跃,149 页 Nusinersen 靶点)
    DMD(杜氏肌营养不良,dystrophin 外显子跳跃,治疗策略为 ASO 强制跳跃突变外显子)
    — 多种 癌症(SF3B1、SRSF2、U2AF1 突变常见于 MDS / AML)
  • 教学意义:剪接位点 + ESE/ESS 是基因组中"突变热点"——任何破坏剪接信号的突变都可能致病;这也催生了 ASO 等剪接调控类药物(Lec 3 药物章节)
Figure 6-30.png
剪接错误的两种类型
Figure 6-33.png
β地中海贫血中 β-球蛋白
pre-mRNA 的异常剪接

RNA加工酶产生真核mRNA的3'端

  • RNA 上两个信号触发 3'端加工:上游 AAUAAA(poly-A 信号)+ 下游 GU/U 富集区
  • 关键蛋白(搭载在 Pol II CTD Ser2-P 上,RNA 露出即跳到 RNA):
    CPSF(Cleavage and Polyadenylation Specificity Factor)→ 识别 AAUAAA
    CstF(Cleavage Stimulation Factor)→ 识别 GU 富集区
    PAP(Poly-A Polymerase,多聚腺苷酸聚合酶)→ 加 A
  • 三步骤:① CPSF + CstF 识别 → 在 CA 处切割 RNA;② PAP 无模板添加 ~200 个 A;③ PABP 结合 polyA 并"测量"尾巴长度
  • PABP(Poly-A Binding Protein,多聚腺苷酸结合蛋白)家族 —— 两种亚型分工:
    PABPN1(核内型):在核内结合新生 polyA,每 ~10 个 A 装载一个 → 反馈抑制 PAP 控制尾巴长度 ~200 nt;伴随 mRNA 出核
    PABPC1(胞质型):在胞质取代 PABPN1,每 ~25 个 A 装载一个 → 约 8 分子 / 尾巴
    — 突变 PABPN1 → 眼咽肌营养不良(OPMD,polyA 中 GCG 异常扩展)
  • poly-A 尾巴三大功能(均依赖 PABP):
    稳定性:PABPC1 包裹 polyA → 阻止 3'→5' 外切酶(CCR4-NOT);polyA 随时间逐渐缩短 = mRNA "衰老计"
    翻译效率:PABPC1 ↔ eIF4G ↔ eIF4E ↔ 5'cap → 形成"闭环 mRNA" → 促进核糖体循环利用,~2-10× 翻译效率提升
    核输出:成熟 polyA + PABPN1 是核输出复合物(TREX)的识别标签
  • 3' 切割后下游 RNA 无 5' 帽保护 → CTD 携带的 Xrn2 5'→3' 外切核酸酶追击 Pol II → "鱼雷模型"撞落聚合酶 → 转录终止
Figure 6-35.png
真核 mRNA 3' 端切割与
多聚腺苷酸化

成熟真核mRNA选择性地从细胞核输出

  • pre-mRNA 中仅小部分(成熟 mRNA)对细胞有用;其余(切除内含子、断裂 RNA、异常加工 RNA)潜在有害,必须扣留并销毁
  • hnRNP(heterogeneous nuclear ribonucleoprotein,异质性核糖核蛋白,约 20-30 种)—— 核内 RNA 的"通用管家":
    包装 pre-mRNA:转录刚出来即被包裹成 RNP 颗粒(类似 DNA 缠绕组蛋白)
    调控剪接:结合 ESS/ISS 沉默子 → 与 SR 蛋白竞争决定外显子去留
    滞留未加工 RNA:阻止其接近核孔
  • 不合格 RNA 如何被扣留在核内(多层防御):
    通行证机制:只有齐备 5'cap + EJC + polyA 的 mRNA 才能招募 TREX 复合物 → NXF1 输出受体 → 通过 NPC(Nuclear Pore Complex,核孔复合物);缺标签自然出不去
    主动滞留:U1 snRNP 扣押未剪接 RNA;hnRNP 与核斑(speckle)滞留 retained-intron mRNA
    主动降解TRAMP 复合物给异常 RNA 加上短 oligo-A(~5 nt,与成熟 polyA 200 nt 完全不同)→ 喂给核外切体(nuclear exosome,3'→5' 外切核酸酶机器)彻底降解
  • NPC 是嵌在核膜上的巨型蛋白通道(~100 MDa,~30 种核孔蛋白 Nup 组成,8 重对称),通过中央 FG-repeat 凝胶过滤层实现选择性运输;mRNA 从核中扩散到核孔需几分钟,穿越核孔仅需数十毫秒
  • 核中结合的蛋白(CBC、EJC、PABPN1 等)出核后被替换为胞质对应物(eIF4E、PABPC1 等),最终影响 mRNA 在胞质中的稳定性、翻译效率、定位
Figure 6-36.png
核外切体降解废弃 RNA
Figure 6-37.png
核孔复合物选择性出核

非编码RNA也在细胞核中合成和加工

  • rRNA占细胞总RNA约80%(快速分裂细胞中)
  • rRNA基因以多拷贝串联重复排列(人类约200份,分布在5条染色体上)
  • 四种真核rRNA:18S、5.8S、28S(由RNA Pol I转录的前体加工而来)+ 5S(由RNA Pol III单独转录)
  • 13,000 nt的前体rRNA经广泛修饰后切割:
    — 约100个2'-O-甲基化
    — 约100个假尿苷化(uridine → pseudouridine)
  • 修饰由snoRNA(小核仁RNA)指导:
    — 通过碱基配对定位到前体rRNA的精确位点
    — 与蛋白质形成snoRNP复合物,携带修饰酶
  • 另一些snoRNA指导前体rRNA的切割加工
  • 许多snoRNA编码在核糖体蛋白基因的内含子
Figure 6-40.png
45S 前体 rRNA 加工
Figure 6-41.png
snoRNA 指导的化学修饰

核仁是核糖体生产工厂

  • 核仁(nucleolus):光学显微镜下最显著的核内结构;无膜包裹,是大分子的巨大聚集体(液-液相分离形成)
  • 核仁两大核心功能:rRNA 加工 + 核糖体亚基组装
  • 人类二倍体细胞中:rRNA 基因分布在 5 对染色体末端的 10 个簇中;间期 10 条染色体 DNA 环贡献到核仁;M 期核仁消失
  • 核仁大小反映细胞核糖体产量——可占核体积的 25%(高产细胞如肿瘤、增殖细胞核仁巨大)
  • 核糖体亚基组装流水线(核仁是工厂):
    — ① 核仁内 Pol I 转录 45S 前体 rRNA → 切割为 18S + 5.8S + 28S;5S rRNA 由 Pol III 在核质转录后送入
    — ② 约 80 种核糖体蛋白在胞质合成 → 经 NPC(importin 介导)输入核仁
    — ③ rRNA + 蛋白 + snoRNP 修饰因子在核仁内组装出 pre-40S 小亚基前体pre-60S 大亚基前体
    — ④ 两亚基分别经 NPC 出核(不组装在一起出核!)→ 胞质完成最终成熟
    — ⑤ 大小亚基只在翻译启动时结合形成 80S → 防止核内意外翻译未成熟 mRNA
  • 核仁也是其他 RNA-蛋白复合物的组装中心端粒酶(TERC RNA + TERT 蛋白组装)、U6 snRNP、signal recognition particle (SRP) 等
  • 除核仁外,细胞核内还存在多种无膜亚核聚集体(液-液相分离形成):
    Cajal 体(卡哈尔体):snRNP / snoRNP 最终成熟 + U4/U6 重装配
    Speckles(核斑):成熟剪接因子储备库
    — 共同构成核内"分区生化车间",提高加工效率
Figure 6-42.png
核仁电镜照片(三区结构)
Figure 6-45.png
核糖体组装过程

小节总结 — RNA加工与核内组织

1. 转录基础:RNA聚合酶利用DNA模板合成RNA,遵循碱基互补配对(A-U, G-C),沿5'→3'方向延伸,无需引物。


2. 原核细胞转录:单一RNA聚合酶 + σ因子识别启动子起始转录,RNA发卡结构作为终止信号。


3. 真核转录起始:三种RNA聚合酶(I, II, III);Pol II需通用转录因子(TFIID/TBP识别TATA盒)、激活子、Mediator、染色质重塑复合物。


4. RNA加工三步曲:5'加帽(磷酸酶+鸟苷酰转移酶+甲基转移酶)→ RNA剪接(剪接体/spliceosome移除内含子)→ 3'多聚腺苷酸化(poly-A尾)。


5. 剪接体:由5种snRNA(U1-U6)和~200种蛋白质组成,RNA催化实际化学反应;通过多次RNA-RNA重排确保准确性;~95%人类基因存在选择性剪接。


6. 非编码RNA与核结构:rRNA占细胞RNA~80%,在核仁加工组装;Cajal体和"speckles"等亚核结构提供高效的加工/组装环境。成熟mRNA经核孔选择性出核。

Section III

RNA转录相关药物开发案例

From Transcription Mechanism to Therapeutic Intervention

Rifampicin:靶向细菌RNA聚合酶β亚基,抗结核经典药

  • 中文药名:利福平
  • 作用环节:细菌RNA聚合酶(RNAP)β亚基结合口袋 → 阻断转录起始
  • 与细菌RNAP β亚基高亲和力结合,阻断RNA链从约3nt开始的延伸
  • 人类RNAP结构差异显著,利福平不能与真核RNAP结合 → 选择性极高
  • 抗结核一线药物;也用于脑膜炎球菌预防;耐药性来源于β亚基突变
  • 重点提示:细菌RNAP与真核RNAP的结构差异是抗菌药选择性设计的典型范例
rifampicin RNAP binding
利福平结合细菌RNAP β亚基

Actinomycin D:嵌入GC位点,阻断转录延伸

  • 中文药名:放线菌素D(更生霉素)
  • 作用环节:嵌入DNA双链GC富集区域 → 阻断RNA聚合酶沿模板移动
  • 放线菌素D的发色团嵌入碱基堆积,多肽链与DNA小沟共价结合
  • 对转录的抑制强于对复制的抑制(低浓度时有选择性)
  • 肾母细胞瘤、横纹肌肉瘤等少见儿科肿瘤的一线用药
  • 重点提示:说明"转录延伸的可干预性"及浓度依赖的细胞毒机制
actinomycin D intercalation
放线菌素D嵌入与转录阻断

BET溴域抑制剂(JQ1 / OTX015):靶向超级增强子,沉默癌基因转录

  • 中文药名:暂无上市中文名(JQ1为研究工具;OTX015/Birabresib进入临床)
  • 作用环节:BRD4溴域与乙酰化组蛋白H4K5ac/H4K8ac结合 → 转录暂停释放受阻
  • BRD4占据超级增强子,通过P-TEFb释放RNAPII进入高效延伸状态
  • 抑制BRD4 → MYC等原癌基因转录下调 → 多种血液和实体肿瘤增殖受抑
  • 处于临床I/II期;MYC高扩增NMC(中线癌)、急性白血病等响应显著
  • 重点提示:直接连接"组蛋白修饰-转录调控"知识与靶向治疗的新兴方向
BET bromodomain inhibitor
BRD4抑制与超级增强子失活

Nusinersen:反义寡核苷酸靶向pre-mRNA剪接,治疗脊髓性肌萎缩症

  • 中文药名:诺西那生钠
  • 药物类型:反义寡核苷酸(ASO, Antisense Oligonucleotide) —— 短单链化学修饰核酸,通过碱基配对调控靶 RNA
  • 作用环节:靶向SMN2 pre-mRNA上的外显子跳跃调控序列(ISS-N1)
  • SMA患者SMN1缺失,SMN2因第7外显子被跳过而产生无功能蛋白
  • ASO阻断ISS-N1抑制序列 → 第7外显子纳入 → 功能性SMN蛋白恢复
  • 首个FDA批准的SMA治疗药物(2016);鞘内注射,效果持久
  • 重点提示:直接将"转录后RNA剪接调控机制"与儿科罕见病精准治疗连接起来
ASO mechanism
ASO 反义寡核苷酸:结构与三种作用机制
nusinersen splicing correction
Nusinersen 纠正 SMN2 外显子跳跃

AAV基因疗法与mRNA药物:重新编写细胞转录输出

  • 技术类别:AAV基因递送(持久转录)/ LNP-mRNA(直接引入成熟转录本)
  • 作用环节(AAV):病毒载体转导 → 功能基因在细胞核内持续转录 → 补充缺失蛋白
  • 作用环节(mRNA):LNP递送体外转录mRNA → 绕过转录步骤,直接在胞质翻译
  • Glybera(AAV1-LPL)首个基因治疗药;Zolgensma(SMA);Luxturna(视网膜病变)
  • mRNA疫苗(COVID-19)、个性化肿瘤新抗原mRNA疫苗等正在快速发展
  • 重点提示:启动子设计、增强子选择、内含子剪接优化是AAV疗法中"转录工程"的核心
AAV gene therapy transcription
AAV载体基因转录恢复
mRNA vaccine structure and delivery
mRNA疫苗结构与递送

siRNA疗法(Patisiran / Inclisiran):RNAi沉默靶mRNA,转录后精准调控

  • 技术类别:化学合成双链siRNA经LNP或GalNAc递送 → RISC/Ago2切割靶mRNA → 阻断蛋白翻译
  • Patisiran(帕替司兰,2018年FDA批准):首个批准的siRNA药;LNP递送至肝细胞,沉默TTR mRNA,治疗遗传性甲状腺素转运蛋白淀粉样变(hATTR)
  • Inclisiran(英克司兰):GalNAc靶向肝细胞递送,沉默PCSK9 mRNA;每年2次皮下注射即可持续降低LDL胆固醇
  • siRNA选择性依赖种子序列碱基互补,设计不当可引发脱靶转录本降解
  • Givosiran(急性肝性卟啉症)、Lumasiran(原发性高草酸尿症)等也已获批
  • 重点提示:siRNA直接利用细胞内源性RISC/RNAi机制,是将转录后调控原理转化为药物的里程碑
Inclisiran PCSK9
Inclisiran 治疗高胆固醇血症(GalNAc 偶联靶向肝细胞 PCSK9 mRNA)
siRNA RISC mechanism
siRNA / RISC 通用机制(Ago2 切割靶 mRNA)

腺病毒载体(ChAdOx1 / Gendicine):驱动目的基因高效转录

  • 技术类别:重组腺病毒(dsDNA基因组,非整合)作为基因表达载体;在宿主细胞核内借助宿主RNA pol II高效转录目的基因
  • ChAdOx1(牛津/阿斯利康COVID-19疫苗):黑猩猩腺病毒5型载体,携带SARS-CoV-2刺突蛋白基因;人体免疫系统对其预存免疫低,有效性高
  • Gendicine(今又生,2003年中国批准):全球首个上市基因治疗药;重组腺病毒载入野生型p53 cDNA,注射至头颈部肿瘤,恢复p53转录调控功能
  • 腺病毒载体优势:包装容量大(~36 kb)、高滴度生产、高感染效率;劣势:不整合、免疫原性强、单次有效期有限
  • 腺病毒内置CMV/RSV启动子确保目的基因在宿主细胞中的高水平转录
  • 重点提示:腺病毒载体的核心设计是"可控转录工程":启动子选择、poly A信号、内含子插入均影响转录效率
adenovirus vector gene expression
腺病毒载体基因导入与核内转录

转座元件中的 RNA 生物学 —— 回顾

为什么在此回顾:讲完转录、剪接、mRNA 加工、ASO/siRNA/AAV 等"RNA 生物学"后,再回看 Lec 2 转座那一节,会发现转座元件其实是 RNA 机制的"原型实验室"——它们利用宿主的 Pol II/Pol III、剪接、polyA、逆转录与整合,把"RNA→DNA"这条反向箭头玩到极致。

① LTR 逆转座子(类逆转录病毒)

  • 结构:5′LTR — gag/pol — 3′LTR,LTR 内含 启动子 + polyA
  • 转录:Pol II 从 5′LTR 启动 → 加帽、加 polyA → 出核
  • 逆转录:RT 在胞质 RNA 模板上合成 dsDNA
  • 整合:整合酶在染色质上插入 → 形成 TSD
  • 例子:酵母 Ty1/Ty3、哺乳动物 ERV(内源逆转录病毒)

② 非 LTR 逆转座子(LINE / SINE)

  • LINE-1:自主,由 Pol II 转录;ORF2 编码自带 RT
  • SINE(如 Alu):非自主,由 Pol III 转录(tRNA/7SL 来源的内部启动子)
  • 逆转录在靶位点直接进行(TPRT 机制)→ 不需要先形成自由 dsDNA
  • 截短 + 加 polyA 是其转录本特征 → 整合后基因组里留下 A 尾
  • 人类 ~17% LINE-1 + ~11% Alu,是 RNA 介导扩增的主力

③ 逆转录病毒 vs 逆转座子

  • 共同点:RNA 中间体 + RT + 整合酶,违反 DNA→RNA 单向流
  • 区别:逆转录病毒额外编码 env 蛋白,能装配成传染颗粒离开细胞
  • HIV:基因组 RNA 既是 mRNA 也是病毒包装的"基因组"
  • 药物启示:AZT、Tenofovir(NRTI)= 核苷类似物阻断 RT;Raltegravir = 整合酶抑制剂

④ 与本讲(Lec 3)的对照

  • 转座 RNA 与 mRNA 共用同一套加工机器:加帽 / 剪接 / polyA
  • Pol II 启动子 ≈ LTR 启动子;Pol III 启动子 ≈ SINE 内部启动子
  • 逆转录 = "RNA→DNA",是 中心法则反向箭头,与 mRNA→蛋白质(翻译,Lec 4)形成对照
  • 药物开发延伸:LNP-mRNA / GalNAc-siRNA 借用的递送与稳定性原理,最初来自对 RNA 病毒和逆转座子的研究

核心要带走:转座 = "会动的 RNA 基因表达系统"。它教会我们:① 启动子可以内置在元件里;② RT 可让 RNA 反向"写回"基因组;③ 同样的加工/递送原理被自然界和现代核酸药物双重利用。回到 Lec 2 第 90 页可重新审视具体结构与机制图。

小节总结 — RNA转录相关药物开发案例

1. 靶向RNAP本体:利福平结合细菌RNAP β亚基,利用原核/真核结构差异实现选择性,是抗感染转录抑制的经典教学范本。

2. 表观与信号转录调控:BET溴域抑制剂靶向超级增强子;芦可替尼截断JAK-STAT信号驱动的转录激活,代表从染色质调控到信号通路的多层次干预策略。

3. RNA层面精准干预(ASO/siRNA):Nusinersen(ASO)纠正SMN2前体mRNA剪接;Patisiran/Inclisiran(siRNA)激活RISC降解靶mRNA,将转录后调控原理直接转化为临床疗法。

4. 生物技术载体驱动的基因转录治疗:腺病毒载体(ChAdOx1、Gendicine)和AAV载体均通过递送目的基因,借助宿主RNA pol II实现治疗性蛋白的持续转录表达,是转录生物学知识在基因疗法中的核心应用。

5. 技术模态对比:小分子(利福平、BET抑制剂)→ 靶向蛋白;ASO/siRNA → 靶向RNA;腺病毒/AAV → 补充基因;mRNA → 直接供给转录本,形成多层级转录干预体系。

本讲总结

1. 转录基础与调控:RNA聚合酶以 DNA 为模板进行 5'→3' 合成;启动子识别、转录泡形成、延伸与终止构成转录起始-延伸-终止三阶段,是基因表达最关键的门控步骤。


2. 真核转录的复杂调控:Pol II 联合通用转录因子(TFII 家族)、Mediator、染色质修饰与重塑复合体协同工作;CTD 磷酸化时序耦联延伸与 RNA 加工;转录还需化解超螺旋张力与核小体障碍。


3. RNA加工与核内组织:5'加帽 → 剪接(剪接体两步酯交换)→ 3'端切割加 polyA → 核输出 → 翻译,构成 pre-mRNA 成熟流水线;核仁、剪接体集中区、副斑等亚核聚集体实现"无膜分区"以提升加工效率。


4. 转录原理转化为药物:从靶向 RNAP(利福平、放线菌素D)到染色质阅读器(BET 抑制剂)到信号轴(JAK-STAT);从 RNA 层精准干预(ASO 改剪接、siRNA 沉默 mRNA)到病毒/脂质载体重编程细胞转录(AAV、腺病毒、LNP-mRNA),形成多层级转录干预体系。

Lecture 4

蛋白质翻译

Protein Translation

Molecular Biology of the Cell
CHAPTER 6 How Cells Read the Genome: From DNA to Protein

从"图纸"到"工人":中心法则的最后一步

  • Lecture 1:DNA 复制 → 信息代代相传
  • Lecture 2:DNA 修复 + 重组 → 信息不变质、可演化
  • Lecture 3:RNA 转录 → 信息从基因组复印出"工作册"
  • 但是 —— 到目前为止细胞还什么也没做。RNA 只是中间产物,真正干活的是蛋白质
  • 翻译(translation)= 把 mRNA 上的核苷酸序列"翻译"成蛋白质的氨基酸序列
    • 读取的是 mRNA 上的三联体密码(codon)
    • 核糖体 + tRNA + 氨基酸 + 起始/延伸/释放因子,构成翻译机器
    • 这是中心法则箭头的最后一步RNA → 蛋白质
  • 翻译是细胞内最耗能、最精密的合成过程之一 —— 一个核糖体每秒可加 ~20 个氨基酸,一个真核细胞同时有 ~10⁷ 个核糖体在工作

本讲核心问题:核糖体如何在三种不同 RNA(mRNA + tRNA + rRNA)的协同下,把核苷酸语言精确翻译成蛋白质语言?错译会带来什么后果?

central dogma
中心法则的最后一步:
RNA → 蛋白质

蛋白质:生命的"分子工人"

  • 蛋白质是细胞内数量最多、功能最广的大分子 —— 一个典型哺乳动物细胞含 ~10¹⁰ 个蛋白分子,约 2 万种不同蛋白
  • 蛋白质几乎承担细胞所有实际功能
    • :催化几乎全部生化反应(DNA 聚合酶、ATP 合酶、剪接体核心 ...)
    • 结构:细胞骨架(actin、tubulin)、胞外基质(胶原蛋白)
    • 运输 / 马达:血红蛋白、肌球蛋白、kinesin / dynein
    • 信号 / 调控:受体、激酶、转录因子、激素
    • 防御:抗体、补体、抗菌肽
  • 蛋白质大小跨度极大:~50 氨基酸(小肽)到 ~34,000 氨基酸(肌联蛋白 titin) —— 但都由同样 20 种标准氨基酸构成
  • 同一氨基酸序列 → 折叠成唯一三维结构 → 决定特异功能。序列即结构、结构即功能是分子生物学的核心信条
  • 因此翻译错误的代价是惨重的:错配氨基酸 → 错误折叠 → 失活 / 聚集 / 毒性蛋白 → 多种神经退行性疾病(AD、PD、ALS)

类比:如果 DNA 是"图书馆藏书",RNA 是"临时复印件",那么蛋白质就是按图施工的"工人" —— 而且这些工人本身又能去管理"图书馆"(转录因子)、复印"复印件"(剪接体核心)、甚至建造新的"工人工厂"(核糖体蛋白)。

点击放大 蛋白质的功能多样性 蛋白质 Protein ① 酶 Enzyme 催化生化反应 DNA pol、ATP 合酶 ② 结构 Structural 骨架 / 细胞外基质 actin、胶原蛋白 ③ 运输 / 马达 分子搬运 + 力学 血红蛋白、肌球蛋白 ④ 信号 / 调控 受体 / 激酶 / TF GPCR、p53 ⑤ 防御 Defense 抗体 / 补体 IgG、抗菌肽 核心信条 氨基酸序列 ~50 → 34,000 aa 三维结构 唯一折叠 特异功能 五大类活动 ⚠ 翻译错误 → 错折叠 → 失活/聚集 → 神经退行性疾病(AD / PD / ALS)
蛋白质功能多样性 + 序列→结构→功能

翻译为何如此精密复杂?

  • 翻译的"三大挑战"决定了机器的复杂度:
    • 语言转换:4 种核苷酸 ↔ 20 种氨基酸 —— 必须有"密码本"(遗传密码)+ "翻译员"(tRNA)
    • 精度:错误率必须 < 10⁻⁴ / 氨基酸(否则一个 500 aa 蛋白几乎必错)—— 需要多重校对机制
    • 速度:细胞分裂 / 应激时翻译需求陡增 —— 需要并行翻译(一条 mRNA 上多个核糖体形成 polysome 多核糖体)
  • 核糖体(ribosome) = 翻译的核心机器:
    • 大 + 小亚基组成;细菌 70S(30S+50S),真核 80S(40S+60S)
    • ~60% rRNA + ~40% 蛋白组成 —— 是细胞中最大的核酶
    • 催化中心是 rRNA(不是蛋白!)—— 与剪接体一样,RNA 才是真正的催化剂
  • "RNA 世界"假说的终极证据:核糖体 + 剪接体核心都是 RNA 催化的机器
    • 最古老的功能(合成蛋白、剪接 RNA)依然由 RNA 完成 → 远古生命可能以 RNA 既存储信息又催化反应
    • 蛋白质后来才"接管"大部分酶活,但最核心的几个反应依然刻在 RNA 上 —— 是分子化石

本讲学习目标:不仅要理解"如何翻译"的机制,更要看到核糖体这个"古老分子机器"如何成为抗生素、化疗、罕见病治疗的关键靶点 —— 翻译机制是连接基础研究与药物开发的重要纽带。

ribosome structure
核糖体结构与核酶催化中心
Nobel 2009 ribosome
Ramakrishnan · Steitz · Yonath(2009诺贝尔化学奖)

本讲大纲点击条目可直接跳转

一、从RNA到蛋白质

  • mRNA 三联体密码子解码
  • tRNA 与密码子匹配(摆动配对)
  • tRNA 共价修饰
  • 氨酰-tRNA 合成酶(两级接头)
  • 合成酶编辑确保准确性
  • 氨基酸添加到 C 末端(头部生长)
  • RNA 信息在核糖体中解码
  • 延伸因子驱动翻译 + 校对
  • 克服碱基配对的固有局限
  • 核糖体是一种核酶
  • 主要 RNP 酶汇总(跨四讲)
  • 翻译起始(真核扫描)
  • 翻译起始(原核 SD + IRES)
  • 终止密码子与释放因子
  • 多核糖体(polysome)
  • 遗传密码变异 + 硒代半胱氨酸
  • 原核蛋白合成抑制剂 = 抗生素
  • mRNA 质控(NMD)
  • 共翻译折叠
  • 分子伴侣 hsp70 / hsp60
  • 疏水信号 = 质控关键
  • 蛋白酶体(区室化蛋白酶)
  • 可调控降解 + degron
  • 从 DNA 到蛋白质完整路径

二、RNA世界与生命起源

  • 单链 RNA 精细折叠结构
  • RNA 既储信息又能催化
  • 蛋白质合成的进化

三、翻译相关药物

  • Tetracycline / Tigecycline
  • Azithromycin / Erythromycin
  • Linezolid(抗 MRSA)
  • Bortezomib(蛋白酶体抑制)
  • PROTAC / ARV-471 ⭐ 新批
  • Rapamycin / Everolimus
  • mRNA 疫苗(BNT162b2)
  • AAV 基因疗法(Zolgensma)
  • siRNA(Patisiran)
  • siRNA(RNAi 沉默肿瘤)
  • ASO 外显子跳跃(DMD)
  • 腺病毒与 AAV 比较
Section I

从RNA到蛋白质

FROM RNA TO PROTEIN

mRNA序列以三联体密码子方式解码

  • RNA到蛋白质的转变是信息从一种语言翻译成另一种语言:4种核苷酸 → 20种氨基酸
  • 核苷酸序列以连续的三联体(triplet)为单位读取,每组三个核苷酸称为一个密码子(codon)
  • 4 × 4 × 4 = 64种可能的密码子组合,编码20种氨基酸 → 遗传密码具有简并性(redundancy)
  • 每个密码子指定一种氨基酸,或一个终止信号
  • 遗传密码在所有生物中几乎通用(少数例外见于线粒体)
  • 阅读框(reading frame):mRNA 是连续的核苷酸序列,从哪个位点开始"三个三个一组"读取,会产生三种完全不同的密码子组合
    • 例:序列 UUC-GAC-AUG-... 偏移 1 位变为 UCG-ACA-UGN-...,氨基酸完全不同
    • 三种阅读框中通常只有一种能一直读下去而不撞到终止信号、且编码有功能的蛋白 —— 称为开放阅读框(ORF, open reading frame)
  • 正确阅读框由起始密码子 AUG 的位置定义:核糖体从 5'端扫描到第一个合适的 AUG 处启动翻译,此后严格按每 3 nt 一步前进,不能跳格
    • 如果突变插入或删除 1-2 个 nt → 阅读框移位 (frameshift mutation)→ 下游氨基酸全部改变,蛋白严重截短或失功能
    • 例:杜氏肌营养不良(DMD)中的 frameshift 突变就比 in-frame 缺失严重得多
Codons aminoacids table Figure 6-48.png
遗传密码表(The Genetic Code)

tRNA分子将氨基酸与mRNA密码子匹配

  • 转运RNA(tRNA)是遗传密码翻译的关键接头分子(adaptor)
  • tRNA折叠呈三叶草形(cloverleaf)→ 进一步折叠为L形三维结构
  • L形两端分别承载关键功能:
    • 反密码子(anticodon):与mRNA密码子互补配对(位于L形一端)
    • 3'末端:连接对应的氨基酸(位于L形另一端)
  • 密码子简并性意味着:某些氨基酸有多种 tRNA,或某些 tRNA 可识别多个密码子 —— 由"摆动假说"(wobble hypothesis,Crick 1966)解释:
    • tRNA 反密码子第 1 位(与 mRNA 密码子第 3 位配对)允许非标准碱基配对,故称"摆动位"
    • 反密码子第 1 位若为 I(次黄嘌呤 inosine)→ 可同时配 U / C / A;若为 G → 可配 U / C;若为 U → 可配 A / G
    • 解释了为何许多同义密码子仅在第三位核苷酸不同(如 GCU / GCC / GCA / GCG 都编码 Ala)
  • 结果:细胞只需远少于 61 种的 tRNA 就能翻译所有有义密码子 —— 原核约 31 种、人类约 48 种 tRNA
  • 进化意义:① 缓冲突变(第 3 位变化常为同义突变,不改变蛋白质);② 简化翻译装备(少基因、少装配)
Figure 6-50.png
tRNA 分子结构
wobble pairing
tRNA 反密码子摆动配对

tRNA在离开细胞核前被共价修饰

  • 真核tRNA由RNA聚合酶III合成
  • 原核细胞和真核tRNA通常以较大前体形式合成,随后被修剪成熟
  • 某些tRNA前体含有内含子,需要剪接去除
  • tRNA 剪接与 pre-mRNA 剪接机制完全不同
    • 不产生套索中间体:pre-mRNA 剪接用分支点 A 的 2'-OH 作亲核试剂形成套索;tRNA 剪接直接用蛋白酶切割两个剪接点,无中间态
    • 两步反应"剪切 + 粘贴":① tRNA splicing endonuclease(TSEN 复合物)在内含子两端精确切割,释放线性内含子;② tRNA ligase 把两个外显子末端粘接(消耗 ATP,与 DNA 连接酶机制类似)
    • 由蛋白质催化(不是 RNA):完全是蛋白酶系统 —— 与 pre-mRNA 剪接(核酶)、自我剪接(RNA 自身)形成鲜明对比,说明剪接机制在进化上是多次独立起源
    • 识别方式不同:TSEN 通过识别 tRNA 的三叶草二级结构(而非剪接位点序列)来定位切割位点 → 折叠错误的 tRNA 不会被切,自带质量控制
    • 真核 tRNA 内含子通常 14–60 nt,紧邻反密码子环,远小于 mRNA 内含子(~3000 nt)
  • 前体tRNA必须正确折叠为三叶草构型才能被加工 → 充当质量控制步骤
  • 成熟tRNA中约10%核苷酸是标准核苷酸的化学修饰版本
  • 已知超过50种不同的tRNA修饰类型(如肌苷、二氢尿苷、假尿苷等)
  • 某些修饰影响反密码子构象和碱基配对,促进正确识别mRNA密码子
Figure 6-52.png
tRNA 剪接及修饰核苷酸
Figure 6-53.png
tRNA 前体剪接机制;
常见修饰核苷酸结构

特异性酶将氨基酸偶联到对应的tRNA

  • 氨酰-tRNA合成酶(aminoacyl-tRNA synthetase)负责将正确氨基酸连接到对应tRNA
  • 大多数细胞有20种合成酶,每种对应一种氨基酸
  • 反应分两步进行,与ATP水解偶联:
    • 第一步:氨基酸与AMP形成腺苷化氨基酸(adenylated amino acid)
    • 第二步:氨基酸转移至tRNA的3'末端,形成高能酯键
  • 高能酯键的能量在后续蛋白质合成时用于形成肽键
  • 合成酶和tRNA共同构成两级接头系统:合成酶识别氨基酸和tRNA → tRNA识别mRNA密码子
  • 经典实验验证(Chapeville & Lipmann,1962) —— 证明"tRNA 才是真正的密码识别者,氨基酸装上去后是'盲目的'":
    • 第一步:用合成酶给 tRNACys 装上正确的半胱氨酸(Cys),得到正常 Cys-tRNACys
    • 第二步:用Raney 镍催化脱硫,把已挂在 tRNA 上的 Cys 的 –SH 基团去掉,化学性地变成丙氨酸(Ala) → 得到"杂交"分子 Ala-tRNACys(反密码子还认 Cys 密码子 UGU/UGC,但带的是 Ala)
    • 第三步:放进体外翻译系统 + 一条富含 Cys 密码子的 mRNA
    • 结果:本应插入 Cys 的位置上全部插入了 Ala —— 证明核糖体只识别 tRNA 反密码子,不复查"挂错"的氨基酸
    • 意义:实验验证了 Crick 的"接头假说"(adaptor hypothesis)—— 翻译保真度完全压在合成酶的"装配准确性"上
Figure 6-54.png
氨基酸活化反应(合成酶催化的两步法)
Figure 6-56.png
遗传密码通过两级接头翻译
(合成酶 + tRNA)

tRNA合成酶的编辑确保准确性

  • 氨酰-tRNA合成酶通过两步机制确保正确连接氨基酸
  • 第一步筛选(合成位点):正确氨基酸对活性位点亲和力最高,较大氨基酸被排斥
  • 第二步编辑(编辑位点):
    • 类似结构的氨基酸难以在第一步区分(如异亮氨酸与缬氨酸仅差一个甲基)
    • 编辑口袋精确排斥正确氨基酸,允许错误氨基酸进入并被水解移除
  • 该水解编辑类似于DNA聚合酶的外切核酸酶校对
  • 编辑将tRNA装载的总体准确率提高至约1/40,000的错误率
  • 合成酶还识别tRNA的多个特征:反密码子、受体茎序列等
Figure 6-57.png
水解编辑与tRNA识别
Figure 6-58.png
合成酶双位点校对机制;合成酶-tRNA识别界面

氨基酸被添加到多肽链的C末端

  • 蛋白质合成的基本反应:肽键形成
  • 新肽键连接多肽链末端的羧基与新氨基酸的氨基
  • 蛋白质从N端到C端逐步合成
  • 生长中的多肽链C末端始终通过共价键连接于tRNA(形成peptidyl-tRNA)
  • 每次添加新氨基酸:
    • 打断旧tRNA上的高能键
    • 在新添加的氨基酸上立即形成相同的键
  • 这是一种"头部生长"型聚合:每个添加的氨基酸携带下一个氨基酸加入所需的活化能
Figure 6-59.png
氨基酸掺入蛋白质的过程

RNA信息在核糖体中解码

  • 核糖体:由50多种蛋白质和数种rRNA组成的复杂催化机器
  • 分为大亚基小亚基
    • 小亚基:为tRNA与mRNA密码子配对提供框架
    • 大亚基:催化肽键形成
  • 翻译精度约1/10,000(每10,000个氨基酸错1个)
  • 核糖体有四个RNA结合位点:mRNA结合位、A位、P位、E位
  • 翻译延伸的四步循环
    • 步骤1:氨酰-tRNA结合A位
    • 步骤2:肽键形成(转肽反应
    • 步骤3:大亚基移位
    • 步骤4:小亚基移位(推进3个核苷酸)
  • 速率:真核~2aa/s,原核细胞~20aa/s
Figure 6-62.png
核糖体结构与 tRNA 结合腔(A、P、E 位)
Figure 6-64.png
翻译延伸的四步循环(结合 → 转肽 → 移位 → 推进)

延伸因子驱动翻译并提高准确性

  • 两种延伸因子(elongation factor)在每个翻译循环中进出核糖体、水解 GTP,分别负责"送 tRNA""推进核糖体"
    • EF-Tu(真核 = eEF1A):携带氨酰-tRNA 进入 A 位
    • EF-G(真核 = eEF2):肽键形成后驱动核糖体沿 mRNA 移位 3 nt
  • EF-Tu 的工作流程 —— 把 aa-tRNA "护送"到 A 位:
    • ① EF-Tu·GTP 同时结合 aa-tRNA → 形成"三元复合物",遮住氨基酸防止它过早反应
    • ② 三元复合物进入 A 位 → 反密码子先和密码子试配对("预筛选")
    • ③ 配对正确 → 触发 EF-Tu 水解 GTP → EF-Tu·GDP 解离 → tRNA 落入 A 位 → 肽键形成
  • 核糖体的双重校对机制(kinetic proofreading,约把错误率从 1/1000 降到 1/10⁴):
    • 第一重(GTP 水解):16S rRNA 像"分子卡尺"夹住密码子-反密码子配对 → 三个碱基对都正确才会形成紧密构象 → 触发 GTP 水解;错配则三元复合物原路退回
    • 第二重(GTP 水解):EF-Tu 解离 → tRNA 还需"摇晃"片刻才完全嵌入 A 位 → 这段时间窗口给错配 tRNA 提供了"重新逃跑"的机会(动力学校对的核心机理)
  • EF-G 的工作:肽键形成后,EF-G·GTP 进入 → 构象变化推核糖体前进 3 nt → 把 P 位 tRNA 挤到 E 位、A 位 tRNA 挤到 P 位 → GTP 水解,EF-G·GDP 离开 → 准备下一轮
  • 每加一个氨基酸总耗能4 个高能磷酸键:2 个 ATP(合成酶活化氨基酸)+ 2 个 GTP(EF-Tu 校对 + EF-G 移位)—— 远高于一个肽键的能量需求,"多余的能量都花在保证准确性和方向性上"
Figure 6-65.png
延伸因子与翻译校对
Figure 6-66.png
EF-Tu/EF-G 翻译延伸;
rRNA 对配对的校核

克服互补碱基配对的固有局限性

  • 仅靠氢键差异,正确与错误配对的亲和力仅差10~100倍
  • DNA复制、转录和翻译的实际准确率远高于此 → 需要额外机制
  • 诱导契合(Induced Fit):
    • 密码子-反密码子配对后,核糖体折叠包裹该配对
    • 仅正确匹配时折叠完成 → 允许反应继续
    • 相当于双重检查:先碱基配对,再通过蛋白/RNA构象变化验证
  • 动力学校对(Kinetic Proofreading):
    • GTP水解创造不可逆步骤,开启时间窗口
    • 错误配对的tRNA在此窗口内更易解离
    • 消耗能量换取更高特异性
  • 蛋白质合成是细胞中耗能最多的生物合成过程(每个肽键至少消耗4个高能磷酸键)
induced fit kinetic proofreading
诱导契合与动力学校对:翻译保真度的两道防线

核糖体是一种核酶

  • 核糖体由2/3 RNA1/3蛋白质组成
  • 2000年测定的三维结构证实:rRNA(而非蛋白质)负责:
    • 核糖体整体结构
    • tRNA在mRNA上的定位
    • 催化肽键形成
  • rRNA折叠为紧凑精确的三维结构,构成核糖体核心
  • 核糖体蛋白位于表面,填充RNA折叠的间隙,主要作用是稳定RNA核心
  • 转肽酶活性位点完全由RNA构成(最近的氨基酸在1.8nm之外)
  • 23S rRNA形成高度结构化口袋,通过氢键网络精确定位两个反应物
  • P位的tRNA贡献一个关键的-OH基团参与催化
  • 核糖体可能是RNA世界的遗迹——早期生命由核酶驱动
Figure 6-67.png
核糖体rRNA结构与蛋白质分布
Figure 6-68.png
rRNA 三维折叠构成核糖体核心;
蛋白质位于表面稳定结构

主要 RNP 酶汇总 —— RNA 世界的"分子化石"

核心观察:核糖体是核酶 —— 不是孤立现象。本系列贯穿四讲的多种"核心分子机器",并非纯蛋白酶,而是 RNA + 蛋白 形成的核糖核蛋白复合物(RNP)。其中部分由 RNA 真正催化("核酶",RNA 世界假说的活化石),部分则由 RNA 提供导向/模板而蛋白完成催化。

RNP 酶 RNA 组分 蛋白组分 催化反应 RNA 催化? 出现章节
核糖体
ribosome
28S/18S/5.8S/5S rRNA ~80 种核糖体蛋白 肽键形成(蛋白合成) Lec 4 翻译
剪接体
spliceosome
U1 / U2 / U4 / U5 / U6 snRNA ~200 种蛋白 pre-mRNA 剪接(移除内含子) Lec 3 RNA 加工
RNase P M1 RNA(细菌)/ MRP-RNA 1–10 种蛋白 切割 pre-tRNA 5' 端成熟 Lec 4 tRNA 加工
端粒酶
telomerase
TERC(hTR)RNA → 模板 TERT(逆转录酶)+ dyskerin 合成端粒 TTAGGG 重复 Lec 1 复制
SRP
信号识别颗粒
7SL RNA(骨架) 6 种 SRP 蛋白 识别新生肽信号序列 → 定位 ER 未展开 · 细胞生物学课程
RISC
(siRNA / miRNA)
siRNA / miRNA → 导向 Argonaute(Ago2 等) 切割或抑制靶 mRNA Lec 3 药物(Patisiran)
CRISPR-Cas crRNA / tracrRNA / sgRNA Cas9 / Cas12 / Cas13 切割 DNA 或 RNA Lec 2 药物(Casgevy)

A 类(真核酶 / ribozyme):核糖体 + 剪接体 + RNase P —— 全部承担细胞最古老 / 最基础的功能(合成蛋白、剪接 RNA、加工 tRNA),蛋白质后来加入只起骨架辅助作用。这正是 RNA 世界假说的核心证据。

B 类(RNA 导航 + 蛋白催化):端粒酶、SRP、RISC、CRISPR-Cas —— 较年轻的功能;RNA 提供序列特异性 / 模板,蛋白完成切割 / 聚合。这种"混合模式"被现代核酸药物大量借鉴(siRNA 治疗 = 借 RISC、CRISPR 编辑 = 借 Cas9)。

翻译起始(一):真核"扫描"模式

  • 起始位点选择至关重要:决定整条 mRNA 的阅读框;偏移 1 nt → 后续所有密码子被误读 → 产生无功能蛋白
  • 起始 tRNA 与众不同:专门的 tRNAiMet(起始甲硫氨酸 tRNA)直接进入 P 位(其他 tRNA 都从 A 位进入),帮核糖体辨认"这是起始"
  • 真核翻译起始流程("扫描"模式)
    • eIF4F 复合物(eIF4E + eIF4G + eIF4A)结合 mRNA 5' 帽;eIF4G 同时拉住 polyA 上的 PABP,形成闭环 mRNA
    • 43S 前起始复合物(40S 小亚基 + eIF2·GTP·Met-tRNAiMet + 其他 eIFs)经 eIF4G 招募到 5' 帽附近
    • ③ eIF4A 解旋酶活性松开 5'UTR 二级结构 → 小亚基沿 mRNA 扫描寻找第一个 AUG
    • Kozak 序列(见下)决定 AUG 识别效率
    • ⑤ AUG 识别 → eIF2 水解 GTP → 释放大部分 eIFs → 60S 大亚基加入 → 80S 启动复合物
  • Kozak 序列 —— 起始 AUG 周围的"上下文":
    • 共有:(gcc)gccRccAUGG大写 = 高度保守关键位,小写 = 偏好位,R = 嘌呤 A/G
    • 两个关键位:−3 位(R,嘌呤) + +4 位(G) = 强 Kozak,高效识别
    • 弱 Kozak → 可能被渗漏扫描(leaky scanning)跳过:40S 小亚基"路过"该 AUG 不识别,继续扫描到下游下一个强 AUG 才起始 → 可从同一 mRNA 产生不同 N 端的蛋白异构体
Figure 6-70.png
真核翻译起始
(eIF4F 帽识别 + 40S 扫描)

翻译起始(二):原核"对号入座"模式 + 病毒 IRES

  • 原核起始 tRNA:fMet-tRNAfMet(甲酰甲硫氨酸 tRNA)—— 与真核 tRNAiMet 类似但氨基末端带甲酰基(formyl),用于标识"起始"
  • 原核翻译起始流程("对号入座"模式)
    • ① 无 5' 帽 → 用 Shine–Dalgarno 序列SD,共有 AGGAGG,位于起始 AUG 上游 ~7 nt)
    • ② SD 与 16S rRNA 3' 端 anti-SDCCUCCU碱基互补 → 把 30S 小亚基直接定位到 AUG,无需扫描
    • ③ 起始因子 IF1, IF2, IF3 协助;IF2 把 fMet-tRNAfMet 装到 P 位
    • ④ 50S 大亚基加入 → 70S 复合物 → 翻译开始
    • ⑤ 优势:可在 mRNA 中部任意 SD 位点起始 → 一条 mRNA 上排列多个 ORF(每个 ORF 编码一个蛋白)
      • 顺反子(cistron)= 经典遗传学术语,指"一个基因 / 一个 ORF / 一段蛋白编码区"
      • 多顺反子 mRNA(polycistronic)= 一条 mRNA 上串联多个 cistron,每个前面有自己的 SD —— 细菌常见(例:lac 操纵子一条 mRNA 同时编码 LacZ/LacY/LacA),相关基因同时开关
      • 单顺反子 mRNA(monocistronic)= 一条 mRNA 只含一个 cistron / 一个蛋白 —— 真核几乎全部如此,因为扫描机制只能识别第一个 AUG
  • 教学延伸 —— 病毒劫持起始的策略
    • HCV、polio 等病毒含 IRES(Internal Ribosome Entry Site,内部核糖体进入位点)
    • 无需 5' 帽和扫描,IRES 直接招募核糖体 → 在宿主翻译被抑制时仍能合成病毒蛋白
    • 类似机制也存在于某些细胞 mRNA(应激条件下的"备用起始")
点击放大 原核翻译起始的三步装配 ① SD-antiSD 识别 + 30S 定位 mRNA SD AGGAGG AUG 30S 小亚基 16S rRNA anti-SD: CCUCCU + IF1, IF3 ② IF2·GTP 把 fMet-tRNA 装到 P 位 SD AUG 30S + IF1, IF2·GTP, IF3 fMet-tRNA 仅 P 位 ③ 50S 加入 + IF 释放 → 70S AUG 30S + 50S → 70S IF1/2/3 离开 GTP→GDP
原核翻译起始三步装配(概念图)
Figure 6-71.png
典型细菌 mRNA 结构
(编码 α/β/γ 多个蛋白)

终止密码子标记翻译终止

  • 三个终止密码子UAAUAGUGA
  • 终止密码子不被任何tRNA识别,不编码氨基酸
  • 释放因子(release factor)结合停在A位的终止密码子
  • 释放因子迫使转肽酶催化水分子(而非氨基酸)对peptidyl-tRNA的添加 → 水解释放多肽
  • 新生多肽通过大亚基中的水性隧道(~10nm × 1.5nm)穿过核糖体
  • 隧道壁由 23S rRNA 构成,化学特性类似厨具不粘锅的"特氟龙"(Teflon / PTFE)涂层 —— 小疏水面嵌入亲水面、交替排列,对任何特定氨基酸序列都不形成强结合 → 所有蛋白质都能均匀滑过,不会被某段序列"卡住"
  • 蛋白质在隧道中大部分处于未折叠状态,部分α螺旋可能在离开前形成
  • 完成翻译后核糖体大小亚基分离,准备开始新一轮翻译
Figure 6-72.png
翻译终止与释放因子

多核糖体上的蛋白质合成

  • 大多数蛋白质合成耗时20秒至数分钟
  • 多个核糖体可同时翻译同一mRNA → 形成多核糖体(polyribosome / polysome)
  • 相邻核糖体间隔约80个核苷酸
  • 多重起始使细胞在单位时间内产生更多蛋白质分子
  • 原核细胞特有的加速策略 —— "边转录边翻译"(coupled transcription-translation):
    • mRNA 无需加工(无加帽 / 剪接 / polyA / 核输出),转录出来即可被翻译
    • 核糖体可紧跟在 RNA 聚合酶后面,在 mRNA 还没合成完就开始翻译 → 转录与翻译同步进行,无核质分隔阻碍
    • 电镜下能看到"圣诞树"图像:一条 DNA 上 RNA pol 正在转录,新生 mRNA 上挂着多个核糖体
  • 真核细胞的"空间 + 时间分离" —— 翻译比原核慢得多:
    • 转录在核内完成 → mRNA 必须经过加帽 / 剪接 / 加 polyA / 核输出等多步加工(耗时数分钟到小时)
    • 成熟 mRNA 出核后才能在胞质被核糖体翻译 → 物理分隔使转录与翻译无法耦合
    • 补偿策略:成熟 mRNA 5' cap 与 3' polyA 通过 eIF4G ↔ PABPC1 形成"闭环" → 核糖体完成翻译后处于最佳位置立即重新起始,提高同一 mRNA 的翻译频率
Figure 6-73.png
多核糖体结构

标准遗传密码的微小变异

  • 遗传密码在三大生命域(Three Domains of Life:细菌 Bacteria + 古菌 Archaea + 真核 Eukarya,Carl Woese 1977 基于 rRNA 序列提出)中几乎通用 → 支持共同祖先 LUCA(Last Universal Common Ancestor)假说
  • 少数例外:
    • 白色念珠菌:CUG编码丝氨酸(而非亮氨酸)
    • 线粒体:密码有若干特殊变化
  • 翻译重编码(translation recoding):mRNA 上的额外序列信号(茎环结构、邻近序列等)让核糖体在特定位点临时改变密码子的标准含义
    • 表现形式:将终止密码子读通(read-through)插入氨基酸;将一个密码子读成另一个氨基酸;移码读取等
    • 不是突变,而是"上下文依赖的灵活解码" —— 同一 mRNA 在同一位置每次翻译都按规则做相同重编码
  • 硒代半胱氨酸(Selenocysteine, Sec, 第 21 种氨基酸)—— 翻译重编码的经典案例:
    • UGA 重编码:UGA 本是终止密码子,但当 mRNA 3'UTR 含 SECIS 元件(Selenocysteine Insertion Sequence,特殊的茎环结构)时,UGA 被识别为 Sec 而非终止
    • Sec 的合成路径:先用专用 tRNASec 装上丝氨酸(Ser)→ 丝氨酸的 –OH 被硒代 → 在 tRNA 上原位转化为 Sec("先装错再修正",独特机制)
    • 专用翻译因子EFSec(替代 EF-Tu)+ SBP2(识别 SECIS)—— 把 Sec-tRNASec 精确送到 UGA 处
    • 生理意义:Sec 含(Se,比 S 更易电离),出现在 ~25 种人类硒蛋白(如谷胱甘肽过氧化酶 GPX、甲状腺素脱碘酶 DIO)的活性中心,参与抗氧化、甲状腺激素代谢
    • 三大生命域(细菌、古菌、真核)都存在 Sec,是古老的进化保留
Figure 6-74.png
硒代半胱氨酸的掺入

原核蛋白质合成抑制剂可用作抗生素

  • 许多有效抗生素来源于真菌,专门抑制细菌蛋白质合成
  • 真菌与细菌在数百万年的共进化中产生了这些强效抑制剂
  • 利用细菌和真核核糖体的结构与功能差异实现选择性抑制
  • 常见抗生素及作用机制:
抗生素 作用靶点
四环素 阻止aminoacyl-tRNA结合A位
链霉素 阻止起始→延伸的转换,引起错读
氯霉素 阻断转肽酶反应
红霉素 结合出口通道,抑制肽链延伸
嘌呤霉素 模拟aminoacyl-tRNA → 引起提前终止
  • 氯霉素仅抑制线粒体核糖体(反映原核起源),放线菌酮仅作用于胞质核糖体
Figure 6-75.png
抗生素在核糖体上的结合位点
Table 6-4.png
各种抗生素在核糖体大小亚基上的结合位置

质量控制机制防止受损mRNA的翻译

  • 不正确加工或受损的mRNA若被翻译 → 产生截短或异常蛋白质 → 潜在危害
  • 细胞有多重备份措施:
    • 翻译起始时同时识别5'帽poly-A尾
  • 无义介导的mRNA降解(Nonsense-Mediated mRNA Decay, NMD):
    • 最强大的mRNA监控系统
    • mRNA从核孔输出时,核糖体进行"测试翻译"
    • 正常翻译时核糖体推移所有外显子连接复合物(EJC)
    • 正常终止密码子在最后一个外显子中 → 到达时所有EJC已被清除 → mRNA通过检查
    • 若提前遇到终止密码子且仍有EJC残留 → mRNA被快速降解
    • 关键蛋白(NMD 核心因子):
      • UPF1(ATPase / 解旋酶,NMD 总开关)+ UPF2 / UPF3 形成 NMD 复合物,桥接终止核糖体与 EJC
      • SMG1 激酶(PIKK 家族)磷酸化 UPF1 → 激活降解信号
      • SMG5/6/7:招募下游降解机器(SMG6 直接切 mRNA;SMG5/7 招募去 polyA + 脱帽 + Xrn1 外切酶 → mRNA 完全降解)
  • NMD在进化中的意义:允许细胞探索新基因而不受截短蛋白的伤害
  • 1/3人类遗传病由无义突变引起,NMD减轻了许多疾病的症状
Figure 6-76.png
无义介导的mRNA降解(NMD)

部分蛋白质在合成时即开始折叠

  • 新合成的多肽链必须完成多个步骤才能成为功能蛋白:
    • 折叠为正确的三维构象
    • 结合所需的小分子辅因子
    • 经历适当的共价修饰(磷酸化、糖基化、乙酰化等)
    • 与其他蛋白亚基正确组装
  • 折叠模式由氨基酸序列决定 → 自由能最低的构象
  • 共翻译折叠(Co-translational folding):
    • 某些蛋白质N端域从核糖体出来后数秒内即形成紧凑结构
    • 先形成熔球态(molten globule)→ 再缓慢调整至正确三级结构
  • 合成中等大小蛋白质约需数分钟,部分蛋白质在核糖体释放C末端前已基本折叠完成
Figure 6-77.png
蛋白质折叠与共翻译折叠
Figure 6-79.png
功能蛋白质形成步骤;
多肽出核糖体隧道后逐步折叠

分子伴侣帮助引导蛋白质折叠

  • 大多数蛋白质需要分子伴侣(molecular chaperone)协助正确折叠
  • 没有伴侣时,蛋白质可能陷入"动力学陷阱" → 错误折叠 → 不可逆聚集
  • 分子伴侣特异性识别暴露的疏水表面(正确折叠时应被埋藏)
  • 两大家族:
    • hsp70家族
      • 早期作用(蛋白质仍在核糖体上时)
      • 结合约4-5个疏水氨基酸的短肽段
      • ATP结合 → 释放蛋白 → 给予重新折叠的机会
    • hsp60家族(chaperonin):
      • 形成桶状"隔离室"
      • 在蛋白质完全合成后发挥作用
      • 蛋白被捕获 → 释入亲水内腔 → 加盖密封 → 隔离折叠
  • 不同细胞器有各自特有的hsp60/hsp70(线粒体、ER中的BIP等)
  • 每次折叠循环消耗ATP,用能量换取折叠的准确性
Figure 6-80.png
hsp70:早期"接力"结合-释放循环
Figure 6-81.png
hsp60(chaperonin):桶状隔离室折叠

暴露的疏水区域是蛋白质质控关键信号

  • 蛋白表面有较大疏水斑块通常意味着异常:
    • 折叠未完成
    • 部分展开的意外损伤
    • 未找到正常的配体亚基
  • 这类蛋白不仅无用,还可能有害(如形成毒性聚集体)
  • 能快速正确折叠的蛋白质不展示疏水模式 → 绕过伴侣系统
  • 无法正确折叠的蛋白质 → 伴侣多次尝试"修复"
    • 仍失败 → 启动蛋白酶体降解途径
  • hsp70最先作用 → hsp60后续介入 → 反复尝试 → 最终若失败 → 蛋白酶体
  • 遗传性疾病中,蛋白质聚集体可导致严重症状甚至死亡(如朊病毒病)
Figure 6-82.png
蛋白质折叠质量控制路径

蛋白酶体——区室化蛋白酶

  • 蛋白酶体(proteasome):蛋白质降解的核心机器
  • 结构组成:
    • 20S核心:中空圆柱体,由4个七聚体环堆叠形成
    • 蛋白酶活性位点朝向内腔 → 防止无差别降解
    • 19S帽:位于两端,含六亚基蛋白环,控制底物进入
  • 底物蛋白通过帽中的环被穿线进入核心 → ATP水解驱动 → 同时展开底物蛋白
  • 关键特性:进行性(processivity)——保持底物结合直至完全降解为短肽
  • 降解标记:多聚泛素链(K48连接)
    • 泛素(ubiquitin)通过E3连接酶共价标记靶蛋白
    • 19S帽识别多聚泛素标签 → 允许底物进入
  • 特异的E3连接酶识别变性/错折叠蛋白质的暴露疏水序列
  • 蛋白酶体广泛分布于细胞质和细胞核
Figure 6-83.png
蛋白酶体结构与蛋白降解
Figure 6-84.png
20S核心+19S帽结构;泛素标记→穿线→降解过程

许多蛋白质受可调控降解的控制

  • 蛋白酶体不仅降解异常蛋白,还调控正常蛋白的寿命
  • 某些蛋白质天然寿命短 → 细胞需快速改变其浓度
  • 调控机制 A —— 激活泛素连接酶(E3):底物始终存在,E3 平时"关闭",外界信号让 E3"打开"才启动降解
    • E3 磷酸化:激酶修饰 E3 的特定位点 → 构象改变 → 露出底物结合口袋
    • 小分子/蛋白结合引起变构:辅因子或配体结合 → 激活 E3 催化活性
    • 亚基添加激活:典型例子 APC/C(后期促进复合物)在有丝分裂中加入 Cdc20 亚基 → 激活 → 降解周期蛋白 cyclin B + securin → 触发姐妹染色单体分离和退出 M 期
  • 调控机制 B —— 在靶蛋白上创造/暴露降解信号(degron):E3 始终存在,底物上的"被识别标签"平时被掩藏,特定事件后暴露
    • 磷酸化暴露隐藏 degron:典型例子 IκB 被 IKK 激酶磷酸化 → 暴露磷酸化 degron → SCFβ-TrCP 识别 → 泛素化降解 → 释放 NF-κB 入核 → 启动炎症基因
    • 蛋白亚基解离暴露信号:原本被伴侣蛋白盖住的 degron,伴侣离开后暴露
    • 肽键切割产生"不稳定 N 端"N-end rule,N 端规则):蛋白被蛋白酶切割后,新生 N 端的氨基酸决定半衰期 —— Arg/Lys/Phe 等为"不稳定"残基,被 UBR1 类 E3 快速识别降解;Met/Val/Ala 等为"稳定"残基
  • 人类约80%蛋白质的N-末端被乙酰化,该修饰被特异E3识别
  • 正确折叠时乙酰化N-末端被埋藏 → 蛋白老化或损伤后暴露 → 触发降解
Figure 6-86.png
蛋白质调控降解的两种机制

从DNA到蛋白质有许多步骤

  • 基因表达的完整路径包含许多步骤,每一步都影响最终蛋白质水平:
    • 转录起始
    • 加帽、延伸
    • 剪接
    • 切割、加poly-A尾和终止
    • mRNA输出到细胞质
    • 翻译起始
    • 翻译完成与蛋白质折叠
    • mRNA降解
    • 蛋白质降解
  • 细胞中蛋白质的最终量取决于合成速率降解速率的平衡
  • 原则上每一步都可以被调控
  • 细胞投入大量资源降解蛋白质,特别是折叠不正确或老化受损的蛋白质
Figure 6-87.png
真核细胞蛋白质产生的完整路径

小节总结 — 从RNA到蛋白质

1. 遗传密码:mRNA 以三联体密码子编码 20 种氨基酸;64 个密码子(20 aa + 3 终止)→ 具有简并性;在三大生命域中几乎通用,支持 LUCA 共同祖先假说。


2. tRNA 与氨酰-tRNA 合成酶:tRNA 作为接头分子识别密码子(含摆动配对,~30-48 种 tRNA 覆盖 61 个有义密码子);合成酶通过"多位点身份元件 + 双层校对"将错误率压到 ~10⁻⁴。


3. 核糖体翻译:核糖体(核酶,rRNA 催化)四步循环合成蛋白(A 位结合→转肽→大亚基移位→小亚基移位);EF-Tu/eEF1A、EF-G/eEF2 + 动力学校对实现 99.99% 准确率;每加 1 个 aa 耗 4 个高能磷酸键。


4. 翻译起止:真核 eIF4F 帽识别 + 扫描 + Kozak;原核 Shine-Dalgarno + 30S 直接定位(→ 多顺反子 mRNA);病毒 IRES 旁路;终止由释放因子识别 UAA/UAG/UGA + 水解释放多肽。


5. 蛋白质折叠与质控:共翻译折叠 → hsp70(早期接力)+ hsp60(桶状隔离室)分子伴侣;表面大块疏水斑块 = 异常信号;错折叠蛋白经泛素化 → 26S 蛋白酶体降解;NMD(UPF1/2/3 + SMG)清除异常 mRNA。


6. 调控降解(degron):蛋白终量由合成 ↔ 降解平衡决定;E3 通过识别 degron(D-box、KEN-box、phosphodegron、N-end rule)决定降解时机;APC/C 驱动 cyclin 降解控制细胞周期;分子胶 / PROTAC 把 degron 概念转化为药物(ARV-471 等)。

Section II

RNA世界与生命起源

THE RNA WORLD AND THE ORIGINS OF LIFE

单链RNA可折叠为高度精细的结构

  • RNA世界假说:RNA是唯一既能携带遗传信息又能催化化学反应的分子
  • RNA通过互补碱基配对和氢键折叠为独特的三维结构
  • 保守的结构基序(motifs)反复出现:发夹环、凸出、假结、四茎连接等
  • 正确折叠的RNA可形成催化表面,就像蛋白质酶一样
  • 许多核酶利用金属离子协助催化,拓展其反应类型
  • 体外选择(in vitro selection / SELEX)实验:
    • 从大量随机RNA序列池中筛选具有特定催化活性的RNA
    • 已成功筛选出可催化多种反应的合成核酶
    • 催化速率仅比最快的蛋白质酶低几个数量级
  • 但蛋白质有20种氨基酸 vs RNA仅4种核苷酸 → 蛋白质催化策略更丰富
Figure 6-89.png
RNA结构基序与核酶
Figure 6-90.png
常见RNA结构元素;核酶催化RNA切割的机制

RNA既能储存信息也能催化化学反应

  • RNA独有的特性:可直接指导自身序列复制
  • 这依赖于互补碱基配对 → 一条RNA可作为模板合成互补链
  • 这正是现代细胞中DNA复制和转录的核心原理
  • 要实现高效的模板依赖RNA合成,需要催化剂促进聚合反应
  • RNA具备催化自身合成所需反应的全部特性 →
    提出假说:早期RNA曾充当模板依赖RNA合成的催化剂
  • 虽然自然界尚未发现自复制RNA系统,但实验室中已取得重要进展
  • 成功构建此类系统不能证明但可支持RNA世界假说的合理性
Figure 6-91.png
合成核酶的体外选择(SELEX 流程)
Figure 6-92.png
能催化自身合成的 RNA 分子(自复制核酶概念)

蛋白质合成是如何进化的?

  • 现代蛋白质合成极其复杂,依赖蛋白质-RNA互锁系统 → 蛋白质不可能先于翻译装置存在
  • 无密码的早期肽合成
    • 某些短肽(如抗生素)在现代细胞中不经核糖体合成
    • 肽合成酶直接组装特定序列,无需mRNA指导
    • 推测RNA世界中此类反应由核酶催化
  • 遗传密码的起源
    • 实验室创造的核酶可执行特异的氨酰化反应(匹配氨基酸和tRNA)
    • 类tRNA接头分子可能在RNA世界中演化出 → 遗传密码的雏形
  • 一旦有密码的蛋白质合成进化完成:
    • 蛋白质逐渐接管催化和结构任务(20种氨基酸 vs 4种核苷酸 → 更大多样性
  • RNA → DNA的转变:
    • 核糖 → 脱氧核糖(化学更稳定,可维持更长链)
    • 双螺旋和胸腺嘧啶进一步增强稳定性和修复能力
Figure 6-88.png
宇宙与生命起源时间线

小节总结 — RNA世界与生命起源

1. RNA 的双重能力:RNA 是唯一既能储存遗传信息又能催化化学反应的生物分子,支持 RNA 世界假说(早期生命可能以 RNA 一身二任)。


2. RNA 结构多样性:单链 RNA 可折叠为复杂三维结构,形成催化活性位点;许多核酶利用 Mg²⁺ / K⁺ 等金属离子扩展反应范围(剪接体 / RNase P / 核糖体均如此)。


3. 体外选择(SELEX)实验:从随机 RNA 池中通过迭代"筛选-扩增"循环可人工进化出多种催化活性的合成核酶 → 实验室证明 RNA 自复制可行性。


4. 蛋白质合成的演化:先有无密码的核酶催化短肽合成,后演化出类 tRNA 接头 → 遗传密码 → 现代核糖体;蛋白质逐渐"接管"大部分酶活,但最古老的催化(肽键形成、剪接、tRNA 加工)仍由 RNA 保留—— 见前页 RNP 酶汇总。


5. DNA 的出现:DNA 作为更稳定的遗传信息载体(脱氧核糖更耐水解、双螺旋易于修复、5-甲基胞嘧啶降低突变)最终取代 RNA 成为基因组物质,但 RNA 仍保留催化和调控角色 → 形成"DNA → RNA → 蛋白"的中心法则。

Section III

蛋白质翻译相关药物开发案例

From Ribosome Mechanism to Therapeutic Intervention

Tetracycline / Tigecycline:阻断氨酰-tRNA进入A位,广谱抑菌

  • 中文药名:四环素 / 替加环素
  • 作用环节:细菌30S小亚基A位 → 阻止氨酰-tRNA与mRNA密码子配对
  • 与30S亚基16S rRNA及蛋白S7结合,阻断aa-tRNA·EF-Tu·GTP三元复合物进入
  • 真核80S核糖体对四环素亲和力低,且缺乏主动摄入系统 → 选择性杀菌
  • 替加环素(第三代)能克服外排泵耐药,用于多重耐药(MDR)感染
  • 重点提示:A位tRNA选择是翻译保真度的关键步骤,也是多类抗菌药的核心靶点
tetracycline 30S binding
四环素阻断30S A位氨酰-tRNA结合

Azithromycin / Erythromycin:结合50S出口隧道,阻断肽链转位

  • 中文药名:阿奇霉素 / 红霉素
  • 作用环节:细菌50S大亚基肽链出口隧道(NPET)→ 阻断肽链延伸与转位
  • 与23S rRNA结合,物理阻塞正在延伸的新生肽链穿越隧道
  • 短肽可勉强合成,但较长肽链合成受阻,导致翻译过早终止
  • 呼吸道感染(肺炎、支原体)常用;阿奇霉素因半衰期长、组织浓度高而广泛应用
  • 重点提示:肽链出口隧道结构变化(23S rRNA甲基化)是大环内酯耐药的分子基础
macrolide 50S binding
大环内酯类阻断50S肽链出口隧道

Linezolid / Tedizolid:阻断70S起始复合物,最后防线抗MRSA

  • 中文药名:利奈唑胺 / 特地唑胺
  • 作用环节:细菌70S起始复合物组装 → 阻止30S·mRNA·fMet-tRNA三元预起始复合物与50S结合
  • 结合23S rRNA V区,阻断IF2/fMet-tRNA在P位的正确定位
  • 对MRSA、VRE等多重耐药革兰阳性菌有效,是医院获得性感染的重要选择
  • MAO抑制特性导致血清素综合征风险;骨髓毒性限制长疗程使用
  • 重点提示:翻译起始复合物形成是进化上保守但细菌特有细节多的靶点
linezolid 70S initiation block
利奈唑胺阻断70S起始复合物

Bortezomib / Carfilzomib:蛋白酶体抑制,破坏翻译后蛋白质稳态

  • 中文药名:硼替佐米 / 卡非佐米
  • 作用环节:26S蛋白酶体20S催化核心β5亚基 → 抑制泛素-蛋白酶体系统(UPS)
  • UPS是细胞清除错误折叠/多余蛋白质的主通路,维持翻译后蛋白质稳态
  • 多发性骨髓瘤细胞产生大量免疫球蛋白 → 对UPS依赖性极高 → 蛋白酶体抑制致死
  • 硼替佐米为多发性骨髓瘤一线;卡非佐米毒性更低
  • 重点提示:将翻译后蛋白质质量控制体系(UPS/热休克蛋白)纳入治疗靶点视野
bortezomib proteasome inhibition
硼替佐米抑制26S蛋白酶体

PROTAC / 分子胶:主动"安装" degron,诱导靶蛋白降解

  • 技术类别:PROTAC(PROteolysis TArgeting Chimera,蛋白降解靶向嵌合体)+ 分子胶(molecular glue)
  • 作用环节:不阻断蛋白功能,而是招募 E3 泛素连接酶给靶蛋白强制泛素化 → 蛋白酶体降解 —— 人工"安装" degron
  • 分子结构:warhead(结合靶蛋白)+ linker(连接子)+ E3 ligand(招募端,常用 CRBN / VHL
  • 三大优势:事件驱动(催化式,剂量低)/ 可降解 undruggable 靶点(转录因子等)/ 克服耐药突变
  • 代表药物:
    • Vepdegestrant(ARV-471,Arvinas/Pfizer):ER 降解剂,ER+/HER2− 转移性乳腺癌2026 年 5 月 1 日 FDA 批准 —— 全球首个获批的 PROTAC 药物
    • Bavdegalutamide(ARV-110):AR 降解剂 → 去势抵抗性前列腺癌
  • 分子胶前辈:来那度胺(Lenalidomide)—— 结合 CRBN E3 → 让 IKZF1/3 转录因子被降解 → 多发性骨髓瘤一线(沙利度胺类,1950s 致畸药 → 21 世纪明星药)
  • 教学意义:从"抑制功能"到"降解蛋白"—— 范式革命;直接把第 182 页 degron / E3 机制转化为治疗策略
PROTAC mechanism
PROTAC 工作机制概念图
ARV-471 Vepdegestrant
ARV-471(Vepdegestrant)结构与机制

Rapamycin / Everolimus:抑制mTORC1,下调帽依赖性翻译起始

  • 中文药名:雷帕霉素 / 依维莫司
  • 作用环节:mTORC1 → 4EBP1磷酸化失活 → eIF4E释放 → 帽依赖翻译起始
  • mTORC1抑制 → 4EBP1不被磷酸化 → eIF4E被封锁 → 含5'TOP/高度结构化mRNA的翻译减少
  • MYC、Cyclin D1等促癌蛋白的翻译依赖eIF4E,因此mTOR抑制对高PI3K/Akt活性肿瘤有效
  • 肾癌、乳腺癌、胰腺神经内分泌瘤等;也用于器官移植免疫抑制
  • 重点提示:把"营养感应-mTOR通路-翻译调控"链条连成完整的细胞信号-基因表达图景
mTOR translation regulation
mTORC1调控4EBP1与帽依赖翻译

mRNA疗法(BNT162b2 / mRNA-1273):将翻译机器转变为药物工厂

  • 技术类别:脂质纳米颗粒(LNP)递送体外转录mRNA → 人体细胞核糖体翻译靶蛋白
  • 作用环节:直接提供优化mRNA,利用宿主翻译机器(80S核糖体)合成目的蛋白
  • mRNA经修饰(N1-甲基假尿嘧啶)降低免疫原性、提高稳定性;5'帽+3'polyA增强翻译效率
  • 编码SARS-CoV-2刺突蛋白(或其他靶蛋白),诱导免疫应答
  • COVID-19疫苗(2020年);肿瘤新抗原疫苗、蛋白替代疗法正在临床试验
  • 重点提示:mRNA药物设计的核心正是翻译生物学——密码子优化、UTR调控、核糖体载荷
mRNA LNP translation
LNP-mRNA递送与细胞内翻译

AAV基因疗法(Zolgensma / Luxturna):递送功能基因恢复正常蛋白翻译

  • 技术类别:腺相关病毒(AAV)载体递送功能性基因拷贝至靶细胞
  • 作用环节:基因转导 → 细胞核内转录 → 功能性mRNA合成 → 80S核糖体翻译产生功能蛋白
  • Zolgensma(onasemnogene abeparvovec):AAV9递送SMN1,治疗SMA;单次注射,终身获益
  • Luxturna(voretigene neparvovec):AAV2递送RPE65基因,治疗遗传性视网膜营养不良
  • 靶向组织需选择合适的AAV血清型(AAV9→神经系统;AAV2→视网膜)
  • 重点提示:AAV疗法的成功依赖对目标蛋白功能缺失机制、翻译调控及细胞导入效率的深刻理解
AAV gene therapy
AAV载体递送功能基因与蛋白表达恢复

siRNA(Patisiran / Givosiran):RISC降解mRNA,从源头阻断翻译

  • 技术类别:外源siRNA导入细胞 → 与RISC结合 → Ago2切割靶mRNA → 翻译模板消除
  • Patisiran(帕替司兰,2018):LNP包裹siRNA靶向TTR mRNA;TTR蛋白合成受抑,淀粉样蛋白沉积减少,神经病变改善(hATTR)
  • Givosiran(吉沃司兰,2019):GalNAc-siRNA靶向ALAS1 mRNA(氨基乙酰丙酸合酶1);减少δ-ALA毒性代谢物积累,治疗急性肝性卟啉症
  • siRNA通过消灭翻译模板来阻断蛋白质合成,本质是"上游断源"而非直接干预核糖体
  • 效果持久(mRNA降解后需重新转录才能恢复),每月或每年给药一次即可维持
  • 重点提示:RISC介导的mRNA降解完美诠释了"翻译前调控"对蛋白质输出的决定性影响
siRNA blocks translation via RISC
siRNA/RISC降解mRNA阻断蛋白翻译

siRNA(小干扰RNA):RNAi沉默靶基因,精准阻断DNA修复或肿瘤增殖

  • 技术类别:化学合成21–23nt双链RNA,经LNP或GalNAc递送 → 激活RISC复合物 → 降解靶mRNA
  • DNA修复关联:siRNA沉默PARP1、BRCA2、RAD51等修复基因可作为体外"功能丧失"研究工具
  • 肿瘤治疗方向:siKRAS(靶向G12D突变胰腺癌)、siPLK1(靶向有丝分裂检查点激酶)已进入临床
  • Atu027(siPKN3,LNP递送):首个进入II期临床的siRNA肿瘤药;探索肿瘤血管标靶
  • 与PARP抑制剂或化疗联合,可构建"修复干扰+细胞毒"的复合方案
  • 重点提示:siRNA让研究者可以"按需敲低"任意修复基因,是解析修复通路层级关系的利器
siRNA RISC mechanism
siRNA激活RISC靶向mRNA降解

ASO外显子跳跃(Eteplirsen / Golodirsen):纠正读码框,恢复功能蛋白翻译

  • 技术类别:反义寡核苷酸(ASO)与pre-mRNA互补结合 → 遮蔽剪接调控序列 → 诱导特定外显子跳跃 → 恢复开放阅读框
  • Eteplirsen(依特普利森,2016):靶向DMD基因外显子51的剪接受体区;跳过外显子51恢复部分阅读框,产生截短但仍有功能的肌营养不良蛋白(Duchenne型→Becker型)
  • Golodirsen / Viltolarsen:分别靶向外显子53,针对不同突变亚型(约8%的DMD患者)
  • 翻译水平:由"截短框移突变→无蛋白"变为"截短但有功能蛋白",翻译输出质量改变
  • 该策略需根据患者具体突变位置个性化设计外显子跳跃方案(精准医学)
  • 重点提示:ASO外显子跳跃展示了如何通过调控前体mRNA剪接,最终影响翻译产物的结构与功能
ASO exon skipping DMD
ASO外显子跳跃恢复DMD读码框

腺病毒与AAV基因治疗:递送可翻译基因,恢复缺失蛋白表达

  • 腺病毒(Adenovirus)特点:大包装容量(~36 kb),高感染效率,不整合;在细胞质和核内均可表达,但表达为瞬时性(数周至数月)
  • AAV特点:小包装容量(~4.7 kb),低免疫原性,部分血清型可长期游离体表达;Zolgensma(SMA)、Luxturna(视网膜病变)已获批
  • 两者均利用宿主核糖体翻译导入的外源基因mRNA,从而补充细胞缺失的功能蛋白
  • 腺病毒适合短期高表达场景(疫苗、肿瘤治疗);AAV适合长期蛋白替代(遗传病)
  • 密码子优化、Kozak序列设计是提高翻译效率的关键工程要素
  • 重点提示:无论腺病毒还是AAV,最终的治疗效果都取决于宿主翻译机器的效率与调控能力
adenovirus vector gene expression
腺病毒与AAV载体比较

小节总结 — 蛋白质翻译相关药物开发案例

1. 核糖体靶向抗菌药:四环素(30S A 位)、大环内酯类(50S 出口隧道)、利奈唑胺(70S 起始)分别干预翻译三阶段,利用细菌 70S vs 真核 80S 结构差异实现选择性,是抗菌药物开发的经典教学主线。

2. 翻译后蛋白稳态调控:硼替佐米(蛋白酶体抑制)—— 阻断 UPS 让骨髓瘤细胞中毒蛋白堆积;PROTAC / 分子胶(ARV-471, 2026.5 全球首批 ⭐;Lenalidomide)—— 反向主动诱导降解,把第 22 页 degron 概念变成治疗策略;雷帕霉素抑制 mTORC1-4EBP1 轴调控帽依赖翻译。

3. 核酸药物调控翻译输出:siRNA(Patisiran / Givosiran)激活 RISC 降解 mRNA 断绝翻译原料;ASO 外显子跳跃(Eteplirsen)纠正读码框恢复截短功能蛋白;mRNA 疗法(BNT162b2 / mRNA-1273)直接提供可翻译模板(绕开转录)。

4. 基因递送恢复翻译:AAV(Zolgensma SMA、Luxturna 视网膜病)和腺病毒载体将功能基因导入,借宿主核糖体翻译产生长期 / 瞬时蛋白;密码子优化、Kozak 设计、polyA 长度是工程关键。

5. 技术模态全景(六层干预):小分子直接抑制(抗生素 / 蛋白酶体)→ ② 诱导降解(PROTAC / 分子胶)→ ③ mRNA 靶向(siRNA / ASO)→ ④ mRNA 替代(mRNA 疫苗 / saRNA)→ ⑤ 基因递送(AAV / 腺病毒)→ ⑥ 表观调控(mTOR 信号)。完整覆盖"从基因到蛋白"的多层级干预体系。

本讲总结

1. 翻译机制:遗传密码(64 个三联体 + 简并性 + 摆动配对)通过 tRNA 接头与核糖体(70S/80S,本质是核酶)解码,把 mRNA 核苷酸序列翻译成蛋白氨基酸序列。氨酰-tRNA 合成酶 + EF-Tu / EF-G + 核糖体动力学校对让错误率压到 ~10⁻⁴。


2. 翻译起止与多样性:真核 eIF4F-cap 扫描 + Kozak;原核 SD-anti-SD 配对(→ 多顺反子);终止由释放因子识别;遗传密码可"重编码"扩展(Sec / Pyl)—— 翻译不是刚性的字典。


3. 蛋白质质量控制 + 调控降解:共翻译折叠 + hsp70/hsp60 分子伴侣;表面疏水斑块 → 26S 蛋白酶体经泛素化降解;NMD(UPF1-SMG)清除异常 mRNA;E3 通过识别 degron(D-box/KEN-box/phosphodegron/N-end rule)实现可调控降解。


4. RNA 世界视角(贯穿四讲):核糖体 + 剪接体 + RNase P 等核心机器仍由 RNA 催化 —— 是 RNA 世界假说的分子化石;DNA → RNA → 蛋白的中心法则是漫长进化的结果,而非起点。


5. 翻译生物学 → 药物开发:从经典抗生素(核糖体)→ 蛋白酶体抑制(硼替佐米)→ PROTAC 主动降解(ARV-471,2026.5 全球首批 ⭐)→ siRNA / ASO / mRNA / AAV,构成完整的"翻译干预"药物谱,体现基础研究如何驱动临床创新。

若单独抑制原料供给,哪些正常组织最容易出现副作用?

核心原则:增殖最快的正常组织 = dNTP 池下降时无法维持复制 → 最早出现毒性。

  • 骨髓造血细胞(最显著、剂量限制性毒性)—— 中性粒减少 / 血小板减少 / 贫血
  • 胃肠道黏膜上皮(更新周期 3–5 天)→ 黏膜炎、口腔溃疡、腹泻
  • 毛囊 → 脱发
  • 生殖细胞 → 致畸性、生育力下降;孕期禁用
  • 皮肤、指甲(慢性用药)→ 色素沉着、下肢溃疡

关键认知

共同特征 = "高增殖速率 + 高 dNTP 消耗"

静止/分化组织(神经元、心肌、成熟肝细胞)几乎不受影响 —— 因为基本不复制 DNA。

教学引申:这是化疗"治疗指数窄"的根本原因 —— 肿瘤选择性来自"快增殖",但骨髓 / 肠粘膜 / 毛囊也是快增殖组织,无法完全区分。

→ 后续 PARP 抑制剂的"合成致死"思路反向利用:寻找肿瘤特有的修复缺陷,而非依赖增殖速率差。

为什么高增殖肿瘤细胞更敏感,但骨髓和毛囊等正常组织也易受影响?

核心:Topo II 是 DNA 复制和有丝分裂必需酶 —— 所有"快增殖"细胞都高度依赖它,**药物选择性只来自"增殖速率差"**,正常的快增殖组织无法被排除。

为什么肿瘤细胞更敏感

  • 持续 S/M 期 → Topo II 活性高 → 药物困住切割复合体 → DSB 大量累积
  • 检查点缺陷(p53 / ATM 突变)→ 无法停下来修,直接走向凋亡
  • HR / NHEJ 修复能力受损 → DSB 不能清理

为什么骨髓 / 毛囊 / 肠粘膜也受累

  • 都是高分裂指数组织 —— Topo II 活性同样高,分子靶点完全一样
  • p53 完整 → 出现 DSB 反而更易触发凋亡

特征性毒性两个例子

多柔比星 → 心脏毒性:心肌虽不增殖,但表达 Topo IIβ 同源酶;加上 ROS 攻击线粒体 → 累积性、不可逆

依托泊苷 → 继发性 AML:诱发 MLL(11q23) 基因易位,1–3% 长生存者发病

教学落点:化疗的"选择性"建立在数量差(增殖快 vs 慢),不是质量差(机制不同)—— 正常的快增殖组织躲不掉。

→ 这是促使药物开发从"普打增殖"走向精准靶向(如 PARP 合成致死)的根本动力。

Topo I 与 Topo II 抑制剂在机制和不良反应谱上的差别

核心:Topo I 抑制剂"间接"造 DSB(先困住单链切口,复制叉撞上才转成 DSB);Topo II 抑制剂"直接"造 DSB(药物诱导的双链切割复合体本身就是 DSB)。

机制差别

维度Topo I(CPT 类)Topo II(依托/多柔)
切割类型单链 SSB双链 DSB(直接)
ATP 需求不需需要
致命损伤来源复制叉碰撞 → DSB直接 DSB
细胞周期强 S 期依赖S/G2/M 期
同源酶单一IIα + IIβ(心肌)

不良反应谱(特征性)

Topo I(伊立替康 / 托泊替康)

  • 早发胆碱能综合征(24h 内出汗、急性腹泻)
  • 迟发性严重腹泻(剂量限制;SN-38 经 UGT1A1)
  • UGT1A1 *28 多态 → 严重中性粒减少 + 暴发性腹泻

Topo II(依托泊苷 / 多柔比星)

  • 多柔比星累积性心脏毒性(不可逆,>450 mg/m² 风险陡增;机制:Topo IIβ + ROS)
  • 多柔比星外渗性组织坏死(强发疱剂)
  • 依托泊苷继发 AML(t(11q23) MLL 易位,1–3%)

共同毒性:骨髓抑制、脱发、黏膜炎、恶心呕吐

同为核苷类似物,为什么不同肿瘤对药物敏感性差异很大?

核心:核苷类似物是"前药",需要细胞代谢链激活才能起效。这条"激活—失活—利用"链条上每一环都由肿瘤特异表达的酶/转运体决定 —— 任何一环阻塞都显著影响敏感性

五个关键决定因素

  • 摄取(hENT1 转运体):低表达 → 药物进不去 → 耐药;胰腺癌 hENT1 是 gemcitabine 应答预测因子
  • 激活激酶(DCK):限速酶,AML 高表达 → ara-C 极敏;下调是经典获得性耐药
  • 失活酶(CDA):脱氨基失活药物;实体瘤 CDA 高 → ara-C 几乎无效
  • dNTP 池(RNR):内源 dCTP 与药物竞争掺入;高 RNR → 耐药
  • 增殖速率 + 修复 + 凋亡能力:不复制 → 不掺入 → 没毒性

"同药异效"临床例

药物高敏感不敏感
Ara-CAML / ALL几乎所有实体瘤
Gemcitabine胰腺癌、NSCLC同癌种间差异大
FludarabineCLL / 惰性 NHL实体瘤无效

→ 这是"伴随诊断"理念早期范例(hENT1、DCK、CDA、UGT1A1 都已成为生物标志物)。

为何阿昔洛韦对不同病毒家族疗效差异明显?

核心:ACV 的疗效完全取决于两个病毒特异性前提:① 病毒自带 TK且能高效磷酸化 ACV;② 病毒DNA pol 对 ACV-TP 高度敏感。两者任一缺失,药物近乎无效。

选择性指数 ~3000 倍:病毒细胞中 ACV-TP 浓度比未感染细胞高三个数量级。

各病毒家族敏感性

病毒TK 状况效果
HSV-1/2强 TK,高亲和金标准
VZVTK ~10× 弱高剂量有效
EBVTK 弱有限有效
CMV无 TK!用 UL97无效 → 用 GCV
HIV / HBV / 流感非疱疹科完全无效

起效"三步链"

ACV (前药)
   ↓ 病毒 TK ← 选择性 ①
ACV-MP
   ↓ 宿主激酶
ACV-TP
   ↓ 病毒 DNA pol ← 选择性 ②
掺入 + 链终止 + "死端复合物"

CMV 例外正引出下一页 ganciclovir:UL97 替代 TK 角色 → 选择性恢复。

在重症或免疫抑制患者中,疗效与毒性如何做动态平衡?

核心:这群患者既"必须用药"(CMV 肺炎死亡率历史 > 50%)又"承受不住毒性"(骨髓刚重建、肾功能受损、多器官受累)。平衡靠风险分层 + 个体化剂量 + 联合降毒 + 监测驱动 + 新机制药物替代

六个核心策略

  • 三种治疗时机:普遍预防 / 抢先治疗 / 病灶治疗 —— 根据风险+设施选
  • 剂量个体化:诱导/维持二相 + CrCl 调整 + TDM
  • 联合降毒:GCV+Foscarnet 协同;Cidofovir+Probenecid+水化(强制方案)
  • CMV-IVIG 联合:尤其 HSCT 后 CMV 肺炎,可减少抗病毒药剂量
  • 支持治疗:G-CSF(GCV 致中性粒减少)、EPO、电解质监测
  • 耐药驱动调整:UL97 突变 → Foscarnet;UL54 多药耐 → Maribavir

游戏规则改变者:新机制药物

Letermovir(terminase 抑制剂)—— 完全不同靶点,无骨髓 / 肾毒 → HSCT 预防一线(NCCN 一类推荐)

Maribavir(UL97 抑制剂)—— 难治/耐药 CMV 救援,安全性远优于 GCV

→ "高毒性药降级为救援药"是当前移植中心的实际做法

教学引申:当一类药物的治疗指数已被"挤干",真正的进步来自换靶点

这是从"经验治疗"过渡到"数值驱动 + 实时调整"的现代抗病毒治疗范式。

面对耐药上升,临床端和公共卫生端分别可以做什么?

核心:耐药 = 个体用药行为 × 群体使用强度 × 环境基因传播临床端管"用得对"公共卫生端管"少诱因 + 监测 + 制度约束 + 创新激励",两端形成闭环。

临床端

  • Stewardship:该用才用、最短疗程、降阶梯;FQ 不用于单纯 UTI
  • 诊断驱动:快速分子诊断、本地 antibiogram、区分定植 vs 感染
  • 替代方案:呋喃妥因 / 磷霉素 / TMP-SMX 治疗简单尿感
  • 联合用药:严重感染时减少单药耐药出现
  • 感染防控(IPC):手卫生、接触隔离、CRE/MRSA 主动筛查
  • 疫苗 + 患者教育:流感 / 肺炎链球菌疫苗减少抗生素需求

公共卫生端

  • 监测网络:WHO GLASS、CARSS、One Health(人-动-环境)、污水监测
  • 监管立法:处方化、农牧业禁用关键抗生素(mcr-1 后 colistin 限用)
  • 国家行动计划:WHO Global Action Plan on AMR;中国国家行动计划
  • 研发激励:CARB-X、AMR Action Fund、英国订阅模型、PASTEUR 法案
  • 疫苗推广:伤寒结合疫苗 (TCV) 直接削减 FQ 使用
  • WASH 基建:清洁水 + 卫生减少腹泻疾病、减少抗生素需求
  • 国际协调:Quadripartite One Health(WHO+WOAH+FAO+UNEP)

教学引申:耐药是"经济外部性"问题(公地悲剧)—— 个体理性选择加总后导致整体灾难。单纯靠教育不够,必须有制度和监管约束;新抗生素研发陷市场失灵 → 需人为创造经济激励。

NER 缺陷患者为何既对铂类高度敏感,又易发癌症?

核心:NER 是修复"大体积扭曲损伤"的主力——它同时承担两个角色:① 清除铂类化疗形成的 DNA 加合物;② 清除日常 UV / 致癌物形成的损伤。NER 缺陷 → 两个角色同时崩 → 化疗超敏 + 致癌风险陡增。

为什么对铂类超敏

  • 铂类(cisplatin / carboplatin)与嘌呤 N7 共价结合 → 链内 1,2-d(GpG) 加合物
  • 这种加合物使双螺旋扭曲 → 主要由 NER 识别清除
  • NER 缺陷 → 加合物累积 → 复制叉撞上 → DSB → 凋亡
  • 临床上 NER 缺陷肿瘤对铂类 IC₅₀ 显著降低(~10× 敏感

为什么易致癌(XP 综合征)

  • UV 形成 嘧啶二聚体 是 NER 的标准底物
  • NER 缺陷 → 嘧啶二聚体不能被清除 → 复制时产生大量错配 → 突变累积
  • XP 患者:皮肤癌风险 ~1000×(基底细胞癌、鳞癌、黑色素瘤);常在 10 岁前发病
  • 避免日光 + 严密筛查是唯一长期管理

教学要点:这是"修复缺陷的双面性"经典案例 —— 同样的 NER 缺陷在不同情境下:在化疗中是"治疗优势"(药物超敏),在日常生活中是"致命风险"(致癌易感)。这种"同一基因双向作用"现象后续在 BRCA + PARP 合成致死中再次出现。

MGMT 启动子未甲基化的肿瘤,TMZ 治疗策略如何调整?

核心:MGMT 启动子未甲基化 = MGMT 蛋白正常表达 = 持续"修复"TMZ 制造的 O⁶-甲基鸟嘌呤损伤 = TMZ 失效。临床策略要么压制 MGMT,要么绕开 MGMT 通路

机制回顾

TMZ → DNA 上 O⁶-甲基鸟嘌呤 → 与 T 错配 → MMR 触发凋亡

MGMT(O⁶-甲基鸟嘌呤 DNA 甲基转移酶)能"自杀式"接收甲基 → 把 G 还原 → 损伤被消除 → TMZ 失效

MGMT 启动子甲基化 → 表观沉默 → MGMT 表达低 → TMZ 高效;未甲基化反之

临床证据

  • 胶质母细胞瘤:MGMT 甲基化者中位生存期 ~21.7 月 vs 未甲基化 ~12.7 月(Stupp 试验)
  • MGMT 状态已成 GBM 治疗的标准伴随诊断

五种调整策略

  • 剂量密集方案(dose-dense):剂量分次连续给药耗竭 MGMT 库存;早期试验未显著获益但仍探索中
  • MGMT 抑制剂联用O⁶-苄基鸟嘌呤 / lomeguatrib 直接耗竭 MGMT;增加正常组织毒性,临床受限
  • 改用其他化疗PCV 方案(procarbazine + CCNU + 长春新碱);洛莫司汀
  • 联合放疗 + 免疫治疗:放疗 + TMZ + 抗 PD-1(少数 GBM 亚型有效);TTFields(电场治疗)已获批联用
  • 临床试验:靶向 IDH 突变(vorasidenib)、CAR-T、肿瘤疫苗等

合成致死策略缺乏可靠生物标志物时,会面临哪些临床挑战?

核心:合成致死的"精准"完全建立在"能识别脆弱亚组"之上 —— 没有生物标志物 = 大海捞针 + 浪费医疗资源 + 高副作用承担。

五大挑战

  • 无效率高:HR 完整患者占多数 → PARP 抑制剂对其几乎无效 → 给药 = 浪费
  • 不必要副作用:贫血、血小板减少、白血病 / MDS(长期 PARP 用药 1–2% 风险)→ 让无效患者承担
  • 医疗经济压力:PARP 抑制剂年费 ~10 万美元 → 全人群用药不可持续
  • 临床试验失败:未分层入组的 III 期试验阴性概率高 → 错失真有效药物
  • 耐药机制复杂:BRCA 回复突变 / 53BP1 缺失 / PARP 突变 → 失去敏感性,但无法识别

应对策略 — 标志物在演进

  • BRCA1/2 胚系突变:最早最直接的标志(占适应症 ~10–15%)
  • HRD score:基因组瘢痕评分(如 Myriad MyChoice CDx)—— 整合 LOH + TAI + LST 三个指标,扩大可治疗群体
  • "BRCAness" 表型:广义 HR 缺陷(含 PALB2、RAD51C/D、CHK2 突变)
  • 功能性 HR 检测:γH2AX 灶 / RAD51 灶免疫荧光 → 直接看活细胞 HR 能力(开发中)
  • 液体活检 ctDNA:动态监测 BRCA 回复突变 → 早期识别耐药
  • 联合方案探索:PARP + 免疫治疗 / 抗血管 / ATR 抑制剂 → 扩大获益人群

教学引申:合成致死代表了从"普打增殖"到"精准利用脆弱性"的范式转变,但"精准"必须配套"识别工具"—— 否则"精准"反而变成"碰运气"。这正是伴随诊断(companion diagnostics)这一行业兴起的原因。

检查点抑制剂为何通常需要与 DNA 损伤剂联合,而非单药?

核心:检查点抑制剂(ATR / CHK1 / WEE1)只是"解除安全锁"——本身不制造损伤。要让肿瘤细胞死,必须有损伤;DNA 损伤剂正好提供"子弹"。两者协同 = "制造伤口 + 不让修" → 强迫带损细胞分裂 → 死亡。

单药为何效果有限

  • 正常细胞内源 DSB / 复制压力很低 → 单药 ATR/WEE1 抑制不会触发明显死亡
  • 大多数肿瘤虽有基线复制压力,但单药"剂量窗口窄"
  • 例外:ARID1A、ATM、p53 等突变带来内源高复制压力的肿瘤 → 单药也可能有效(少数子集)

联合的协同逻辑

DNA 损伤剂 → 大量 DSB / 复制压力

+ ATR/WEE1 抑制 → 无法停车修理

= 带损细胞强迫进入有丝分裂

→ 有丝分裂灾难 → 凋亡

临床联合方案

检查点抑制剂联用 DNA 损伤剂
ATR (Berzosertib)铂类、gemcitabine、放疗
CHK1 (Prexasertib)铂类、Topo I 抑制剂
WEE1 (Adavosertib)放疗、PARP 抑制剂、化疗

→ 也常与 PARP 抑制剂联合:PARP 失败 + ATR 失败 = 双重 HR 通路阻断

教学引申:这是"诱导脆弱 + 利用脆弱"的协同治疗范式 —— 与传统化疗"打增殖"思路不同,目标是把每个治疗组分都变成"协同放大器"而非各打各的。

博来霉素肺纤维化毒性与肺细胞 DNA 修复能力的关联?

核心:博来霉素肺毒性 = "药物在肺富集 + 肺上皮修复能力相对薄弱 + ROS 触发慢性炎症-纤维化循环"三因素叠加。修复能力差 = 损伤累积持续 → 持续凋亡 → 持续炎症 → 持续成纤维细胞激活 → 不可逆纤维化。

为何肺特异性受害

  • 肺组织 bleomycin 水解酶(hydrolase)活性极低 → 药物在肺内积累,浓度比其他组织高 5–10 倍
  • 高氧环境:肺暴露于环境氧(21% / 治疗时常 > 30%)→ 加速 Fe²⁺-博来霉素复合物产生 ROS
  • 肺泡 II 型上皮细胞修复 DSB 能力相对有限,且更新慢 → 损伤代谢周期长

DNA 损伤 → 纤维化的因果链

ROS + Fe²⁺ → DNA 单/双链断裂

肺上皮持续凋亡 / 衰老(修复不及)

DAMP 释放 → TGF-β、IL-6 信号激活

成纤维细胞活化 → 胶原沉积

不可逆肺纤维化

临床管理

  • 累积剂量限制:< 400 U(成年);超过后肺纤维化风险陡增
  • 基线肺功能 + 治疗中监测:DLCO 下降 ≥ 30% 警告
  • 避免高 FiO₂ 环境:术中麻醉、高压氧 → 加重氧化应激
  • 高危人群避用:老年、吸烟、既往肺病、肾功能不全
  • 已发生纤维化:糖皮质激素 + 抗纤维化药(pirfenidone, nintedanib)支持治疗,但难逆转

→ 这正是"DNA 损伤剂的组织特异性毒性"典型例子:损伤普遍发生,但毒性被"局部代谢能力 + 局部修复能力"放大或限制。

CRISPR 编辑效率为何高度依赖 HDR vs NHEJ — 与细胞周期 / 类型有何关联?

核心:Cas9 切割只完成"制造 DSB"这一步;后续 用 NHEJ 还是 HDR 修复,决定了编辑结果是基因敲除(indel)还是精准敲入/校正。**HDR 仅在 S/G2 期 + 提供模板时可用**,所以编辑细胞类型决定了能做哪种编辑。

NHEJ — 默认主导

  • 所有细胞周期都活跃(G1/G0 主导)
  • 不需模板,速度快
  • 常造成小 indel(1–10 bp 缺失/插入)→ 移码 → 基因敲除
  • 哺乳动物体细胞中编辑结果 80–90% 由 NHEJ 决定
  • 适合:基因敲除、突变功能研究

HDR — 高精度但受限

  • 仅 S / G2 期可用(需姐妹染色单体或外源模板)
  • 需提供 ssODN / dsDNA 修复模板
  • 精确替换碱基或插入大片段
  • 哺乳动物体细胞中效率仅 1–10%(远低于 NHEJ)
  • 适合:基因校正、定点敲入

细胞类型对编辑选择的影响

细胞类型主导通路CRISPR 适用
胚胎干细胞 / iPSCNHEJ + HDR 较好敲除 + 校正都可
造血干细胞NHEJ 主导体外同步化提升 HDR
成熟神经元 / 心肌G0/G1 → 仅 NHEJ仅适合敲除
肿瘤细胞NHEJ + HDR(活跃增殖)两者都可

优化策略

  • 细胞同步化:thymidine 阻断 → S/G2 期富集 → 提升 HDR
  • NHEJ 抑制剂:DNA-PKcs 抑制(NU7441)阻 NHEJ → 强行走 HDR
  • HDR 增强剂:RAD51 表达上调;Cas9 与模板共递送
  • 绕过 DSBBase editing / Prime editing(不切双链)→ 不依赖 HDR
  • 体外编辑 + 回输:HSCT 路线(Casgevy)—— 体外细胞可同步化

溶瘤腺病毒 ONYX-015 在 p53 突变细胞中选择性复制的分子基础?为何临床结果不及预期?

核心:ONYX-015 = 缺失 E1B-55K 基因的腺病毒。理论上:E1B-55K 的功能是失活宿主 p53 → 让病毒复制不被阻断。缺失它后,p53 完整的正常细胞会阻断病毒复制;p53 突变的肿瘤细胞无此屏障 → 病毒复制 + 裂解。但实际并非如此简单,临床效果远低于预期。

设想的分子基础

正常腺病毒 → E1B-55K 蛋白结合并降解 p53 → 病毒在 p53⁺ 细胞复制

ONYX-015(ΔE1B-55K)

▸ 在 p53 突变肿瘤:p53 已无功能 → 不需 E1B-55K → 病毒可复制 → 裂解

▸ 在 p53 完整正常细胞:p53 触发凋亡 → 阻断病毒复制 → 不裂解

→ 选择性来自"肿瘤特有 p53 缺陷"

临床失败原因

  • E1B-55K 不只失活 p53:还参与 mRNA 出核、宿主 mRNA 抑制等多种功能 → 缺失它使病毒在所有细胞复制都受影响
  • 选择性远不严格:研究发现病毒在 p53 完整细胞中也能部分复制;在某些 p53 突变细胞中反而复制不佳
  • 免疫清除快:腺病毒高度免疫原性 → 中和抗体快速形成 → 病毒在体内仅几天活性
  • 递送局限:通常只能局部注射(瘤内)→ 难以治全身性肿瘤
  • 临床试验结果:单药客观应答率 ~10–15%,远低于预期 → 美国未获批

教学引申:ONYX-015 是"分子选择性溶瘤病毒"的开创性尝试,虽未达预期但奠定了路线。中国 H101(基本相同结构)于 2005 年获批用于头颈部肿瘤(联合化疗)—— 是全球首个上市溶瘤病毒。后继者 T-VEC(HSV 改造,2015 FDA 批准黑色素瘤)走了"免疫激活"路线,效果更可靠。

→ 教训:"通路缺陷"作为单一选择性基础往往不够鲁棒,需要多机制叠加(如改造 + 免疫激活协同)。

rpoB 突变耐药对利福平联合用药策略的启示

核心:单药利福平极易在数周内被 rpoB 单点突变(如 Ser531Leu)"逃逸" —— 因为单一靶点突变即可获得高度耐药。结核治疗必须采用多药联合 + 长疗程策略,将多种独立耐药基因突变同时发生的概率降到可忽略水平。

耐药机制特点

  • rpoB 突变集中于 81 bp "RRDR"(rifampicin-resistance-determining region)
  • 单点错义突变(S531L、H526Y 等)→ 利福平结合口袋形状改变 → 亲和力下降 1000×
  • 结核杆菌自发突变频率 ~10⁻⁸;每个空洞 ~10⁹–10¹⁰ 菌量 → 单药治疗几乎必然失败
  • 耐多药结核(MDR-TB)= 同时耐利福平 + 异烟肼,全球 ~3–4% 新发病例

联合用药策略要点

  • 标准 RIPE 四联(强化期 2 月):Rifampicin + Isoniazid + Pyrazinamide + Ethambutol → 同时突变四个独立靶点概率 ≈10⁻³²
  • 巩固期 4 月(HR 双联):抑制残余菌;总疗程 6 月起
  • 耐药检测先行:Xpert MTB/RIF 60 分钟检测 rpoB 突变 → 指导个体化方案
  • MDR-TB 全口服方案:Bedaquiline + Pretomanid + Linezolid(BPaL)→ 全新靶点 + 联合
  • DOT(直接督导治疗):保证依从性,避免亚治疗剂量诱导耐药

教学要点:这是"突变概率叠加原理"在临床的经典体现 —— 联合用药不仅追求药效协同,更关键是降低耐药突变累积概率。该原理后续在抗 HIV(HAART 鸡尾酒疗法)、抗肿瘤(多药联合化疗、靶向 + 免疫联合)中反复出现。

利用放线菌素D的浓度依赖性区分转录与复制的贡献

核心:放线菌素D 对转录的 IC₅₀ 远低于复制(~50–100×差异)。利用低浓度选择性阻断转录,可在保留复制和翻译的同时,观察某细胞过程是否依赖新转录的 mRNA,进而判断转录贡献。

分子基础

  • 放线菌素D 嵌入 GC 富集双链小沟 → 阻碍 RNA pol 沿模板滑动
  • 低浓度(<0.04 μg/mL):rRNA 转录(核仁内 pol I)最敏感,mRNA 转录次之
  • 高浓度(>1 μg/mL):复制(DNA pol)和所有转录均被抑制 → 普遍细胞毒
  • 蛋白翻译本身不受影响 —— 已存在的 mRNA 仍可被翻译

实验设计范例

  • mRNA 半衰期测定:加入 act D 阻断新转录,时间梯度测残余 mRNA → 衰减曲线给出 t₁/₂
  • 区分转录性 vs 翻译性调控:刺激后蛋白增加 —— 若 act D 预处理能阻断 → 依赖新转录;若不能 → 已存在 mRNA 的翻译激活
  • 区分应答需要转录 vs 翻译:act D(阻转录)vs 环己酰亚胺(阻翻译)平行处理 → 比较效果差异
  • "超诱导"现象:act D 阻断负反馈调控蛋白合成 → 早期反应基因 mRNA 异常累积,可用于克隆早期基因
  • 病毒学:低浓度 act D 抑制宿主 DNA 病毒转录但保留 RNA 病毒(自带聚合酶)的复制,用于区分病毒类型

教学要点:这是"药理学剂量窗口作为研究工具"的经典范例。同样思路应用于:α-鹅膏蕈碱低浓度专一抑 pol II(区分三种 pol)、5,6-DRB 抑 P-TEFb(区分起始 vs 延伸)等。提醒学生:"工具药"的选择性来自浓度差异,不是绝对特异性

BET 抑制剂"间接靶向"MYC 的机制与局限

核心:MYC 蛋白本身缺少可结合的口袋("undruggable"),无法直接被小分子靶向。BET 抑制剂走"上游转录截断"路线 —— 阻断 BRD4 与超级增强子的结合 → 中断 MYC 转录起始 → MYC 蛋白快速衰减。

间接靶向的机制链

  • MYC 基因上游存在超级增强子(SE),BRD4 高度富集
  • BRD4 募集 P-TEFb(CDK9/CyclinT) → 磷酸化 RNAP II CTD Ser2 → 转录暂停释放
  • JQ1 / OTX015 占据 BRD4 溴域 → 不能识别 H3K27ac/H4ac → 从 SE 脱落
  • MYC mRNA t₁/₂ ~30 min、蛋白 t₁/₂ ~20 min → 转录一停,蛋白迅速消失
  • SE-依赖的"癌细胞偏好性"造就一定治疗窗(正常细胞不那么依赖 SE 驱动)

该策略的主要局限

  • 特异性差:BRD4 调控全局转录组中数千基因,不止 MYC;脱靶引起血液毒性、消化道毒性
  • 耐药快速出现:肿瘤细胞通过 BRD4 磷酸化、WNT 通路代偿、SE 重塑等机制恢复 MYC 表达
  • 单药效果有限:临床 I/II 期单药客观应答率仅 ~10–20%;需要联合(化疗、CDK 抑制剂、免疫)
  • 不能解决 MYC 扩增/易位本质:基因数量没变,只是表达受抑;停药后反弹
  • 替代/补充策略:MYC 直接 PROTAC 降解、Aurora kinase 抑制剂稳定性破坏、MYC-MAX 二聚体阻断剂等正在探索

教学要点:"间接靶向 undruggable"是肿瘤药物开发的重要范式 —— 类似策略包括:PROTAC 降解(替代结合抑制)、合成致死(绕开靶点找通路依赖)、转录因子下游 mRNA 沉默(siRNA / ASO)。BET 抑制剂打开了"染色质阅读器"这一全新靶点类别。

Risdiplam vs Nusinersen:机制与依从性差异

核心:两者最终效应相同(促进 SMN2 第 7 外显子纳入),但分子模态、递送方式、组织分布截然不同。Risdiplam 是口服小分子剪接修饰剂,Nusinersen 是鞘内注射 ASO

比较维度 Risdiplam(Evrysdi,2020) Nusinersen(Spinraza,2016)
分子类型口服小分子(~400 Da)18-mer 2′-MOE 化学修饰 ASO
结合靶点U1 snRNP – SMN2 pre-mRNA 5′ ss 三元复合体(变构稳定)SMN2 内含子 7 的 ISS-N1 序列(碱基互补)
剪接调控方式增强弱 5′ 剪接位点识别遮蔽 hnRNP A1/A2 抑制元件
给药方式每日口服液(家中自服)腰穿鞘内注射(前4剂14、28、56、180天,后每4个月)
组织分布系统性 —— CNS + 外周(肝、肌肉等)均覆盖仅 CNS —— 不穿过血脑屏障,必须直接给药
依从性挑战每日服药、需冷藏;婴幼儿可经口/鼻饲脊柱侧弯/术后患者腰穿困难;需麻醉、影像引导
主要不良反应发热、腹泻、皮疹;动物毒理见生殖毒性腰穿相关:头痛、背痛、感染;蛋白尿、血小板减少
年治疗费用(美国)~34 万美元(体重相关)首年 ~75 万,维持期 ~37.5 万

教学要点:这是"同一靶点、不同模态"的典型案例。递送方式往往比机制本身更决定患者体验。Risdiplam 的成功证明"小分子也能精准修饰剪接" —— 颠覆了"剪接调控只能靠 ASO"的固有印象。第三种选择 Zolgensma(AAV9 基因疗法) 走"一次性根治"路线,三药各占 SMA 治疗市场不同生态位。

AAV 启动子 vs mRNA 5′UTR / 密码子:转录与翻译调控的应用

核心:AAV 把转录调控(启动子、增强子、CTD 招募)的全套原理"外包给宿主",所以工程设计聚焦于如何在何细胞、以何强度被转录。mRNA 疗法跳过了转录步骤,所有调控压力转移到翻译效率、mRNA 稳定性、免疫原性

AAV:利用的转录调控原理

  • 组织特异性启动子:肝(TBG/LP1)、肌肉(MCK/desmin)、视网膜(RPE65)、神经元(hSyn)→ 限定表达细胞
  • 强通用启动子:CAG、CMV、EF1α → 最大转录水平(但易触发免疫)
  • 增强子序列:上游 cis-element 募集组织特异性转录因子(HNF1/HNF4 → 肝)
  • 内含子加入:合成内含子(如 SV40 small t intron)→ 增强转录后剪接 → mRNA 出核效率提升
  • polyA 信号优化:BGH polyA / WPRE → 提高 mRNA 稳定性
  • 挑战:AAV 包装容量 ~4.7 kb 限制 → 必须精简启动子;持久转录 → 难关停

mRNA:利用的翻译/RNA 调控原理

  • 5′ cap 类似物(Cap1,ARCA):模拟天然 m7GpppNm-cap → 高效招募 eIF4F → 翻译起始
  • 5′UTR 选择:α-/β-globin UTR 或工程序列 → 优化扫描效率、避免上游 ORF
  • 密码子优化:避罕用密码子、调节 GC 含量、优化 tRNA 适配;BNT162b2 通过密码子优化使刺突蛋白产量 ~10×
  • 3′UTR + polyA 长度:α-globin 3′UTR + ~100-120 nt polyA → 稳定性提升
  • N1-甲基假尿苷(m1Ψ)取代 U:避免 TLR/RIG-I 识别 → 降低先天免疫;同时提升翻译
  • 自扩增 mRNA(saRNA):自带 RNA 复制酶 → 在胞质放大 → 大幅降低剂量
  • 挑战:t₁/₂ 数小时-数天 → 需重复给药;不能用于"需要持续表达"的疾病

教学要点:"在哪一步介入"决定了能利用哪些调控杠杆。AAV 介入"基因传递"层 → 全转录调控工具箱可用;mRNA 介入"成熟转录本"层 → 仅翻译与 RNA 稳定性工具可用,但避开了核内步骤与整合风险。理想未来:环状 RNA(circRNA)结合 mRNA 的不整合性与近似 AAV 的稳定性。

GalNAc-siRNA 超长效维持的机制;与 LNP 递送的优劣

核心:Inclisiran 的"每年两针"来源于三个机制协同:① GalNAc 三聚体高效肝靶向(ASGPR 受体快速内化);② 化学修饰 siRNA 极度稳定(数月不降解);③ RISC 复合体一旦装载即长效(肝细胞分裂慢,RISC 持续切 mRNA)。

GalNAc-siRNA 的优势

  • 递送高效:三价 GalNAc-ASGPR 结合 Kd ~nM;肝细胞每分钟内化 ~10⁵ 受体
  • 小体积皮下注射:~1.5 mL,门诊 5 分钟完成;患者依从性高
  • 免疫原性低:无 LNP 脂质引起的输液反应 / 类过敏 / IgE
  • 无需冷链:稳定于常温(vs LNP 需 -20℃ 或更低)
  • 长效维持:单次注射后效应持续 ~6 个月(LDL-C 降 ~50% 维持半年)
  • 局限:仅适用于肝细胞(其他器官 ASGPR 不表达);不能递送 mRNA 或大型核酸

LNP 递送的特点

  • 通用性强:可装载 siRNA、mRNA、saRNA、Cas9 RNP,体积包容 100 kb
  • 多组织递送可调:PEG/可电离脂质比例调整可指向肺、脾、骨髓等
  • 输液反应:可电离脂质 + PEG 易触发补体激活 → Patisiran 需类固醇预处理
  • 静脉滴注:~80 分钟住院滴注;不便于门诊维持
  • 冷链严格:mRNA-LNP(Comirnaty)需 -70℃,限制全球可及性
  • 维持期短:Patisiran 每 3 周一次(虽然机制同为 RISC 长效)

教学要点:"药物 = 活性分子 + 递送系统" —— Patisiran 与 Inclisiran 拥有几乎相同的核酸化学和机制,但递送策略把两者推向完全不同的市场定位:LNP-siRNA = 罕见病住院方案;GalNAc-siRNA = 普通门诊慢病长效用药。未来 肝外靶向(抗体偶联、肽偶联、外泌体)正成为下一代核酸递送的研发热点。

腺病毒 vs AAV vs 逆转录病毒载体:持久性与取舍

核心:腺病毒载体表达不持久(数周-数月)——目的基因以游离 dsDNA 存在于细胞核内,随细胞分裂被稀释、并被宿主免疫快速清除。AAV 形成稳定的核内 episome(分裂细胞中也会稀释,但非分裂细胞中可终生维持);逆转录病毒/慢病毒整合到基因组 → 真正"永久"。三者各有不同临床定位。

维度 腺病毒 (Adenovirus) AAV 逆转录/慢病毒 (Retro/Lenti)
基因组形式线性 dsDNA(~36 kb)线性 ssDNA(~4.7 kb)→ 核内成 dsDNA episomeRNA → 逆转录 dsDNA → 整合宿主基因组
包装容量~8 kb(Gutless 型可达 ~36 kb)~4.7 kb(最小,限制基因选择)~8 kb
整合否(游离)主要游离 episome(<1% 整合) —— 永久整合
表达持久性(数周-数月,免疫清除)(非分裂细胞:数年-终身;分裂细胞:稀释)永久(传给子代细胞)
分裂细胞转导高效高效但表达被稀释逆转录 = 仅分裂细胞;慢病毒 = 全部细胞
免疫原性(预存中和抗体常见;可致严重炎症 —— Jesse Gelsinger 事件)中等(衣壳抗体可能存在,可阻止再次给药)较低(VSV-G 假型化后更弱)
插入突变风险很低(早期 SCID-X1 试验发生 LMO2 激活致白血病)
典型用途疫苗(ChAdOx1)、溶瘤病毒、瘤内注射;不适合长期表达单基因疾病(Zolgensma SMA、Luxturna RPE65、Hemgenix 血友病)CAR-T 体外改造(Kymriah/Yescarta)、SCID-X1、ADA-SCID

教学要点:选择载体本质是"持久性 vs 安全性 vs 容量"的三角权衡。腺病毒 = 短效高表达(适合疫苗、溶瘤);AAV = 长效游离(适合非分裂细胞单基因病);慢病毒 = 永久整合(适合干/T 细胞体外改造)。没有"最好的载体",只有"最适配的载体" —— 临床决策从疾病特征(细胞分裂状态、基因大小、给药次数)反推选择。

四环素选择性 + 外排泵耐药

核心:四环素选择性 = 细菌 30S A 位 vs 真核 40S A 位的微小结构差异;外排泵 = 细菌质粒携带的 tetA / tetK 转运蛋白主动把药排出 → 浓度低于抑制阈值。

选择性的分子基础

  • 四环素结合 16S rRNA h34 螺旋,遮挡 A 位 → 阻 aa-tRNA 进入
  • 真核 18S rRNA 同源区结构略有差异 → 亲和力低 ~100×
  • 四环素分子小、亲脂适中 → 易进细菌(被动扩散 + OmpF 通道),但难达高浓度抑真核细胞

外排泵耐药机制

  • tetA/B/K/L 等基因常位于耐药质粒,可水平转移
  • 编码膜泵蛋白 → 用 H⁺ 梯度反向输出四环素 → 胞内浓度低
  • 新一代 Tigecycline(甘氨酰环素)改造结构 → 不被泵识别 → 重获抗菌活性

23S rRNA A2058 甲基化与 MLSB 耐药

核心:大环内酯类(Macrolide)+ 林可酰胺(Lincosamide)+ 链阳菌素 B(Streptogramin B)= MLSB 三类抗生素都结合 50S 出口隧道、依赖 A2058 腺嘌呤的特定取向;erm 基因编码的甲基转移酶将 A2058 N6 双甲基化 → 隧道空间被占 → 三类药物同时失效(交叉耐药)。

分子机制

  • A2058 位于 50S 大亚基出口隧道入口
  • 药物大环内酯通过氢键/疏水作用嵌入隧道,关键接触 A2058 的腺嘌呤
  • Erm 甲基转移酶给 A2058 N6 加 两个甲基 → 隧道入口位阻增大 → 药物无法稳定结合

临床意义

  • erm 基因常在质粒上,水平转移导致广泛传播
  • 诱导型 erm 在亚抑制浓度药物诱导下表达 → 治疗过程中"突现"耐药
  • 对策:新一代酮内酯(telithromycin)多个结合位点 → 部分克服

利奈唑胺耐药率低 = 多拷贝突变累积难

核心:细菌染色体有 4-6 个 rRNA 操纵子(rrn),每个含一份 23S rRNA 基因。利奈唑胺靶位 G2576(23S rRNA)突变要"有效"必须在多个 rrn 拷贝同时发生,单点突变效应被野生型拷贝稀释 → 突变积累慢、耐药率低(< 1%)。

基因剂量稀释机制

  • E. coli 7 个 rrn、金葡菌 5-6 个
  • 单个 rrn 突变 → 部分核糖体耐药、大部分仍敏感 → 整体表型仍敏感
  • 需要多次基因转换 / 同向突变才能让所有拷贝同步突变 → 概率 ~10⁻⁹

"最后防线"地位

  • MRSA、VRE、PRSP 等多耐药菌仍敏感
  • 口服 100% 生物利用度,可替代万古霉素的静脉给药
  • 近期耐药 cfr 基因(质粒携带)开始出现 → 警示需谨慎使用

多发性骨髓瘤为何对蛋白酶体抑制剂极敏感

核心:骨髓瘤是浆细胞恶变,每天合成大量免疫球蛋白(Ig),其中相当比例折叠失败 → 高度依赖 UPS 清除。蛋白酶体抑制 → 错折叠 Ig 堆积 → ER 应激 + UPR → 凋亡。实体瘤合成蛋白量小、对 UPS 依赖低 → 响应有限。

骨髓瘤的"软肋"

  • 浆细胞每天分泌 ~10,000 个 Ig 分子/秒
  • ~30% Ig 折叠失败 → ERAD → 蛋白酶体降解
  • 蛋白酶体抑制 → 错折叠堆积 → 不可逆 UPR + 凋亡
  • 同时干扰 NF-κB 通路(IκB 降解依赖蛋白酶体)→ 阻断生存信号

实体瘤的局限

  • 非分泌型肿瘤的"未折叠蛋白负荷"较低
  • 对正常组织(神经、骨髓)毒性限制剂量
  • 对策:"诱导高分泌"联合策略(如蛋白酶体抑制 + HDAC 抑制)让实体瘤更敏感

PROTAC 为何克服耐药 + 攻克 undruggable

核心:传统抑制剂靠"占位"活性口袋,靶点突变常使药物失效;PROTAC 不需要抑制活性—— 只要任何能结合的位点(甚至变构位点)就可招募 E3 → 把整个蛋白降解 → 突变难逃。对转录因子等无酶活靶点(MYC/AR/ER),PROTAC 把"没法抑制"变成"直接清除"。

克服耐药的三种方式

  • 活性位点突变:PROTAC warhead 可结合非活性位点 → 突变无效
  • 蛋白过表达:PROTAC 催化式作用 → 即使表达升高仍可降解
  • 下游代偿信号:靶蛋白被完全清除 → 不仅没活性,还失去 scaffold 功能

攻克 undruggable 靶点

  • 转录因子(MYC、STAT3、雌激素受体 ER):没有酶活,只有 DNA 结合域
  • 传统抑制剂找不到"酶口袋"无从下手
  • PROTAC 只需有一个浅口袋 / 表面接触面就能附着 warhead → 招募 E3 → 整体降解
  • 例:ARV-471(ER)、ARV-110(AR)成功验证了这一思路

mTOR 抑制剂的 mRNA 选择性

核心:mTOR → 磷酸化 4E-BP1 → 释放 eIF4E;mTOR 抑制 → 4E-BP1 抑制 eIF4E → 最依赖 eIF4E 的 mRNA 翻译被优先抑制。这类 mRNA 共同特征:5'UTR 高度结构化 / 含 TOP(terminal oligopyrimidine)模体,编码细胞增殖与生长关键蛋白(如 c-Myc、cyclin D1、核糖体蛋白、eEF 因子)。

最依赖 eIF4E 的 mRNA 类别

  • TOP mRNA:5' 端以 C/T 寡聚开头,编码核糖体蛋白和 eEF 因子
  • 5'UTR 高度结构化:含茎环、富 GC,需 eIF4F 复合物(eIF4E + eIF4A 解旋)才能扫描
  • 代表蛋白:c-Myc、cyclin D1、VEGF、HIF-1α(增殖 + 血管生成 + 代谢核心)

治疗与临床意义

  • 肿瘤细胞特别依赖这些"增殖驱动"mRNA → mTOR 抑制剂有抗肿瘤潜力
  • 正常细胞看家蛋白 mRNA 较不依赖 eIF4E → 选择性窗口
  • Rapamycin / Everolimus 临床用于:肾癌、神经内分泌瘤、肝移植免疫抑制、TSC

密码子优化如何提高 mRNA 翻译效率

核心:密码子优化 = 把氨基酸序列相同但选用人体高频密码子的 mRNA → 让稀有 tRNA 不再成为瓶颈 → 翻译速度提升、稳定性增强、免疫原性下降。BNT162b2 / mRNA-1273 的刺突蛋白产量比原始序列高约 10×

改变的翻译动力学

  • tRNA 适配速度:高频密码子对应丰富 tRNA → 延伸快速
  • 核糖体不卡顿:避免稀有密码子导致的暂停(防止移码 + 错配)
  • GC 含量优化:5'UTR 不过度结构化便于扫描

额外工程要素

  • m1Ψ(N1-甲基假尿苷)替代 U → 避免 TLR/RIG-I 触发先天免疫
  • 5' cap1(ARCA)+ 3' polyA 120 nt:稳定 + 翻译效率
  • α/β-globin UTR:经典稳定模板

AAV vs mRNA:持久性 / 免疫原性 / 生产复杂度

核心:AAV = "一针解决"但生产难、免疫原性高;mRNA = "反复打"但生产简单、灵活。两类药物适用不同时间尺度的疾病

维度 AAV 基因疗法 mRNA 疗法
持久性数小时-数天(mRNA 降解)
免疫原性中-高:衣壳预存抗体、转基因产物可能引发免疫低-中:m1Ψ 修饰大幅降低;LNP 仍可触发输液反应
生产复杂度极高:哺乳细胞培养 + 病毒纯化 + 质控(数月):体外转录 + LNP 包装(数天,可大规模)
剂量调整不可(一次性给药)可(反复给药)
适合疾病单基因病(SMA / 视网膜病 / 血友病);非分裂细胞为主急性应用:疫苗、肿瘤新抗原、瞬时蛋白替代
典型药物Zolgensma、Luxturna、HemgenixBNT162b2 / mRNA-1273(COVID 疫苗)

siRNA vs ASO:机制 / 递送 / 持续时间

核心:同样靶向 mRNA,但 siRNA 借助RISC 内源机器催化式切割 → 长效(每年 2 针);ASO 单链化学修饰,靠 RNase H 切割或空间位阻 → 需要持续给药。

维度 siRNA ASO(反义寡核苷酸)
结构21-23 nt 双链 RNA~20 nt 单链化学修饰核酸(2'-MOE、PMO 等)
作用机制装载入 RISC → Ago2 切割靶 mRNA① RNase H 切割 mRNA;② 空间位阻改剪接或抑制翻译
催化方式催化式(一个 RISC 切多个 mRNA)→ 持久化学计量式(一对一)→ 需高浓度
递送方式LNP(静脉,全身)/ GalNAc 偶联(皮下,肝靶向)化学修饰自身具备渗透性;常用鞘内(SMA)或皮下
持续时间~6 个月(Inclisiran 每年 2 针)~1-4 个月,需重复给药
典型药物Patisiran (hATTR)、Inclisiran (PCSK9)、GivosiranNusinersen (SMA)、Eteplirsen (DMD)、Mipomersen

LNP vs GalNAc:擅长哪类组织

核心:LNP(脂质纳米颗粒)→ 大部分被肝细胞 ApoE 受体内吞,全身组织广覆盖(偏肝)GalNAc(三聚 N-乙酰半乳糖胺)→ 特异结合肝细胞表面 ASGPR 受体几乎专一靶向肝

LNP 递送特点

  • 装载力强:可装 siRNA / mRNA / saRNA / Cas9 RNP
  • 组织分布:默认偏向肝(ApoE 吸附 → LDLR 内吞),可通过脂质比例调向肺、脾、骨髓、肿瘤
  • 典型药:Patisiran(LNP-siRNA,hATTR)、Comirnaty(LNP-mRNA,COVID)

GalNAc 递送特点

  • 专一肝细胞:ASGPR 受体在肝细胞极高表达,内吞效率 ~10⁵/分钟
  • 皮下注射:5 mL 门诊给药,无 LNP 输液反应
  • 典型药:Inclisiran(PCSK9)、Givosiran(卟啉症)、Lumasiran(草酸尿症)
  • 局限:不能递送大型核酸(mRNA),不能靶向肝外

Eteplirsen 适用 13% DMD 的原因

核心:Eteplirsen 设计跳过 外显子 51,**只对在外显子 51 周边失去阅读框的突变患者有效**(占 DMD 的 ~13%)。其他患者的突变位置不同 → 需要跳跃其他外显子 → 必须设计不同 ASO(精准医学)。

突变位置 ↔ 可跳跃外显子

  • DMD 基因 79 个外显子,最大基因之一(~2.4 Mb)
  • 突变破坏阅读框 → 移码 + 提前终止 → 无功能蛋白 → DMD
  • 跳过特定外显子 → 重新对齐阅读框 → 产生截短但仍部分功能的肌营养不良蛋白(Becker 型)
  • 能跳的外显子有限:删后必须保持阅读框

不同患者 → 不同 ASO

  • Eteplirsen:跳 51 → ~13% DMD 患者
  • Golodirsen / Viltolarsen:跳 53 → ~8% 患者
  • Casimersen:跳 45 → ~8% 患者
  • 覆盖率:现有 ASO 覆盖 ~30% DMD;其余需基因疗法(AAV-dystrophin)或 read-through 药

AAV9(Zolgensma)vs ASO(Nusinersen)治疗 SMA

核心:两者在基因表达层次完全不同:Zolgensma "补充缺失基因"(递送 SMN1 cDNA → 翻译出 SMN 蛋白);Nusinersen "修正剪接"(让备份基因 SMN2 包含外显子 7 → 产生功能蛋白)。逻辑:"补缺" vs "修补"

维度 Zolgensma(AAV9 基因疗法) Nusinersen(ASO 剪接修正)
表达层次基因层面:递送完整 SMN1 cDNARNA 层面:调控 SMN2 pre-mRNA 剪接
治疗逻辑"补缺":补足缺失的 SMN1"修补":让 SMN2 表达完整蛋白
给药次数一次性(静脉滴注)每 4 个月鞘内注射
持久性数年(AAV episome)数月(ASO 衰减)
适用人群2 岁以下(AAV9 中和抗体 + 神经元未老化)任意年龄 SMA 患者
价格~210 万美元(一次性)首年 ~75 万,维持 ~37.5 万/年
1 / 1 跳转到第