基因的复制、转录和翻译

DNA Replication · RNA Transcription · Protein Translation

分子生物学与生物化学基础

Fundamentals of Molecular Biology and Biochemistry

张力勤

北京大学药学院

✉ lqzhang@hsc.pku.edu.cn 🌐 课题组主页 · www.liqinzhanglab.com

生命如此多样，遗传信息如何精确延续？

地球上约有 870 万种生物——形态各异，却共享同一套"语言"：DNA
从微小的病毒，到体型庞大的北极熊
从路旁的蒲公英，到深海中的海龟
它们全都面对同一挑战：每次细胞分裂，都要将整个基因组精确复制一遍
你的身体每天复制"30亿个字母"——出错率哪怕只有 1%，就会产生约 3000 万处突变
为什么我们没有每天"变成另一种生物"？

生命系统的第一原则：信息复制必须极其精准。

生命多样性

我们能"改写生命的代码"吗？

如果 DNA 是代码，我们能编辑它吗？
能不能修复遗传病？
能不能"设计"一个更好的基因？
CRISPR-Cas9 是一种可以"精准剪切 DNA"的分子工具
像"分子剪刀"，找到目标序列，精确切断

自然系统：经过数十亿年进化，DNA 复制已达到极致保真。

人类技术：我们刚刚开始学会在这套系统上"动手"。

CRISPR-Cas9 工作原理

基因编辑应用场景

一段RNA，为什么能变成疫苗？

如果 CRISPR 是"改写"DNA 密码，mRNA 技术则另辟蹊径——直接调控蛋白质表达，无需触碰基因本身
mRNA 疫苗在新冠大流行中数月内研发成功，如今正向肿瘤治疗领域延伸
疫苗并不是"直接提供抗体"，而是给出一段可被细胞读取的 mRNA
细胞读取 mRNA 后合成对应蛋白质，免疫系统据此建立识别与记忆
这背后是一条完整的信息处理链：DNA → RNA → 蛋白质 → 免疫反应

mRNA疫苗药品实物

mRNA疫苗作用机制

类比：疫苗不是替你"打怪"，而是先教会免疫系统如何识别目标。

细胞像一台信息处理系统

生物系统	类比	功能含义
DNA	硬盘	长期存储遗传信息
RNA	缓存 / U盘	临时调用与传递信息
蛋白质	程序执行体	真正完成细胞功能

关键点：DNA 本身不直接"干活"，它提供的是说明书。

为什么需要 RNA：DNA 存于细胞核内需长期稳定保存，RNA 作为中间层让信息调用更灵活、更可调控。

DNA/RNA/蛋白质计算机类比图

为什么同样的DNA，有的细胞正常分化，有的却失控癌变？

神经、肝、肌肉细胞携带相同DNA，却功能与形态迥异
差异不在"拥有什么基因"，而在哪些基因被表达
基因表达调控，是发育与细胞命运的核心开关
DNA突变可导致异常RNA和异常蛋白质
即使DNA未改变，转录或翻译层面的失衡也可驱动疾病
癌症："说明书被读错了，且持续被放大执行"

正常调控：细胞选择性读取DNA，精确的开关决定细胞身份。

治疗逻辑：靶向药瞄准异常蛋白，RNA疗法直接干预异常转录本。

同一DNA不同细胞类型

癌症信息流失控路径图

AI技术为认识与理解生命语言提供了有力武器

结构解析：AlphaFold 等模型可从氨基酸序列直接预测蛋白质三维结构
DNA 4个字母、蛋白质20种氨基酸——语言简单，但"语法"极其复杂
AI将数十年才能解析的结构问题压缩至数小时
大数据解读：人类基因组约30亿碱基对，单个样本数据可达100 GB
全球每年产生数EB级基因组数据，远超人工分析能力
变异检测、基因表达分析、单细胞测序——AI已不可或缺

AI是理解生命语言的新工具。但真正的生物学问题仍是：DNA如何一步步变成蛋白质？

AI解析序列到结构

基因组大数据与AI分析

科学与产业前沿：诺贝尔奖常客，新药研发焦点

近年核酸领域多次摘得诺贝尔奖：
2006年生理医学奖：RNA干扰（RNAi）——Fire & Mello
2020年化学奖：CRISPR-Cas9 基因编辑——Charpentier & Doudna
2023年生理医学奖：mRNA 修饰技术——Karikó & Weissman
2024年生理医学奖：microRNA 的发现——Ambros & Ruvkun
核酸药物已进入临床：
siRNA 药物、反义寡核苷酸（ASO）、mRNA 疫苗与疗法
2023年首款 CRISPR 基因编辑疗法 Casgevy 获批上市

从基础研究到临床新药，核酸科学正在重塑现代医学。

这一切的底层逻辑，都指向同一个问题：核酸如何携带、传递并执行生命信息？

核酸领域诺贝尔奖得主

核酸药物研发管线

核酸药物产业：国际与中国领军企业

Alnylam（美国）：全球 RNAi 药物先驱
已获批6款 siRNA 药物，覆盖罕见病、心血管等多个领域
Patisiran——全球首款获批 siRNA 药物（2018）
Inclisiran——与诺华合作，皮下注射降低 LDL 胆固醇
瑞博生物（中国）：中国核酸药物领域领军企业
由北京大学梁子才教授创立，张礼和院士大力推动
从核酸科研工具起步，布局 siRNA、miRNA、mRNA 多条赛道
核酸药物管线持续推进，多款候选药物已进入临床阶段

核酸药物产业正从"概念验证"走向"规模化落地"，中国企业加速追赶国际前沿。

Alnylam 及获批 siRNA 药物

瑞博生物及中国核酸药物赛道

生命信息流：DNA → RNA → 蛋白质

经典主线：DNA复制保障遗传传递，RNA转录负责信息调用，蛋白质翻译执行细胞功能
本课程四讲主线：DNA复制 → DNA修复与重组 → RNA转录 → 蛋白质翻译
真实系统更复杂：还包括逆转录、RNA病毒复制与RNA调控网络
结论：中心法则是网络化信息流，而不是单向直线
本节与后续课程将回答三个核心问题：
DNA 如何被精准复制？
DNA 如何转录为 RNA？
RNA 如何翻译为蛋白质？

中心法则与扩展网络

课程大纲

课程目标路线图

本系列共四讲（点击直接跳转）

LECTURE 1

DNA 复制

DNA Replication

LECTURE 2

DNA 修复与重组

DNA Repair & Recombination

LECTURE 3

RNA 转录

RNA Transcription

LECTURE 4

蛋白质翻译

Protein Translation

Lecture 1

DNA 复制

DNA Replication

Molecular Biology of the Cell

CHAPTER 5 DNA Replication, Repair, and Recombination

本讲大纲点击条目可直接跳转

一、DNA序列的维持

突变率极低
低突变率对生命至关重要

二、DNA复制机制

碱基配对与复制基础
复制叉的不对称性
高保真度与校对机制
5'→3' 方向与纠错
互变异构与非WC错配
链定向错配修复
RNA 引物合成
解旋酶与 SSB 蛋白
滑动环（sliding clamp）
复制机器协同
DNA 拓扑与拓扑异构酶
真核 vs 原核

三、染色体复制的
起始与完成

复制起点（origin）
原核：单一起点
真核：多复制起点
S 期与复制时序
ORC 复合物
人类基因组复制起点
核小体组装
末端复制问题与端粒
端粒酶结构与机制
G-四链体（G4）
端粒保护性结构
端粒长度调控

四、DNA复制相关
药物开发案例

Hydroxyurea（羟基脲）
Etoposide / Doxorubicin（依托泊苷 / 多柔比星）
Irinotecan / Topotecan（伊立替康 / 托泊替康）
Cytarabine / Gemcitabine（阿糖胞苷 / 吉西他滨）
Acyclovir（阿昔洛韦）
Ganciclovir / Cidofovir（更昔洛韦 / 西多福韦）
Ciprofloxacin / Levofloxacin（环丙沙星 / 左氧氟沙星）

基础回顾

DNA 的基本结构

核苷酸：DNA 的基本单元
由三部分组成：磷酸基团、脱氧核糖、含氮碱基
碱基分两类：嘌呤（A、G）与嘧啶（T、C）
核苷酸通过 3'→5' 磷酸二酯键连接成链
碱基互补配对
A — T（2个氢键）；G — C（3个氢键）
配对特异性保证遗传信息精准复制与传递
DNA 双螺旋结构
两条链反向平行（antiparallel），右手螺旋
碱基对堆积于内部，磷酸骨架位于外侧
形成大沟与小沟——蛋白质识别 DNA 序列的关键位点

核苷酸结构

碱基互补配对 & DNA双螺旋

Section I

DNA序列的维持

The Maintenance of DNA Sequences

DNA序列的维持

突变率极低

突变率约为每 10¹⁰ 个核苷酸复制产生一个变化
该突变率在从原核细胞到人类等不同生物中大致相同
人类基因组约 3.2 × 10⁹ 个核苷酸对
每次细胞分裂仅改变极少数核苷酸
通过直接测序可测量突变率——比较亲代与子代基因组
生殖细胞将遗传信息传递给下一代
体细胞对生殖细胞的存活至关重要,但不留后代

生殖细胞与体细胞的基本功能差异

DNA序列的维持

低突变率对生命至关重要

高突变率会限制生物能够维持的必需基因数量
如果突变率过高,每一代都会积累大量有害突变
基因组越大,对复制保真度的要求越高
生殖细胞稳定性：保证遗传信息准确传给下一代
体细胞稳定性：防止因突变导致的癌症
多细胞生物依赖于 DNA 序列被复制和维持的极高保真度
这一需求推动了精密 DNA复制与修复机制的进化

低突变率：错误阈值 + 生殖/体细胞两根稳定性支柱

DNA序列的维持

小节总结 — DNA序列的维持

1. 极低突变率：在所有细胞中，DNA序列都以极高的保真度进行维护和复制。突变率约为每次DNA复制时每10¹⁰个核苷酸发生一个核苷酸变化，从原核细胞到人类等不同生物中大致相同。

2. 基因组稳定性：由于这种惊人的准确性，人类基因组（约3.2 × 10⁹个核苷酸对）在每次典型的人类细胞分裂时保持不变或仅改变极少数核苷酸。

3. 遗传与防癌：这使得大多数人类能够将准确的遗传指令从一代传递到下一代，同时也避免了体细胞中导致癌症的突变。

Section II

DNA复制机制

DNA Replication Mechanisms

DNA复制机制

碱基配对是DNA复制和修复的基础

DNA模板化：用一条链的序列复制出互补序列
DNA双螺旋须先解旋分离为两条模板链
每个模板核苷酸通过氢键与游离互补核苷酸配对
配对规则：A-T（2个氢键）、G-C（3个氢键）
第一个 DNA聚合酶（DNA polymerase）于1957年发现
底物为脱氧核苷三磷酸（dNTPs）
聚合反应需要单链DNA模板

DNA双螺旋作为自身复制的模板

DNA合成的化学反应

DNA复制机制

DNA复制叉是不对称的

每条亲代链都作为新链合成的模板 → 半保留复制
复制叉：复制活跃区的 Y 形结构
DNA聚合酶只能沿 5'→3' 方向合成
前导链（leading strand）：连续合成,与复制叉同向
滞后链（lagging strand）：不连续合成,方向相反
滞后链产生短片段 = 冈崎片段（Okazaki fragment）
原核细胞：1000~2000 nt
真核细胞：100~200 nt
冈崎片段合成后被连接为完整长链

DNA半保留复制

环形染色体上的两个复制叉

复制叉的不对称结构

DNA复制机制

DNA复制的高保真度需要多种校对机制

最终每 10¹⁰ 核苷酸只出 1 个错 → 由三道关卡接力共同实现
① 碱基选择（聚合酶活性中心几何检查）
dNTP 入位后聚合酶"手指域"从开放 → 闭合构象（induced fit），主动夹紧底物
仅当 Watson-Crick 几何正确才贴合催化；错配几何使活性中心张力升高 → 催化被拒绝
原始误掺入率 ~1/10² → 经此关降到 ~1/10⁵
② 3'→5' 外切核酸酶校对（exonuclease proofreading）
错配 3'-端使引物末端"翘起"，无法继续延伸 → DNA 滑入同一聚合酶上独立的外切位点（~3 nm 外）
切除错误核苷酸后,DNA 滑回聚合位点继续合成 → DNA 聚合酶是"自我纠正"酶
再降 100 倍 → ~1/10⁷；Pol δ/ε、T4、Klenow 都自带，但 Pol α 无校对域（其合成的引物随后被替换）
③ 链定向错配修复（strand-directed mismatch repair）
复制完成后扫查双链，识别错配，以新合成链为修复对象切除重合成
→ 再降 1000 倍 → 1/10¹⁰（机制后面详述）
对照：RNA 合成与翻译错误率约 1/10⁴，比 DNA 复制高 10⁶ 倍
RNA/蛋白产物会被降解,而 DNA 错误一旦未修复将永久遗传

外切核酸酶校对过程

AT和GC碱基配对晶体结构

DNA聚合酶的聚合模式与编辑模式

步骤	错误率
5'→3' 聚合选择	1 / 10⁵
3'→5' 外切校对	1 / 10²
错配修复	1 / 10³
总计	1 / 10¹⁰

DNA复制机制

只有5'→3'方向的复制才能高效纠错

5'→3' 合成时,三磷酸基团由新加入的核苷酸提供
错误发生时：切除3'端错误核苷酸,链仍有活性 → 合成可继续
假设存在 3'→5' 聚合酶：
链的 5' 端需提供三磷酸
切除错误会同时失去三磷酸 → 合成立即终止！
因此,滞后链的「回缝」机制虽复杂,但保证所有合成方向都是 5'→3'
这是外切核酸酶校对的必要前提
尽管有如此保障,偶尔仍有错误 → 最后一道防线：链定向错配修复

5'→3' vs 假想3'→5' 纠错能力对比

DNA复制机制

碱基互变异构与非Watson-Crick错配

碱基存在稀有互变异构体（酮式⇌烯醇式，氨基⇌亚氨基）
稀有异构体的几何形状与正常碱基对几乎相同
T*（烯醇式）可与 G 形成类似 Watson-Crick 几何的错配
C*（亚氨基）可与 A 形成类似配对
聚合酶通过活性位点的形状互补来筛选碱基对
但互变异构体能"欺骗"聚合酶——形状正确，配对却错误
这是碱基选择错误率停留在 ~10^-5 的根本原因
两轮复制后，瞬时错配变为永久突变（转换突变）
因此必须依赖3'→5'外切校对和错配修复来弥补

碱基互变异构与错配机制

DNA复制机制

链定向错配修复系统

修复逃脱复制机器校对的残余错误（包括互变异构导致的错配）
核心问题：如何区分新链和旧链？错误一定在新链上
原核细胞中的机制：
Dam 甲基化酶在 GATC 序列的腺嘌呤上加甲基
新链刚合成时暂时未被甲基化 → 系统识别未甲基化链为新链
MutH（原核细胞特有）切割未甲基化链，启动修复
真核生物中的机制：
没有 MutH，也不依赖甲基化
新链上存在尚未连接的切口（nick）和PCNA滑动夹
PCNA 的方向性标记新链 → MutLα（MLH1-PMS2）切割新链
MutS 和 MutL：原核与真核共有
MutS（真核同源物：MSH2-MSH6）：识别错配，使 DNA 弯折
MutL（真核同源物：MLH1-PMS2）：连接识别与切除步骤
错配修复基因缺陷 → Lynch综合征（HNPCC）

链定向错配修复过程

(A) MutS/MutL修复步骤 (B) MutS蛋白与错配DNA的晶体结构

DNA复制机制

特殊酶在滞后链上合成短RNA引物

自我纠正的 DNA 聚合酶无法从头起始新链
DNA引物酶（primase）合成短 RNA 引物
真核中约 10 个核苷酸长
间隔 100~200 nt
合成流程：
① 引物酶合成 RNA 引物
② DNA 聚合酶从引物 3' 端延伸冈崎片段
③ RNase H 清除旧 RNA 引物,用 DNA 替换
④ DNA 连接酶（DNA ligase）封闭缺口
使用 RNA 而非 DNA 作引物的优势：自动标记为「可疑拷贝」,便于识别和移除

RNA引物合成示意

滞后链DNA片段合成步骤

DNA连接酶催化的反应

DNA复制机制

特殊蛋白质帮助解开复制叉前方的DNA双螺旋

DNA双螺旋在生理条件下极稳定,需接近沸水温度才能分开
DNA解旋酶（helicase）：
水解 ATP 获取能量
六聚体环状结构 — 类似旋转引擎
速度可达每秒 1000 碱基对
DNA 单链穿过中心孔
单链DNA结合蛋白（SSB 蛋白）：
紧密且协同地结合裸露单链 DNA
碱基不被覆盖 → 保持模板功能
拉直单链 DNA,防止形成发卡结构

🖼️

DNA解旋酶检测实验

🖼️

DNA解旋酶六聚体结构

🖼️

SSB蛋白的效果与RPA结构

DNA复制机制

滑动环将移动中的DNA聚合酶固定在DNA上

DNA 聚合酶本身易从模板上脱落
滑动夹（sliding clamp）：环状蛋白，套在 DNA 双螺旋外
一面结合 DNA 聚合酶背面，整个环沿 DNA 自由滑动
原核细胞 vs 真核细胞的滑动夹：
原核细胞：β-clamp（β滑动夹） — 由 2 个亚基组成的同源二聚体环
真核细胞：PCNA（Proliferating Cell Nuclear Antigen，增殖细胞核抗原） — 由 3 个亚基组成的同源三聚体环
两者结构高度相似（六重对称的环），但氨基酸序列不同 → 趋同进化的经典案例
PCNA 还参与错配修复、染色质重塑等多种功能（"细胞内的工作平台"）
夹载入蛋白（clamp loader）：
原核：γ复合体（γ-complex）；真核：RFC（Replication Factor C，复制因子C）
消耗 ATP 将滑动夹装载到引物-模板接头处
结构类似螺母，与双链 DNA 的螺纹匹配
前导链：聚合酶 + 滑动夹长时间结合
滞后链：每完成一个冈崎片段，释放旧夹，结合新夹

滑动夹的结构与装载过程

(A) 环状夹蛋白晶体结构 (B) 夹载入蛋白的工作机制

DNA复制机制

复制叉上的蛋白质协同形成复制机器

复制蛋白组装为复制机器 — 一台分子「缝纫机」
总分子量 > 10⁶ Da
核心组件：
DNA 解旋酶 — 前方解链
两个 DNA 聚合酶 — 前导链 + 滞后链
DNA 引物酶 — 合成 RNA 引物
滑动夹 + 夹载入蛋白
SSB 蛋白
滞后链折回形成环,使所有组件保持紧密联系
复制机器相对固定,DNA 被「穿过」
合成完成后,DNA修复酶清除残余 RNA 引物

原核细胞复制叉的蛋白质组装

(A) 复制叉示意图 (B) T4噬菌体复制机器电镜照片 (C) 电镜解读图

DNA复制机制

什么是DNA的"拓扑"与"拓扑异构"

拓扑（topology）是数学概念：
描述物体在连续变形下保持不变的性质
允许拉伸、弯曲、扭转，但不允许切断或粘合
在 DNA 中，"拓扑"特指两条链的连环数（Linking Number, Lk）
即一条链穿过另一条链的次数
对于环形或两端固定的双链 DNA，Lk 是整数且不可改变，除非切断 DNA
拓扑异构体（topoisomers）：
指同一段 DNA 序列，但连环数 Lk 不同的形态
例如：松弛态、正超螺旋、负超螺旋互为拓扑异构体
它们的化学序列完全相同，但物理形态（缠绕程度）不同
DNA 复制叉前进时，前方双链不断被"拧紧"形成正超螺旋
拓扑异构酶（topoisomerase）：
通过切断-重接 DNA 链来改变 Lk
在不同拓扑异构体之间转换 → 故名"拓扑异构酶"

DNA拓扑与拓扑异构体

DNA复制机制

DNA拓扑异构酶防止复制过程中DNA缠绕

「缠绕问题」：每复制 10 个碱基对,需解开 1 个螺旋
500 nt/s → 每秒需旋转 50 圈！
拓扑异构酶 I（Topoisomerase I）：
切断一条链（单链断裂）
允许两侧相对旋转释放张力
共价键存储能量 → 无需 ATP 自动重新封口
拓扑异构酶 II（Topoisomerase II）：
切断两条链（双链断裂）→ 形成「门」
让另一条双链穿过缺口
需要 ATP 水解
可分离互锁的环状 DNA / 姐妹染色单体
拓扑异构酶 II 是抗癌药物的重要靶标

复制时的「缠绕问题」

拓扑异构酶I的可逆切割反应

拓扑异构酶II的DNA穿越反应

DNA复制机制

真核细胞和原核细胞的DNA复制基本相似

复制叉几何构型和多蛋白复制机器的基本特征在进化中高度保守
真核复制机器的组件更多,但基本功能相同

特征	原核细胞	真核细胞
SSB蛋白	单亚基	三亚基（RPA）
引物酶	独立 DnaG	Pol α-引物酶复合物
复制聚合酶	Pol III	Pol ε（前导）+ Pol δ（滞后）
滑动夹	β-clamp	PCNA
复制叉速度	~1000 nt/s	~50 nt/s
冈崎片段长度	1000~2000 nt	100~200 nt
解旋酶沿模板链	滞后链 (5'→3')	前导链 (3'→5')

真核复制速度慢约 20 倍 — 需穿越紧密包装的染色质（核小体）
真核系统更复杂的调控 → 与有丝分裂精确协调

DNA复制机制

小节总结 — DNA复制机制

1. 复制叉结构：DNA复制发生在Y形复制叉处。具有自我纠错功能的DNA聚合酶催化5’→3’方向的核苷酸聚合。由于两条链反平行，5’→3’合成只能在前导链上连续进行；滞后链上的短片段必须通过「回缝」过程合成。

2. 多蛋白协作：DNA复制需要多种蛋白质协同工作：DNA聚合酶和引物酶催化聚合；DNA解旋酶和SSB蛋白打开双螺旋；DNA连接酶和RNA引物降解酶封接滞后链片段；DNA拓扑异构酶解决螺旋缠绕问题。

3. 复制机器：这些蛋白质在复制叉处相互结合，形成高效的「复制机器」，各组分的活性和空间运动在其中得到精密协调。

Section III

染色体DNA复制的起始与完成

The Initiation and Completion of DNA Replication in Chromosomes

复制起始与完成

DNA合成始于复制起点

双链 DNA 必须先被打开 → 起始蛋白结合并撬开双链
DNA 首先被解开的位置 = 复制起点（replication origin）
复制起点的特征：
含有吸引起始蛋白的短序列
含有富 A-T 的区域（更容易解链）
复制叉从起点双向移动,形成复制泡（replication bubble）
两个叉一直移动直到与对向复制叉相遇或到达染色体末端

复制起点处复制泡的形成

复制起始与完成

原核细胞染色体通常只有一个复制起点

E. coli：单一环形 DNA（4.6 × 10⁶ bp），唯一复制起点 oriC（origin of chromosomal replication）（约245 bp）
oriC 含三类标志序列：DnaA box（4-5个 9 bp 重复，TTATCCACA）+ DUE（3个 13 bp 富 AT 重复）+ GATC 位点
① DnaA 识别并结合 oriC
多拷贝 DnaA-ATP 协同结合 DnaA box，弯折并聚拢 DNA
② 打开 DUE 形成复制泡
DnaA 的拉伸张力作用于 DUE，富 AT 区（氢键弱）局部熔解 → 暴露单链
③ 装载解旋酶 DnaB
DnaC 装载蛋白把 DnaB₆ 环打开并套到单链上，每条单链各一个 → 两个反向复制叉
④ 组装完整复制机器
引物酶 DnaG → RNA 引物；Pol III 全酶 + β滑动夹；SSB 保护单链；gyrase 释放正超螺旋
⑤ 防止重复起始（三道锁）
DnaA-ATP → DnaA-ADP：起始后 ATP 被水解，DnaA 失活
GATC 甲基化延迟：新链未被 Dam 甲基化 → 进入"不应期"
SeqA 封锁：特异结合半甲基化 GATC，物理遮蔽 oriC

原核细胞基因组的DNA复制

原核细胞起始DNA复制的蛋白质

甲基化产生的起始不应期

复制起始与完成

真核染色体含有多个复制起点

人类基因组远大于原核细胞 → 需要 30,000~50,000 个复制起点
真核复制叉速度仅约 50 nt/s（原核细胞的 1/20）
单条人类染色体约 1.5 × 10⁸ nt → 单叉复制需约 35 天！
实际上多个复制泡同时工作
实验方法：放射自显影（autoradiography）
用 ³H-胸苷（放射性胸腺嘧啶核苷）短时间脉冲标记活细胞，使其在 S 期掺入新合成 DNA
将含放射性 DNA 的样品平铺在显微载玻片上，覆盖感光乳剂（含 AgBr 颗粒）
³H 衰变释放 β 粒子 → 还原 AgBr → 显影后形成银颗粒（silver grains）
银颗粒密集处即新合成 DNA → 直接看到复制叉与复制泡的位置和方向
脉冲-追踪（pulse-chase）实验可进一步测定复制叉行进方向与速度
基因组中潜在起点比实际使用多约 10 倍 → 多余起点作为「备份」
不同细胞类型使用不同的起点组合（细胞类型特异性）

真核染色体复制叉的放射自显影实验

复制起始与完成

真核生物的DNA复制仅在细胞周期的S期进行

原核细胞快速生长时几乎连续复制 DNA
真核生物 DNA 复制仅限于 S 期（DNA synthesis phase）
哺乳动物 S 期通常持续约 8 小时；酵母 S 期可短至 40 分钟
细胞周期四阶段：
G1 期：M期与S期之间的间期
S 期：DNA 合成
G2 期：S期与M期之间的间期
M 期：有丝分裂
进入每个新阶段需要先成功完成前一阶段（检查点把关）
为什么真核细胞要把分裂分成四期？
质量控制：G1/G2 检查点确认基因组完整，损伤时暂停周期修复，避免错误传递
空间隔离：S 期与 M 期分开，避免染色体在复制中途被纺锤体拉扯断裂
每周期仅复制一次：S/M 交替使 ORC/Cdt1 等许可因子不可逆切换，防止重复复制
允许准备时间：G1 细胞生长积累原料；G2 检查复制结果、合成 M 期所需蛋白
应对复杂基因组：大基因组与染色质结构需专门时间窗组织复制和染色质重建

标准真核细胞周期的四个阶段

复制起始与完成

同一染色体的不同区域在S期不同时间复制

相邻起点之间的 DNA 约 1 小时即可复制完成，但整个 S 期持续约 8 小时
并非所有起点同时激活，而是分时段、分批次启动
分簇激活（replication factories）：
复制起点以 ~50 个为一簇，在核内特定区域被同步激活
同一簇起点共享一个"复制工厂"——空间上聚集的多酶复合体
每簇仅在 S 期的某个特定时间窗口内活跃，结束后下一簇接力
时序与染色质状态强相关：
早期复制（S期前段）：常染色质（开放染色质、转录活跃区、基因密集区）
晚期复制（S期后段）：异染色质（高度浓缩、转录沉默、近着丝粒/端粒）
这是一个细胞类型特异、可遗传的属性 → 不同细胞用不同时序模式
关键观察：
一旦某起点被激活，其复制叉速度在整个 S 期保持恒定（~50 nt/s）
染色质浓缩影响的是起始时间，而非叉行进速度
复制时序异常（如 ATR 缺陷）→ 与基因组不稳定和肿瘤相关

酿酒酵母III号染色体的复制起点分布

复制起始与完成

大型多亚基复合物结合真核复制起点

ORC（Origin Recognition Complex）：6 亚基环形复合体，全周期持续结合起点 DNA，作为"地标"与"装配平台"
酵母 ARS 起点：A 元件（11 bp 共有序列）= ORC 结合位点；B 元件 = 富 A-T 解链区 + 辅助蛋白位点
"一次且仅一次"两步控制：
① G1 许可（licensing）：ORC + Cdc6 + Cdt1 装载双 Mcm2-7 解旋酶环 → 形成 pre-RC
② G1/S 激活：CDK + DDK 磷酸化 Mcm，招募 Cdc45 + GINS → CMG 解旋酶 → 双向复制叉建立
三种聚合酶分工：
Pol α / 引物酶：RNA 引物 + 短 DNA 起始；低保真，仅起始用
Pol ε：前导链连续合成；含 3'→5' 校对活性
Pol δ：滞后链冈崎片段延伸；含校对活性，负责链置换
防止重复复制：CDK 磷酸化 Cdc6/Cdt1 使之失活；geminin 封锁 Cdt1；S/G2/M 期无法再装载 Mcm → 每周期精确复制一次

真核DNA复制起始机制：pre-RC 形成与 CMG 激活

复制起始与完成

人类基因组复制起点的特征仍待发现

酵母中起点有明确的 DNA 序列特征（ARS 共有序列）
人类起点的 DNA 序列已被鉴定（各含数千 nt）
但将这些序列互相比较 → 未发现共有的特征序列
人类 ORC 与酵母 ORC 非常相似，也结合复制起点
推测人类复制起点由以下因素决定：
染色质结构（开放染色质、核小体空缺区）
转录活性（CpG 岛、启动子附近富集）
其他表观基因组特性（组蛋白修饰、DNA 甲基化）
这或许解释了：
不同细胞类型使用不同起点组合
起点选择可根据细胞状态而改变
这一领域仍有大量未解之谜

酵母起点（序列驱动）vs 人类起点（多因素决定）

复制起始与完成

新核小体在复制叉后方组装

染色体 = DNA + 蛋白质 → 复制需同时复制两者；组蛋白在 S 期大量合成（mRNA ↑~50×）
复制叉经过时亲代核小体暂时解体：H3-H4 四聚体随机分配到两条子链；H2A-H2B 二聚体释放进入可溶池
叉后方约 600 nt 暂无核小体（"裸 DNA 窗口"）
组蛋白伴侣快速恢复核小体：
CAF1：经 PCNA 锚定在叉上，装载新合成的 H3-H4 四聚体
ASF1：中转伴侣，将新 H3-H4 交给 CAF1，并接收解体的旧 H3-H4
FACT：与 CMG 同行，叉前松开亲代 H2A-H2B；叉后原位放回子链
NAP1：将新合成 H2A-H2B 补装到子链核小体
新旧 H3-H4 混合排布 → 旧组蛋白修饰引导新组蛋白获得相同修饰 → 表观遗传信息跨分裂传递
核小体间距决定冈崎片段长度（~200 nt，约一个核小体重复单位）

复制叉后方的核小体组装

复制起始与完成

末端复制问题与端粒

末端复制问题（end-replication problem）
前导链方向：复制叉行进至模板 5' 末端,可连续延伸到底 → 完整复制 ✓
滞后链方向：最末端那段冈崎片段的 RNA 引物被切除后，没有上游 3'-OH 可供 DNA 聚合酶接续填补 → 留下缺口
→ 每次分裂线性染色体末端丢失 ~50–200 bp
原核解决方案：环形染色体（无末端）
真核解决方案：端粒 + 端粒酶
端粒 = 染色体末端富 G 的短串联重复阵列，3' 端为 G 链单链突出（overhang）
人类（及所有脊椎动物）的重复单元 5'-TTAGGG-3'（G 链方向，即 GGGTTA），约重复 1000 次（~6–10 kb）
其他真核物种各异：植物 TTTAGGG、四膜虫 TTGGGG、酵母为不规则 TG 重复 → 各物种端粒酶 RNA 模板序列也对应不同
特例：果蝇不依赖端粒酶,改用特殊逆转录转座子（HeT-A、TART）维持末端
生物学意义：绝大多数体细胞端粒酶沉默 → 端粒每代渐短 → 触发复制性衰老（Hayflick limit）
仍表达端粒酶的正常细胞：生殖细胞（精原/卵原）、胚胎干细胞、成体组织干细胞（造血、肠隐窝、表皮基底层等）、活化的淋巴细胞
癌细胞：约 85–90% 重新激活 TERT 转录；其余 ~10–15% 走 ALT（alternative lengthening of telomeres，依赖同源重组）

端粒酶解决末端复制问题

复制起始与完成

端粒酶的结构与工作机制

端粒酶（telomerase）= RNP 复合体（ribonucleoprotein，核糖核蛋白）
核心两亚基（最小催化单元）：
TERT：催化亚基（蛋白），本质是逆转录酶（以 RNA 为模板合成 DNA）
TERC / hTR：RNA 亚基，含 ~11 nt 的模板（5'-CCCAAUC-3'，与端粒重复互补）
辅助亚基（全酶 holoenzyme）：Dyskerin、NOP10、NHP2、GAR1 稳定 TERC RNA；TCAB1 介导酶向 Cajal 小体 / 端粒的运输
三步循环延伸 G 链：
① 配对：端粒 3' 突出端与 RNA 模板碱基配对
② 延伸：以 RNA 为模板，沿 5'→3' 方向加 6 个 nt（一个重复单元）
③ 易位（translocation）：酶相对 DNA 滑动一个单元，重新配对再延伸 → 反复多轮
端粒酶只延伸 G 链；其后常规 Pol α-引物酶 + Pol δ 在 G 链上铺设引物 → 补全互补 C 链

端粒酶结构与工作机制

复制起始与完成

G-四链体（G4）：端粒上的特殊 DNA 二级结构

G-四链体（G-quadruplex, G4）= 富 G 单链 DNA 的四链折叠
基本单位 G-tetrad（四联体）：4 个鸟嘌呤 G 通过 Hoogsteen 氢键共面成环（不是 Watson-Crick 配对）
多个 G-tetrad 平面堆叠成柱状 → 中央通道由 K⁺ 串联稳定（Na⁺ 也可，K⁺ 最优）
序列模板：G₃N₁₋₇ G₃N₁₋₇ G₃N₁₋₇ G₃ —— 4 段连续 GGG 由短链环（1–7 nt）连接
拓扑可分平行 / 反平行 / 混合型，取决于序列、loop 长度与离子环境
基因组中 G4 的富集位点：
端粒：人类 TTAGGG × 1000 → 单链 3' 突出端可串联折叠多个 G4（最经典、密度最高）
原癌基因启动子：c-MYC、KRAS、BCL-2、VEGF 等 → G4 影响转录因子结合
rDNA、复制起点、5' UTR 也常形成 G4 → G4 是普遍的调控性 DNA 二级结构
G4 在端粒处的双重作用：
保护：屏蔽 3' 突出端,避免被核酸酶降解或被 DDR 误识为 DSB
调控端粒酶：G4 折叠把 3' 端"封闭" → 端粒酶无法接触模板 → 必须先解开才能延伸
G4 还会阻挡复制叉 → 复制压力 → 解构机器缺陷可致基因组不稳定

G-四链体（G4）结构

复制起始与完成

端粒被包装成保护染色体末端的特殊结构

端粒 DNA 的 3' 端有一段单链突出（G 链 overhang，~50–200 nt）
Shelterin 复合物：6 亚基蛋白帽子，特异结合端粒重复
TRF1 / TRF2：结合双链端粒；TRF2 还驱动 T-loop 形成、抑制 ATM 激活
POT1：覆盖 3' 单链突出 → 既保护 ssDNA，也阻止 G4 自发形成
TPP1：连接 POT1 与端粒酶；解构 G4 后通过 TEL patch 招募端粒酶
TIN2 / RAP1：内部支架，桥连各亚基、抑制 ATR 信号
保护机制 ①：T-loop 折叠
3' 突出端回折侵入上游双链端粒 → ~10–15 kb 大环 + 局部 D-loop
由 TRF2 驱动；电镜下可直接观察
"藏起"末端 → 避免被 DDR 误识为 DSB，阻断 NHEJ / HR
保护机制 ②：G4 自折叠（详见上一页）
3' 突出 G 链折叠为 G4 → 保护单链 + 阻挡端粒酶
由解旋酶 BLM、WRN、RTEL1、FANCJ、Pif1 主动解构
↳ 这些基因突变 → Bloom 综合征、Werner 早衰、Fanconi 贫血
总结：T-loop 与 G4 是 3' 突出的两种互斥构象，共同隐藏末端；端粒酶工作时由 POT1/TPP1 切换到"延展态"完成延伸

端粒末端结构（T-loop / D-loop）

端粒酶四链体区域示意

复制起始与完成

端粒长度受到细胞和生物体的调控

端粒重复数量维持在一定范围内 — 稳态调控
大多数人体细胞中端粒酶活性很低
每次分裂端粒缩短约 100~200 nt
最终触发复制性衰老（细胞停止分裂）
端粒酶在生殖细胞和干细胞中高度活跃
缺乏端粒酶的转基因小鼠：
最初正常,但随代数增加出现表型异常
最终导致组织衰竭和不育
人类先天性角化不良（Dyskeratosis congenita）：
端粒酶基因突变 → 端粒过早缩短
骨髓衰竭,皮肤异常,癌症风险增加
端粒 / 端粒酶与衰老和癌症密切相关

端粒长度调控：不同细胞类型 + Tert⁻/⁻ 小鼠 + DC 疾病

复制起始与完成

小节总结 — 复制起始与完成

1. 复制起始：启动DNA复制的蛋白质结合到复制起点的DNA序列上，催化形成具有两个向外移动的复制叉的复制泡。该过程从起始蛋白-DNA复合物形成开始，随后将DNA解旋酶装载到DNA模板上。

2. 原核与真核：原核细胞通常在环形染色体上有单一复制起点，叉速度可达1000 nt/s，不到30分钟即可复制完成。真核细胞DNA复制仅在S期进行，复制叉速度慢约10倍，因此需要多个复制起点才能在约8小时内完成复制。

3. 起点调控：不同复制起点按顺序激活，部分取决于染色质结构，最浓缩的区域通常最后复制。复制叉经过后，新组蛋白与旧组蛋白一起重新组装染色质。

4. 端粒保护：真核生物通过端粒解决线性染色体末端的复制问题，端粒酶使用自身携带的RNA模板延伸染色体末端的重复序列。端粒具有特殊的保护结构（Shelterin复合物和T-loop），确保其不被误认为断裂的染色体末端。

Section IV

DNA复制相关药物开发案例

From Replication Mechanism to Therapeutic Strategy

药物开发案例

Hydroxyurea：抑制核糖核苷酸还原酶，限制dNTP供给

中文药名：羟基脲
作用环节：DNA复制原料层（dNTP池）
抑制RNR（ribonucleotide reductase），减少脱氧核苷酸生成
dNTP不足会引发复制压力并降低快速增殖细胞的复制能力
临床应用：骨髓增殖性疾病、镰状细胞病等
重点提示：先“断原料”，再谈复制机器，是药物设计的上游思路

Hydroxyurea作用机制

课堂问题：若单独抑制原料供给，哪些正常组织最容易出现副作用？

药物开发案例

Etoposide / Doxorubicin：靶向Topo II，阻断DNA解缠结

中文药名：依托泊苷 / 多柔比星
作用环节：复制叉前进时的拓扑应力管理
Topo II负责切开并重连DNA双链以解除超螺旋和缠结
药物可“困住”Topo II-DNA复合体，导致断裂累积与复制崩溃
用于多种肿瘤化疗，属于肿瘤药物发展史中的里程碑类别
重点提示：解释“为何有效”与“为何毒性显著”常常同时存在

Etoposide 药理机制

Doxorubicin 药理机制

课堂问题：为什么高增殖肿瘤细胞更敏感，但骨髓和毛囊等正常组织也易受影响？

药物开发案例

Irinotecan / Topotecan：靶向Topo I，诱发复制叉崩溃

中文药名：伊立替康 / 托泊替康
作用环节：单链切口重连循环（Topo I）
Topo I通常切开一条链释放扭转应力后再重连
药物稳定切割中间体，复制叉碰撞后可转化为更严重损伤
临床代表：伊立替康用于结直肠癌等，托泊替康用于多种实体瘤
重点提示：展示“复制叉—DNA损伤响应—细胞命运”这一连锁关系

Topo I抑制剂机制

课堂问题：Topo I与Topo II抑制剂在机制和不良反应谱上会有哪些差别？

药物开发案例

Cytarabine / Gemcitabine：核苷类似物干扰DNA链延伸

中文药名：阿糖胞苷 / 吉西他滨
作用环节：DNA聚合酶底物层与链延伸过程
药物经细胞内激活后可与天然核苷竞争，掺入DNA
引发链终止或延伸障碍，造成S期阻滞与细胞死亡
阿糖胞苷是白血病经典药；吉西他滨用于胰腺癌等重要肿瘤
重点提示：把“聚合酶选择底物”与“药物结构修饰”直接关联

核苷类似物链终止

课堂问题：同为核苷类似物，为什么不同肿瘤对药物敏感性差异很大？

药物开发案例

Acyclovir：经典抗疱疹药，选择性抑制病毒DNA复制

中文药名：阿昔洛韦
作用环节：病毒DNA聚合酶与病毒复制周期
关键特点：需经病毒相关激酶优先活化，体现良好选择性
活化后抑制病毒DNA聚合酶并终止链延伸
重点提示：说明“同是复制抑制，选择性来源于病原体特有步骤”

Acyclovir选择性抑制机制

课堂问题：为何阿昔洛韦对不同病毒家族疗效差异明显？

药物开发案例

Ganciclovir / Cidofovir：面向CMV等高风险病毒复制抑制

中文药名：更昔洛韦 / 西多福韦
作用环节：病毒DNA复制延伸与聚合酶抑制
更常用于免疫抑制或移植相关高风险人群中的CMV管理
与阿昔洛韦相比，谱系和毒性考量不同，临床权衡更复杂
提示学生：药物选择不仅取决于机制，还取决于患者背景与风险分层
重点提示：把“机制正确”与“临床可用性”连接起来

Ganciclovir 药理机制

Cidofovir 药理机制

课堂问题：在重症或免疫抑制患者中，疗效与毒性如何做动态平衡？

药物开发案例

Ciprofloxacin / Levofloxacin：靶向细菌DNA复制机器

中文药名：环丙沙星 / 左氧氟沙星
作用环节：细菌拓扑异构酶（DNA gyrase / Topo IV）
抑制细菌DNA复制和染色体分离，对常见细菌感染疗效确切
耐药机制：靶点突变、外排泵上调、用药不规范
重点提示：帮助学生理解“药靶差异决定抗菌药与抗病毒药边界”

喹诺酮类抗菌药靶向DNA gyrase

课堂问题：面对耐药上升，临床端和公共卫生端分别可以做什么？

药物开发案例

小节总结 — DNA复制相关药物开发案例

1. 复制药靶分层：可从原料供给、复制叉拓扑、链延伸、修复依赖和病原体特异复制五个层面进行药物设计。

2. 机制与临床并重：同一机制在不同疾病中疗效与毒性表现不同，必须结合患者分层与治疗目标。

3. 代表药物的教学意义：经典药物不仅是“知识点”，更是连接基础机制与真实临床决策的桥梁。

4. 课程衔接：本节的复制机制为后续DNA修复与重组、RNA转录和蛋白质翻译奠定药理学理解框架。

本讲总结

1. DNA序列的维持：突变率极低（~10⁻¹⁰ /nt/分裂），这对维持大基因组和防止癌症至关重要。

2. 复制叉结构：Y形复制叉中，前导链连续合成，滞后链通过冈崎片段「回缝」合成，两者均为5'→3'方向。

3. 三步保真机制：聚合选择（10⁻⁵）→ 外切校对（10⁻²）→ 错配修复（10⁻³），总计达到 10⁻¹⁰ 的惊人保真度。

4. 复制机器：解旋酶、DNA聚合酶×2、引物酶、滑动夹/载入蛋白、SSB蛋白、连接酶、拓扑异构酶协同工作。

5. 复制起始调控：原核细胞单起点，真核细胞3~5万个起点；ORC/Mcm确保每个起点每周期仅激活一次。

6. 核小体与端粒：复制叉后方核小体由组蛋白伴侣重新组装；端粒酶解决末端复制问题，端粒长度与衰老/癌症密切相关。

Lecture 2

DNA 修复与重组

DNA Repair and Recombination

Molecular Biology of the Cell

CHAPTER 5 DNA Replication, Repair, and Recombination

你的基因组，每天承受约 10 万次化学攻击

每个细胞每天发生约 50,000 – 100,000 次 DNA 损伤事件
脱嘌呤（Depurination）：每细胞每天约 18,000 次，碱基与脱氧核糖键水解断裂
胞嘧啶脱氨基：每天约 100 次 C → U，若不修复 → G·C 变 A·T 突变
活性氧（ROS）：氧化磷酸化的副产品，形成 8-oxoG 等氧化损伤碱基
紫外线：相邻嘧啶共价交联 → 胸腺嘧啶二聚体，阻断复制与转录
即便如此，实际突变率仅 ~10⁻¹⁰ / 碱基 / 分裂——修复系统几乎将错误清零

核心问题：细胞如何在如此高强度的化学攻击下仍精确维持基因组？答案就是本讲的主题——DNA 修复。

DNA 损伤类型与每日频次

修复失败的代价：癌症、衰老与遗传病

着色性干皮病（XP）：核苷酸切除修复（NER）缺陷 → 无法清除 UV 损伤 → 皮肤癌风险 ×2000
遗传性非息肉性结肠癌（HNPCC）：错配修复（MMR）基因突变 → 结直肠癌风险极高
Fanconi 贫血：跨链损伤（ICL）修复缺陷 → 骨髓衰竭 + 白血病易感
BRCA1 / BRCA2 突变：同源重组修复受损 → 乳腺癌、卵巢癌终身风险升至 60–80%
衰老的 DNA 损伤积累理论：体细胞修复错误长期积累 → 细胞功能退化
癌症基因组中约 25% 的驱动突变起源于 DNA 修复基因缺陷

临床意义：理解修复通路直接推动了 PARP 抑制剂（合成致死策略）等靶向药物的开发——本讲后半段将详细介绍。

DNA 修复缺陷与癌症、遗传病关联

同源重组与转座：基因组是动态的"活图"

同源重组是最精确的双链断裂修复方式，也是减数分裂产生遗传多样性的分子基础
每次减数分裂，人类基因组平均发生 ~2–3 次交叉互换，重新洗牌遗传组合
转座子（Transposable Elements）：占人类基因组约 45%，是最丰富的基因组成分
LINE-1 逆转座子在人类中仍保持活性：偶尔转座 → 插入突变（如血友病 A 部分病例）
细菌转座子携带抗生素耐药基因，是耐药性跨种传播的重要载体
Cre/LoxP 等位点特异性重组系统已成为现代基因工程的核心工具

宏观视角：DNA 不是静态"蓝图"，而是在修复、重组、转座的持续作用下不断演化的动态信息载体。本讲将从机制上揭示这三个过程。

基因组三大动态过程：修复 · 重组 · 转座

本讲大纲点击条目可直接跳转

一、DNA 修复

自发性损伤会改变DNA序列
UV损伤与化学修饰如何致突变
双螺旋结构本身有利于修复
碱基切除修复(BER)
核苷酸切除修复(NER)
直接化学逆转
NER与转录偶联(TC-NER)
碱基化学特性与损伤检测
跨损伤聚合酶(TLS)
双链断裂修复(HR / NHEJ)
DNA损伤检查点 (ATM / ATR / AT综合征)

二、同源重组

同源重组的共同特征
碱基配对引导同源重组
HR精确修复双链断裂
RecA / Rad51催化链交换
HR拯救断裂复制叉
HR三层调控 + LOH / BRCA1/2
背景回顾：有丝分裂 vs 减数分裂
同源重组与减数分裂
程序性DSB启动减数分裂重组
Holliday连接结构
交叉互换与非交叉互换

三、转座与保守性
位点特异性重组

转座子可插入任意DNA序列
DNA转座子：剪切-粘贴机制
病毒利用转座整合宿主染色体
LTR 逆转座子（逆转录病毒样）
非 LTR 逆转座子（LINE / SINE）
LTR vs 非LTR 对比表
TE类型与分布的跨物种比较
TE活跃的进化时间线
位点特异性重组的可逆性
位点特异性重组开关基因
Cre / LoxP系统的应用

四、DNA修复相关
药物开发案例

Cisplatin / Carboplatin（铂类）
Temozolomide（替莫唑胺）
Olaparib / Niraparib（PARP抑制剂）
ATR / WEE1 抑制剂
Bleomycin（博来霉素）
CRISPR-Cas9（Casgevy）
腺病毒载体（Gendicine / ONYX-015）

Section I

DNA 修复

DNA REPAIR

DNA修复

没有DNA修复，自发性损伤会迅速改变DNA序列

DNA在正常条件下也会发生自发性化学变化
人类细胞每天丢失约18,000个嘌呤碱基（脱嘌呤反应）
每天约100个胞嘧啶自发脱氨基变成尿嘧啶
活性氧(ROS)和S-腺苷甲硫氨酸等活性代谢物也会损伤碱基
紫外线造成相邻嘧啶之间的共价连接——胸腺嘧啶二聚体
环境化学物质（苯并芘等）通过化学修饰碱基导致损伤
未修复的损伤在复制时导致碱基替换突变或缺失
基因组中数个百分点的编码能力专门用于DNA修复

自发性DNA损伤的类型与脱嘌呤、脱氨基反应示意图

DNA损伤化学反应详图

哺乳动物细胞24小时内产生和修复的内源性DNA损伤

DNA修复

紫外损伤与化学修饰如何产生突变

脱嘌呤：N-糖苷键水解→嘌呤碱基丢失→AP位点
脱氨基：胞嘧啶(C)→尿嘧啶(U)，复制后产生G→A突变
胸腺嘧啶二聚体：UV照射使相邻胸腺嘧啶形成共价键
苯并芘（烟草、柴油废气中的致癌物）——形成大体积加合物
这些损伤的共同特点：改变了碱基的化学结构
所有不能及时修复的损伤都可能在下一轮复制中成为永久性突变

UV导致胸腺嘧啶二聚体

化学修饰如何产生突变：(A) C脱氨→U→G-to-A突变 (B) 脱嘌呤→核苷酸缺失

DNA修复

DNA双螺旋结构本身有利于修复

双螺旋携带两份遗传信息——每条链各一份
一条链受损时，互补链可作为精确修复的模板
这是所有细胞都使用双链DNA作为遗传物质的根本原因
只有非常小的病毒才能"负担得起"单链基因组（RNA或ssDNA）
单链基因组无法利用互补链修复→更高的突变率
小基因组是损伤的小靶标，故能承受更高突变率
这一原理是所有DNA修复机制的核心基础

双链 DNA vs 单链基因组：修复能力对比

DNA修复

DNA损伤可通过多种途径修复 (一) 碱基切除修复

碱基切除修复（BER, Base Excision Repair）：修复单个碱基的化学改变
依赖DNA糖苷酶（DNA glycosylase）——至少6种，各识别特定类型的异常碱基
关键机制：碱基翻转(base-flipping)
- 将受损核苷酸翻出双螺旋
- 糖苷酶探测碱基的各个面以检测损伤
糖苷酶从糖基上移除受损碱基→产生AP位点（无嘌呤/无嘧啶位点）
AP核酸内切酶（AP endonuclease）识别AP位点，切割磷酸二酯键骨架
DNA聚合酶（DNA polymerase）填补缺口，DNA连接酶（DNA ligase）封口
自发脱嘌呤产生的AP位点可被AP核酸内切酶直接修复

碱基切除修复(BER)通路

DNA糖苷酶通过碱基翻转识别并移除受损碱基

DNA修复

DNA损伤可通过多种途径修复 (二) 核苷酸切除修复

核苷酸切除修复（NER, Nucleotide Excision Repair）：修复大体积DNA损伤
修复对象：苯并芘加合物、嘧啶二聚体等扭曲双螺旋的损伤
大型多酶复合物巡查 DNA → 识别双螺旋构象异常（而非特定碱基改变）→ 可通用修复嘧啶二聚体、苯并芘加合物等结构性损伤
人类 GG-NER：XPC-RAD23B 复合物先结合扭曲位点 → 招募下游修复机器
TFIIH 中的 XPB / XPD 解旋酶（helicase）局部解链约 30 bp 形成开口"气泡"，XPA + RPA 验证损伤并稳定单链
两侧分别切割：XPG（3' 端切）+ XPF-ERCC1（5' 端切）—— 双切口产生含损伤的寡核苷酸片段
DNA解旋酶（DNA helicase）剥离含损伤的寡核苷酸片段
原核细胞中留下12个核苷酸的缺口；人类中留下约30个核苷酸的缺口
DNA聚合酶（DNA polymerase）和连接酶（DNA ligase）填补并封口
着色性干皮病(XP)：NER缺陷导致的遗传病——阳光敏感、高度皮肤癌风险

核苷酸切除修复(NER)通路

DNA修复

DNA损伤可通过多种途径修复 (三) 直接化学逆转

第三种修复策略：直接逆转化学损伤，无需切割骨架
O⁶-甲基鸟嘌呤的修复：
- 甲基转移到修复蛋白的半胱氨酸残基上
- 修复蛋白在反应中被"自杀式"破坏（一次性使用）
1-甲基腺嘌呤和3-甲基胞嘧啶的修复：
- 铁依赖的去甲基化酶移除甲基，释放甲醛
三种策略对比：BER移除碱基、NER移除寡核苷酸、直接逆转移除化学修饰

BER

碱基切除修复

触发：碱基化学改变

糖苷酶识别并翻转碱基
移除碱基 → AP 位点
AP 内切酶切骨架
聚合酶填补 + 连接酶

移除范围：1 个碱基

NER

核苷酸切除修复

触发：双螺旋构象异常

多酶复合物扫描，识别扭曲
损伤两侧切骨架
解旋酶剥离寡核苷酸
聚合酶填补 + 连接酶

移除范围：~12–30 nt 片段

Direct

直接化学逆转

触发：可逆化学基团

修复蛋白直接接触损伤碱基
O⁶-甲基 G：甲基转到 Cys（自杀式）
1-甲基 A / 3-甲基 C：去甲基酶移除
无需切割骨架 / 无需重新合成

移除范围：1 个化学修饰

DNA修复

核苷酸切除修复与转录偶联确保重要基因优先修复

细胞优先修复正在转录的基因——转录偶联修复
RNA聚合酶在损伤处停滞→偶联蛋白引导NER机器到达
原核细胞（短基因）：
- 停滞的RNA聚合酶被解离
- 修复DNA后重新从头转录
真核细胞（长基因）：
- 更复杂的反应"回退"RNA聚合酶
- 修复损伤后重启聚合酶继续转录
Cockayne综合征：转录偶联修复缺陷
- 生长迟缓、骨骼异常、神经退行性变
- 严重的日光敏感

转录偶联修复 (TCR-NER) 四步机制

几种与 DNA 修复缺陷相关的遗传性综合征

DNA修复

DNA碱基的化学特性有利于损伤检测

每一种可能的脱氨基产物都是"非天然"碱基，容易被特异性糖苷酶识别
次黄嘌呤（腺嘌呤脱氨产物）→ 非天然，可识别
黄嘌呤（鸟嘌呤脱氨产物）→ 非天然，可识别
为什么DNA使用T而不是U？
- 如果DNA含U，无法区分天然U和C脱氨产生的U
- 使用T（5-甲基U）后，尿嘧啶DNA糖苷酶可安全移除DNA中所有U
5-甲基胞嘧啶的问题：
- 脊椎动物CG序列中约3%的C被甲基化
- 5-甲基C脱氨产生胸腺嘧啶(T)——天然碱基！
- 形成T-G错配，修复效率较低
- 虽然只有3%的C被甲基化，但贡献了约1/3的单碱基突变

DNA核苷酸脱氨基反应

DNA修复

特殊的跨损伤DNA聚合酶用于紧急情况

当DNA损伤过重，常规修复来不及处理时的最后手段
正常复制聚合酶在损伤处停滞
跨损伤聚合酶（translesion synthesis polymerase, TLS pol）可在受损DNA上继续复制
人类有7种跨损伤聚合酶
特点：
- 缺乏外切核酸酶校对功能
- 核苷酸选择性较低，比复制聚合酶精确度低
每种只添加1个或几个核苷酸后复制聚合酶重新接管
可能是大多数碱基替换和单核苷酸缺失突变的来源
严格调控至关重要——只能在损伤位点部署

跨损伤聚合酶部署模型

DNA修复

双链断裂被高效修复

双链断裂（DSB, Double-Strand Break）是最危险的损伤——没有完整模板链
原因：电离辐射、复制错误、氧化剂、细胞代谢产物
非同源末端连接（NHEJ, Non-Homologous End Joining）：
- 断裂末端直接拉拢并连接
- 通常导致连接处核苷酸丢失（突变）
- Ku异源二聚体抓住断裂的染色体末端
- 哺乳动物体细胞中占主导
- 70岁时典型体细胞含超过2000个NHEJ"疤痕"
同源重组修复：
- 利用姐妹染色单体作为修复模板
- 仅在S期和G2期可用
- 精确恢复原始DNA序列，无突变
NHEJ的危险：可能连接原本不相邻的末端→染色体重排

双链断裂的两种修复方式

NHEJ 机制：Ku 异源二聚体识别断裂末端 → DNA-PK 招募 → 直接连接

DNA修复

DNA损伤延迟细胞周期进程

真核细胞额外保障——DNA 损伤检查点暂停细胞周期直到修复完成，同时上调修复酶表达
三个主要检查点：G1/S（阻止进入复制）、S 期内（减慢合成）、G2/M（阻止进入分裂）
两个核心损伤感受器（PIKK 激酶）：
- ATM：感知 DSB，由 MRN 复合物在断裂处激活
- ATR：感知 RPA 包覆的 ssDNA（复制压力、停滞复制叉）
下游：ATM → CHK2、ATR → CHK1 → 磷酸化 Cdc25 暂停 CDK，激活 p53 触发阻滞 / 凋亡
共济失调-毛细血管扩张症（AT）：ATM 双等位失活 → 小脑共济失调、放疗超敏、淋巴瘤 / 白血病易感性显著升高

DNA 损伤检查点：感知 → 信号 → 阻滞 → 结局

DNA修复

小节总结 — DNA修复

1. 自发性损伤：DNA每天遭受大量自发性损伤（脱嘌呤~18,000次/天、脱氨基~100次/天、氧化损伤、环境因素），但修复系统将永久突变率控制在极低水平。

2. 修复依赖互补链：DNA双螺旋携带两份信息拷贝，使精确修复成为可能——这是所有生物使用双链DNA的根本原因。

3. 三种修复策略：碱基切除修复(BER)修复单碱基损伤；核苷酸切除修复(NER)修复大体积扭曲损伤；直接化学逆转处理特定甲基化损伤。

4. 跨损伤聚合酶：紧急情况下的最后手段，精确度低但可绕过无法及时修复的损伤。

5. 双链断裂修复：NHEJ快速但不精确（产生突变）；同源重组精确但需要姐妹染色单体（限于S/G2期）。

6. 细胞周期检查点：ATM 感知 DSB、ATR 感知 ssDNA / 复制压力 → 激活 CHK2 / CHK1 → 暂停细胞周期 + 触发 p53。修复基因缺陷 → 遗传性癌症易感综合征（AT、XP、Lynch、BRCA1/2）。

Section II

同源重组

HOMOLOGOUS RECOMBINATION

同源重组

同源重组在所有细胞中都有共同特征

同源重组最初作为减数分裂的组成部分被发现
随后在大肠杆菌和酵母中发现了相关的生化机制
这些蛋白的近缘同源物存在于果蝇、小鼠和人类中
催化同源重组的基本过程在所有细胞中是相同的
同源重组是理解DNA修复、减数分裂遗传多样性的核心

同源重组跨物种保守性：RecA / Rad51 核心机制

同源重组

碱基配对引导同源重组

同源重组需要两个DNA双链之间有大段序列相似性（同源性）
碱基配对是同源性搜索的基础：一条单链与另一个双链的互补链配对
DNA复性（杂交）过程：
- ① 缓慢的螺旋核化步骤（随机碰撞）
- ② 快速的"拉链式"延伸最大化碱基配对
产生的分子称为异源双链体(heteroduplex)——同源重组的核心中间体
体内同源重组受到精确调控：两条双链DNA可以相互"试探"而不完全解离

DNA杂交过程

同源重组

同源重组可以无误地修复DNA双链断裂

与NHEJ不同，同源重组修复不丢失、不改变核苷酸
需要附近有同源的完整DNA作为模板——通常是姐妹染色单体
修复步骤（"链之舞"）：
- ① 末端切除：核酸酶切除5'端→暴露3'单链突出端
- ② 链交换/链入侵：3'单链搜索同源双链并以碱基配对方式入侵
- ③ DNA合成：以完整模板为基础延伸入侵链
- ④ 链置换、进一步修复合成和连接→恢复两条原始双链
利用来自另一条双链的互补链——这是与其他修复不同之处

同源重组修复双链断裂的机制

同源重组

链交换由RecA/Rad51蛋白执行

RecA（大肠杆菌）和Rad51（真核生物）催化链交换反应
RecA与入侵单链协同结合→形成蛋白-DNA丝状体
丝状体中DNA呈独特构型：
- 每3个相邻核苷酸保持螺旋构型
- 三联体之间骨架解旋并拉长
丝状体与双链DNA结合并使其去稳定化
单链以三联体核苷酸为单位"试探"双链序列同源性
至少需要15个核苷酸的配对才能稳定链交换
RecA需ATP结合进行搜索，ATP水解仅用于蛋白解离

RecA催化的链入侵

同源重组

同源重组可以拯救断裂的DNA复制叉

可能是同源重组最重要的功能：拯救停滞或断裂的复制叉
场景：亲代双螺旋在复制叉前方存在单链切口
当复制叉到达切口时→复制叉崩溃
产生一个断裂的和一个完整的子代染色体
断裂的复制叉通过同源重组反应无误修复
使用的基本反应与双链断裂修复相同
这些反应的组合可以修复多种不同类型的DNA损伤

同源重组修复断裂的复制叉

同源重组

细胞精确调控同源重组在DNA修复中的使用

HR 是最精确的修复方式（可拯救复制叉、无误修复 DSB），但若失控代价极大 —— 因此细胞必须严格规定 HR "何时启用、用什么模板、招谁来做"
核心风险：若误用同源染色体（而非姐妹染色单体）作模板 → 原本"好/坏"的杂合状态会被改写成"坏/坏"的纯合状态，即杂合性丢失（LOH, Loss of Heterozygosity） —— LOH 可在多类基因座引发疾病（见下表）
三层调控机制：
- ① 时间：末端切除核酸酶仅在 S / G2 期被 CDK 磷酸化激活 → 保证姐妹染色单体可用
- ② 空间：损伤处招募 Rad51、Rad52 等聚集形成"修复工厂"，反应集中、副反应少
- ③ 蛋白控制：BRCA1（早期决策末端切除 vs NHEJ）+ BRCA2（递送 Rad51 到损伤处并激活）+ Rad52（链交换辅助）
失衡 = 致癌：HR 过少（BRCA1/2 突变）→ DSB 被 NHEJ 错修 → 基因组不稳定；HR 过多 → 染色体异常重排
- BRCA1/2 突变 → 乳腺癌 / 卵巢癌终身风险升至 60–80%
- → 后续 PARP 抑制剂"合成致死"策略正建立在此调控失衡之上

HR 三层调控闸门：时间 + 空间 + 蛋白

LOH 在不同基因座上的后果

受影响基因类型	LOH 后果	临床例 / 意义
抑癌基因	残存"好"拷贝丢失 → 蛋白功能完全丧失	RB（视网膜母细胞瘤）、TP53、BRCA1/2、APC
隐性遗传病基因（杂合携带者）	"杂合无症状"在体细胞水平变成"纯合显病"	体细胞镶嵌型病灶；某些代谢病在特定组织发病
印记基因 (imprinted genes)	仅父或母方表达，丢失活跃那条 → 表达归零	Beckwith-Wiedemann 综合征、Wilms 肿瘤、肾母细胞瘤过度生长
HLA / MHC 等位基因	肿瘤细胞丢失 HLA → 抗原呈递失效 → 免疫逃逸	免疫检查点抑制剂耐药、肿瘤免疫治疗失败
剂量敏感基因	表达量减半 → 单倍剂量不足（haploinsufficiency）	部分发育异常、神经/血液病

同源重组

背景回顾：有丝分裂 vs 减数分裂

有丝分裂（Mitosis） · 体细胞

1 次复制 + 1 次分裂 → 2 个子细胞
子细胞与母细胞遗传完全一致（2n → 2n）
分裂时姐妹染色单体在着丝粒处分离
同源染色体各自行动，不配对
HR 用于修复偶发 DSB，模板 = 姐妹染色单体（防 LOH）
遗传后果：克隆性增殖，维持组织稳态

减数分裂（Meiosis） · 生殖细胞

1 次复制 + 2 次分裂 → 4 个配子
染色体数减半（2n → n），DNA 量 4c → c
Meiosis I（前期 I 含 pachytene）：同源染色体配对 + HR 交叉互换 → 同源染色体分离
Meiosis II：姐妹染色单体分离（类似有丝分裂）
HR 由 Spo11 程序性 DSB 启动，模板 = 同源染色体（产生多样性）
遗传后果：遗传多样性 + 染色体正确分离

关键概念	有丝分裂语境	减数分裂语境
姐妹染色单体	S 期产生，分裂前期共同存在；分裂时分离	在 Meiosis II 才分离（贯穿 Meiosis I）
同源染色体配对	不发生（独立分裂）	必须配对（前期 I），形成 bivalent / tetrad
HR 模板选择	姐妹染色单体（防 LOH）	同源染色体（要多样性）
染色体数变化	2n → 2n（不变）	2n → n（减半）

同源重组

同源重组对减数分裂至关重要

在有性生殖生物中，同源重组是减数分裂不可或缺的部分
产生染色体交叉互换(crossing-over)：
- 两条同源染色体交换片段
- 生成含有父本和母本基因的混合染色体
产生基因转换(gene conversion)：一条同源染色体的短DNA片段复制到另一条上
两种结果都由与双链断裂修复类似的机制产生
减数分裂重组是产生遗传多样性的关键机制

减数分裂中的染色体交叉互换

概念辨析：减数分裂 HR vs 体细胞 HR 修复（同一机制，两种用途）

维度	减数分裂中的同源重组	体细胞同源重组修复
触发	Spo11 主动制造 DSB（程序性）	偶发 DNA 损伤（被动响应）
配对模板	同源染色体（父-母两条）	姐妹染色单体（自我克隆）
时机	减数分裂前期 I（pachytene）	S / G2 期（必须有姐妹染色单体）
频率	每条染色体强制 ≥1 次（保证正确分离）	损伤事件触发，按需进行
主要结果	交叉互换 + 基因转换 → 遗传多样性	精确复原原始序列 → 无 LOH
关键蛋白	Spo11、Dmc1（减数分裂特异）+ Rad51	Rad51、BRCA1 / BRCA2、RPA、MRN
失败后果	染色体不分离 → 三体 / 不育	DSB 累积 → 凋亡 / 染色体不稳定 / 癌症

同源重组

减数分裂重组始于程序性双链断裂

减数分裂重组始于Spo11蛋白有意造成的双链断裂
Spo11与断裂的DNA共价结合（类似拓扑异构酶）
专化核酸酶（含Mre11复合物）迅速降解与Spo11结合的末端
留下突出的3'单链末端
与DSB修复使用许多相同的重组蛋白
但减数分裂特异性蛋白使这些反应方向不同：
- 优先与母本和父本同源染色体配对
- 而非完全相同的姐妹染色单体

减数分裂同源重组产生交叉互换

概念辨析：同源染色体 vs 姐妹染色单体

维度	同源染色体（homologs）	姐妹染色单体（sister chromatids）
来源	一条来自母方、一条来自父方	S 期复制同一条染色体产生的两份拷贝
等位基因	基因座相同，等位基因可能不同（如 A vs a）	完全相同（仅复制错误造成极个别差异）
物理结构	独立两条染色体，平时不相连	在着丝粒处相连，呈 X 形
HR 模板用途	减数分裂中故意使用 → 交叉互换 → 遗传多样性	体细胞 HR 修复的标准模板 → 精确复原，避免 LOH

同源重组

减数分裂中形成Holliday交叉

出现时机：HR 反应中 3' 单链侵入同源双链（链入侵）之后，两条 DNA 双链在交叉点物理"桥接"形成的中间体 —— 1964 年 Robin Holliday 首次提出
生物学意义：
- 把两条原本独立的 DNA 双链物理连接，是 HR 中"链交换"的可视证据
- 减数分裂前期 I 显微镜下的交叉（chiasmata），对应的就是 Holliday 交叉
- 后续如何"剪开"（resolution）决定结果：交叉互换 vs 非交叉互换 —— 是遗传多样性的分子源头
- 不能正常解开 → DNA 缠结 → 染色体分离失败 → 细胞死亡
Holliday交叉（交叉链交换）可采取多种构象；蛋白质稳定其开放对称异构体
蛋白质催化分支迁移(branch migration)：
- DNA 在交叉点中被"滚轴式"推进
- 打断和重新形成碱基对，需要 ATP 水解
扩展异源双链体区域，可从原始断裂点迁移数千个核苷酸
Holliday 交叉通常成对出现→双 Holliday 交叉（dHJ）
大肠杆菌中：RuvA 四聚体 + RuvB 六聚体协同驱动分支迁移

Holliday 交叉结构与分支迁移

RuvA / RuvB 驱动 Holliday 交叉分支迁移

同源重组

同源重组在减数分裂中产生交叉互换和非交叉互换

减数分裂同源重组的两种结果：
非交叉互换 (~90%)：
- 双链分离，仅在断裂位点附近有异源双链体区域
- 染色体基本不变
交叉互换 (~10%)：
- 双Holliday交叉被专化酶切割
- 交换两条染色体的上下游部分
交叉互换干涉：一个交叉互换抑制附近形成新的交叉互换
确保交叉互换在染色体上均匀分布
每条染色体每次减数分裂至少1个交叉互换（通常每臂约1个）
非交叉互换产生散在的基因转换位点

减数分裂中形成的异源双链体

同源重组

小节总结 — 同源重组

1. 碱基配对引导：同源重组需要DNA双链之间有大段序列同源性，通过碱基配对"试探"和识别同源序列，形成异源双链体。

2. 精确修复DSB：同源重组利用姐妹染色单体作为模板，无误修复双链断裂（末端切除→链入侵→DNA合成→恢复），也能拯救断裂的复制叉。

3. RecA/Rad51蛋白：核心催化蛋白，形成蛋白-DNA丝状体，以三联体核苷酸为单位搜索同源性，需≥15 nt配对稳定链交换。

4. 三层调控：HR 限于 S/G2 期（时间），损伤处聚集形成"修复工厂"（空间），BRCA1/2 + Rad51 协同（蛋白）——共同防止误用同源染色体导致 LOH 致癌；BRCA 突变 → PARP 合成致死的临床基础。

5. 同一机制，两种用途：体细胞 HR 修复用姐妹染色单体（防 LOH），减数分裂 HR 用同源染色体（产生多样性）；后者由 Spo11 程序性 DSB 启动，经 Holliday 交叉解析为 ~10% 交叉互换 + ~90% 非交叉互换（伴随局部基因转换）。

Section III

转座与保守性位点特异性重组

TRANSPOSITION AND CONSERVATIVE SITE-SPECIFIC RECOMBINATION

转座与保守性位点特异性重组

通过转座，可移动遗传元件可插入任何DNA序列

基因组从不是一份"静态蓝图"——人类基因组中近一半的序列源自能在染色体间跳跃的"可移动遗传元件"，由 Barbara McClintock 1940 年代在玉米中首次发现（1983 诺奖），是细菌耐药传播、人类某些遗传病、CRISPR 编辑等的分子基础
不同于同源重组——转座不需要序列同源性
通过转座移动的元件称为转座子（transposons）
转座子自身编码转座酶（transposase），作用于转座子两端的特异性DNA序列
大多数转座子对靶位点只有适度的选择性
细菌中转座频率约每10⁵次细胞分裂一次
三大类转座元件：
- ① 纯DNA转座子
- ② 逆转录病毒样逆转座子
- ③ 非逆转录病毒逆转座子
人类基因组近一半可追溯到这些元件
大多数现在是不活跃的"分子化石"

三大类转座元件

转座与保守性位点特异性重组

纯DNA转座子通过剪切-粘贴机制移动

纯DNA转座子运动过程中始终以DNA形式存在
在细菌中占主导，主要负责抗生素抗性基因传播（青霉素、四环素等）
剪切-粘贴转座：
- 转座子从原位点被切除
- 插入到新的基因组位点
插入位点产生短的靶序列重复（target site duplication, TSD）——转座子的"签名"
- 机制：转座酶错开切割靶 DNA 两条链（如 4–9 bp 间距）→ 留下单链突出 → 转座子插入后宿主修复填补 → 原靶序列在两侧各复制一份
- 长度因转座子家族而定（IS1 / Tn5 / Tn10：9 bp；Tn3：5 bp；Alu / LINE-1：~4–20 bp）—— 即使转座子序列退化，TSD 仍可识别古老插入事件
切除后留下的"洞"可通过同源重组或NHEJ修复
同一切除机制被脊椎动物"驯化"用于免疫系统中的 V(D)J 重组
- 淋巴细胞通过随机拼接基因片段，从有限片段库组合出海量抗体 / T 细胞受体多样性
- 这一切除-拼接反应与转座酶共享分子机制 → 暗示适应性免疫系统起源于一次古老转座子的"驯化"

三类细菌纯 DNA 转座子结构

螺旋转座子（helitron）的转座机制——一类纯DNA转座子

转座与保守性位点特异性重组

某些病毒利用转座机制整合到宿主染色体中

某些病毒本质上是利用转座机制的可移动遗传元件
逆转录病毒（包括HIV/AIDS病毒）：
- 基因组为单链RNA
- 蛋白质衣壳中含有逆转录酶
生活周期：
- ① 病毒RNA进入细胞
- ② 逆转录酶将RNA转变为双链DNA
- ③ 病毒编码的整合酶将DNA插入宿主染色体
- ④ 宿主机器转录→翻译→组装新病毒颗粒
整合酶的机制与纯DNA转座子的转座酶类似

逆转录病毒生活周期

转座与保守性位点特异性重组

逆转录病毒样逆转座子类似逆转录病毒但缺乏蛋白外壳

LTR retrotransposon（长末端重复逆转座子）：两端各有一段 ~250–1500 bp 的长末端重复序列（LTR），内含启动子与整合信号
存在于酵母、果蝇和哺乳动物；移动机制与逆转录病毒相似，但不能离开细胞——缺乏 env 蛋白，无法形成病毒颗粒
转座过程（复制-粘贴）：
- ① 5' LTR 启动子驱动转录为 RNA
- ② RNA 翻译产生逆转录酶，合成双链 DNA 拷贝
- ③ 整合酶将 DNA 拷贝插入基因组新位点（机制与 DNA 转座酶类似）
原始拷贝保留不动，插入完成后拷贝数净增加一个

逆转座子 vs. 逆转录病毒：env 基因决定细胞外感染能力

转座与保守性位点特异性重组

人类基因组很大一部分由非逆转录病毒逆转座子构成

非 LTR retrotransposon：两端没有 LTR；整合机制为 TPRT（靶位点引物逆转录）——在目标位点切口后原位逆转录，不需要整合酶
LINE（L1 元件）——自主型，自带逆转录酶：
- 人类基因组约 ~50 万个拷贝，部分仍有活性
- 插入可致病（如因子 VIII 基因突变 → 血友病）
SINE（Alu 元件）——非自主型，"借用" LINE 的逆转录酶：
- 人类基因组 ~100 万个拷贝，占基因组约 13%
- 仍保持微弱活性，每 100–200 次出生出现一次新插入
LINE + SINE 合计占人类基因组超过 30%；多数已突变失活成"分子化石"

L1 非 LTR 逆转座子转座机制

转座与保守性位点特异性重组

LTR 逆转座子 vs 非 LTR 逆转座子：特征对比

特征	LTR retrotransposon	非 LTR retrotransposon（LINE / SINE）
结构特征	两端各有 LTR（250–1500 bp） 5' LTR – gag – pol – 3' LTR	无 LTR；含内部启动子 5'UTR – ORF1 – ORF2 – polyA 尾
整合机制	整合酶切割插入类似 DNA 转座酶的切-粘机制	TPRT（靶位点引物逆转录）切口 3'-OH 作引物，原位逆转录
自主性	自主型（编码 gag + pol）	LINE 自主；SINE 非自主（借用 LINE 的酶）
典型代表	酵母 Ty1/Ty3；果蝇 copia/gypsy；人类 HERV（内源逆转录病毒）	LINE-1（L1）；Alu（SINE）；SVA
人类基因组占比	~8%（主要为 HERV 化石）	~30%（LINE ~21%，SINE ~13%）
与逆转录病毒关系	结构高度相似，差异仅在缺乏 env 基因→ 不能出胞	与逆转录病毒无直接结构同源，进化起源独立
当前活性	多数沉默（HERV 已失活）	LINE-1 / Alu 仍有微弱活性；每代贡献少量新插入突变

转座与保守性位点特异性重组

不同生物中转座元件的类型和分布不同

原核细胞：主要是纯DNA转座子
酵母：主要是逆转录病毒样逆转座子
果蝇：三种类型都有（DNA型、逆转录病毒型、非逆转录病毒型）
人类基因组：三种类型都有，但进化历史截然不同
各类转座子的相对丰度反映了不同生物的进化历程

转座元件跨物种分布：从细菌到人类，TE 占比与类型差异巨大

转座与保守性位点特异性重组

基因组序列揭示转座元件移动的大致时间

人类基因组含约300万个转座元件残迹——"化石记录"
纯DNA转座子：在人类/旧世界猴分化前（2500-3500万年前）活跃；如今因累积失活突变而沉寂
逆转录病毒样逆转座子：基因组中遍布残迹；目前似乎无活跃元件
非逆转录病毒逆转座子：古老但部分仍活跃
- Alu元件新移动约每100-200次出生一次
- 贡献约2/1000的新突变
在小鼠中两类逆转座子仍活跃转座（~10%的新突变）
转座子爆发性活动可能驱动了~1.7亿年前哺乳动物辐射性分化

人类基因组 TE 进化时间线：DNA转座子已沉默，Alu/L1 至今仍活跃

转座与保守性位点特异性重组

保守性位点特异性重组可以可逆地重排DNA

与转座不同的机制：断裂和连接发生在两个特定识别序列上
根据位点的方向和位置，可产生三种结果：
- DNA整合
- DNA切除
- DNA倒位
由专化重组酶执行——类似拓扑异构酶
重组酶与DNA形成瞬时共价键，利用储存的磷酸键能量完成重排
"保守性"含义：所有磷酸键被恢复，无能量净损失
可逆：同一酶系统可以整合DNA，也可以切除DNA
DNA病毒用此机制将基因组移入/移出宿主染色体
与转座的关键区别：
- 需要供体和受体DNA上都有特定序列
- 通过共价蛋白-DNA中间体而非留下缺口

保守性位点特异性重组的两种DNA重排类型

转座与保守性位点特异性重组

保守性位点特异性重组可用于开关基因

经典例子：沙门氏菌的相位变异(phase variation)
一段含启动子的~1000 bp DNA片段可被位点特异性重组酶倒位
正向时：
- 启动子驱动H2鞭毛蛋白基因表达
- 同时表达H1鞭毛蛋白抑制子
反向时：H2和抑制子不表达；H1鞭毛蛋白被表达
切换频率约每10⁵次细胞分裂一次
整个菌落只表达一种类型
生物学意义：帮助细菌逃避宿主免疫应答——针对一种鞭毛蛋白的抗体对切换后的细菌无效

沙门氏菌中通过DNA倒位切换基因表达

转座与保守性位点特异性重组

细菌保守性重组酶成为细胞和发育生物学的强大工具

Cre重组酶（来自噬菌体P1）+ LoxP位点：广泛使用的遗传工程工具
用途：在多细胞生物的特定组织中删除特定基因（条件性敲除）
原理：
- ① Cre重组酶基因置于组织特异性启动子下
- ② 目标基因两侧插入LoxP位点（"floxed"）
- ③ Cre仅在特定组织表达时才切除目标基因
例如：Cre在肝脏特异性启动子控制下→仅在肝脏中删除基因
也可用于通过连接强启动子到基因来激活基因表达
特别有用场景：基因在早期发育中必需
- 全身敲除致死
- 组织特异性删除允许研究基因在特定环境和时间点的功能

Cre/LoxP条件性基因删除

转座与保守性位点特异性重组

小节总结 — 转座与保守性位点特异性重组

1. 可移动遗传元件：人类基因组近一半源自可"跳跃"的可移动遗传元件，由 Barbara McClintock 1940 年代在玉米中首次发现（1983 诺奖）。它们通过转座或保守性位点特异性重组移动；插入位点产生短的靶序列重复（TSD）—— 转座的"分子签名"。

2. 三类转座子：① 纯 DNA 转座子（剪切-粘贴）；② LTR 逆转座子（逆转录病毒样） —— 两端长重复 + 整合酶；③ 非 LTR 逆转座子（LINE / SINE） —— 内部启动子 + 靶位点引物逆转录（TPRT）。前两类与病毒有密切的进化关系。

3. 保守性位点特异性重组：需要两个特定识别序列，通过重组酶（类似拓扑异构酶）实现 DNA 整合、切除或倒位 —— 可逆且不损失磷酸键能量。

4. 应用：沙门氏菌相位变异展示了位点特异性重组的生物学功能（免疫逃逸）；Cre / LoxP 系统被广泛用于条件性基因敲除 —— 现代遗传学的强大工具。

5. 进化"驯化"案例：脊椎动物 V(D)J 重组（适应性免疫）由古老转座子被驯化而来；端粒酶反转录酶、胎盘合胞素 syncytin 等同样源于古老 TE —— 是分子进化的"创意供应商"。

6. 双重视角：TE 在分子层面是"自私 DNA"（自私的复制单元，多数被宿主沉默）；但其偶发"驯化"为脊椎动物提供了革命性蛋白创新，并是细菌耐药跨菌株传播、人类某些遗传病、CRISPR 工具的分子基础。

Section IV

DNA修复相关药物开发案例

From DNA Damage Response to Therapeutic Targeting

药物开发案例

Cisplatin / Carboplatin：铂类药物引发交联损伤，迫使NER激活

中文药名：顺铂 / 卡铂
损伤类型：铂与嘌呤 N7 位共价结合 → 链内交联（1,2-d(GpG)，~65%）+ 链间交联 ICL（~5%，毒性最强）→ 严重扭曲双链，阻断聚合酶
NER 的矛盾角色：NER 识别并切除链内交联加合物——这是顺铂耐药的主要机制（高 NER 活性 → 修得快 → 耐药）
凋亡如何发生？治疗剂量下损伤总量超过 NER 修复能力：
- 复制叉在 S 期遭遇未修复加合物 → 叉停滞 → DSB → ATR-CHK1 激活
- ICL 双链阻断 NER 无法处理 → 需 Fanconi 贫血通路 → 修复失败 → p53 激活 → 凋亡
肿瘤选择性窗口：肿瘤细胞增殖快 → S 期占比高 → 加合物尚未被 NER 修复即遭遇复制叉 → 比正常细胞更易凋亡
广泛用于肺癌、卵巢癌、睾丸癌等；睾丸癌治愈率高达 90% 以上
重点提示：顺铂不是"让NER工作从而杀死细胞"，而是"损伤量超过NER修复速度 → 复制叉碰撞 → 凋亡"

顺铂-DNA加合物与NER识别

课堂问题：为什么NER缺陷（如着色性干皮病）患者既对铂类高度敏感，同时又容易因未修复损伤发展为癌症？

药物开发案例

Temozolomide：烷基化损伤激活BER，MGMT甲基化决定疗效

中文药名：替莫唑胺；损伤谱：主要产生 N7-meG（~70%）、N3-meA（~10%）、O6-meG（~5%）
BER 的角色（非主要杀伤）：N7-meG / N3-meA 由糖苷酶切除进入 BER → 修复完成 → 细胞存活；BER 本身不致死
O⁶-meG 才是关键致死病灶（虽仅占 5%）：
- 若 MGMT 存在：直接逆转甲基化 → 损伤消除 → 耐药
- 若 MGMT 缺失（启动子甲基化）：复制时 O6-meG 偏好与 T 配对（而非正常的 C）→ MMR 识别 G:T 错配，切除新合成链上的 T → 重新合成时模板仍是未修复的 O6-meG → 再次插入 T → MMR 再次切除 → 如此反复：无效循环（futile cycle，即 MMR 反复切除却无法真正修复，因问题根源在模板链上而非新链）→ 持续单链缺口累积 → DSB → p53 → 凋亡
MGMT（O6-甲基鸟嘌呤-DNA甲基转移酶）：将 O6-meG 上的甲基直接转移到自身 Cys 残基，实现损伤逆转；每个 MGMT 分子只能工作一次（"自杀酶"），修复后不可再生
MGMT 启动子甲基化 → MGMT 基因沉默 → 蛋白表达缺失 → 无效循环得以进行 → 疗效大幅提升（胶质母细胞瘤一线伴随诊断）
重点：TMZ 的杀伤机制不是"BER修复失败"，而是"O⁶-meG 触发 MMR 无效循环 → DSB → 凋亡"；MGMT 是唯一能阻断这条路径的守门人

替莫唑胺作用与MGMT修复竞争

课堂问题：若肿瘤细胞MGMT启动子未甲基化，临床上应如何调整治疗策略？

药物开发案例

Olaparib / Niraparib：PARP抑制与合成致死策略

中文药名：奥拉帕利 / 尼拉帕利
作用环节：抑制PARP1/2介导的单链断裂BER修复
合成致死（Synthetic Lethality）：单独失活基因 A 或基因 B，细胞均可存活；同时失活两者才致死
- 为什么叫"synthetic（合成）"？A 缺陷单独存在时，不致死；B 缺陷单独存在时，也不致死——致死性在两者单独存在时根本不存在；只有把两者放在一起，才把这种致死性从无到有地"合成"出来。致死性本身是被创造出来的新性质，而非两个已有伤害的叠加
- 类比：一张桌子缺任意一条腿还能靠其他腿撑住；缺了两条特定的腿才会倒——"倒"是被这个组合合成出来的，不属于任何单条腿的固有属性
肿瘤细胞已先天损坏一条"备用修复路径"（如 BRCA1/2 突变，无法精确修复 DNA 双链断裂）
PARP 抑制剂再封掉"主修路径"（PARP 负责修补 DNA 单链断裂，不修则在复制时升级为双链断裂）
→ 肿瘤两条路径都断 → 选择性死亡；正常细胞备用路径完好 → 不受影响
已批准用于BRCA突变的卵巢癌、乳腺癌、前列腺癌等
重点提示："两条冗余修复路径互补"→ 靶向其中一条以杀伤缺失另一条的肿瘤细胞

PARP抑制与BRCA缺陷合成致死

课堂问题：合成致死策略在没有可靠生物标志物筛选患者的情况下，会面临哪些临床挑战？

药物开发案例

ATR / WEE1抑制剂：阻断DNA损伤检查点，强迫肿瘤进入死亡

中文药名：贝祖色替 Berzosertib（ATR抑制剂）/ AZD1775（WEE1抑制剂）
信号轴：DNA损伤 / 复制压力 → ATR（感知 RPA-ssDNA）→ CHK1 磷酸化 → WEE1 激活 → CDK1-Y15 磷酸化抑制 → G2/M 阻滞（细胞暂停等待修复）
正常细胞有双重保障：
- G1/S 检查点（p53 依赖）—— 第一道防线
- G2/M 检查点（ATR-WEE1 依赖）—— 第二道防线
p53 突变肿瘤的致命弱点：G1 检查点已失效 → 完全依赖 G2/M 检查点存活；抑制 ATR 或 WEE1 → CDK1 持续活跃 → 细胞强制带着未修复 DNA 进入有丝分裂 → 有丝分裂灾难（mitotic catastrophe）→ 死亡
为什么要联用 DNA 损伤剂？单独抑制 ATR/WEE1 时细胞内损伤量不足——仅靠正常复制压力难以触发足够强的致死信号；联用铂类、放疗等 → 先制造大量损伤 → ATR/WEE1 抑制剂再封锁唯一出路 → 协同杀伤
重点：这是一种利用肿瘤"检查点成瘾性"的策略——p53 缺失使肿瘤比正常细胞更依赖 ATR/WEE1 存活，形成治疗选择性窗口

ATR/WEE1抑制旁路DNA损伤检查点

课堂问题：为什么检查点抑制剂通常不作为单药使用，而需要与DNA损伤剂联合？

药物开发案例

Bleomycin（博来霉素）：直接产生 DSB，迫使细胞启动 HR / NHEJ 应答

作用机制：博来霉素–Fe²⁺ 复合物在 O₂ 存在下产生羟自由基（·OH），攻击脱氧核糖 C4'位氢原子 → 糖环断裂 → DNA 链切割；约 70% SSB + 30% DSB，且常在同一区域产生簇状损伤（clustered lesions）
特殊末端结构：断裂后产生 3'-磷酸乙醇酸（3'-phosphoglycolate）而非正常 3'-OH → 普通连接酶无法直接缝合 → 需 PNKP 或 Tdp1 等末端加工酶预处理后，才能进入 NHEJ / HR 主流程
为何能杀死肿瘤细胞？（与顺铂类似的悖论）
- DSB 是细胞最致死的损伤形式，而博来霉素产生的是大量簇状 DSB，难以被单次修复循环清除
- 超量损伤 → ATM 持续激活 → CHK2 → p53 → 细胞凋亡；修复能力不足以跟上损伤积累速率
修复通路选择：
- G1 期：无姐妹染色单体 → NHEJ 主导 → 错误连接风险高
- S/G2 期：HR 可发生 → 较精确；但快速增殖肿瘤细胞 HR 效率高 → 部分耐药
临床应用：ABVD方案（霍奇金淋巴瘤）；BEP方案（睾丸生殖细胞肿瘤）；累积剂量须 < 400 U 以避免肺纤维化
实验工具价值：博来霉素可在任意时间点精确触发 DSB，是研究 γH2AX 焦点形成、检查点激活和修复动力学的经典工具

博来霉素诱发DSB与修复激活

课堂问题：博来霉素所致的肺纤维化毒性与肺细胞的DNA修复能力有何关联？

药物开发案例

CRISPR-Cas9基因编辑（Casgevy）：利用HDR精准修复致病基因突变

技术类别：基于Cas9核酸酶的基因组编辑工具；Casgevy（2023年首个获批CRISPR疗法）
作用环节：sgRNA引导Cas9切割靶位点 → 诱导DSB → 借助HDR或NHEJ修复实现精准编辑
Cas9 可在任意细胞周期时相切割，但修复通路由切割时所处的细胞周期决定：
- G1 期（复制前）：无姐妹染色单体 → NHEJ 主导 → 产生随机插缺（indel）→ 基因敲除，无法精准改写
- S / G2 期（复制后）：姐妹染色单体可用 → HDR 可发生 → 配合外源供体模板实现精准序列替换
Casgevy 的解决方案：体外将造血干细胞同步至 S/G2 期后进行编辑，同时提供 AAV 递送的外源供体模板 → HDR 效率大幅提升 → 精准靶向 BCL11A 增强子 → 重新激活胎儿血红蛋白（HbF）
碱基编辑 / 先导编辑（Base / Prime Editing）：绕过 DSB，无需 HDR，不受细胞周期限制 → 未来非分裂细胞（如神经元）治疗的关键方向
重点：HDR 依赖 S/G2 期；在 G1 期切割只能得到 NHEJ 产物（敲除）。精准基因治疗的挑战之一就是如何在正确的时相完成编辑

CRISPR-Cas9切割与HDR精准修复

课堂问题：CRISPR编辑效率高度依赖HDR还是NHEJ修复通路——这与细胞周期和细胞类型有何关联？

药物开发案例

腺病毒载体（Gendicine / ONYX-015）：递送抑癌基因或选择性裂解p53缺陷细胞

技术类别：重组腺病毒（非整合型）作为基因递送载体或溶瘤病毒
Gendicine（重组人p53腺病毒）：2003年中国首批上市基因治疗药；腺病毒携带野生型p53基因，在头颈部肿瘤中恢复DDR通路功能
ONYX-015（dl1520）：缺失E1B-55kDa的溶瘤腺病毒，选择性在p53突变/缺失肿瘤细胞中复制并裂解细胞
p53是DNA损伤检查点的核心调节因子，腺病毒E1B-55K正常负责阻断p53功能
腺病毒载体容量大（≤36kb），可递送CRISPR成分或修复基因，但免疫原性相对较高
重点提示：腺病毒利用宿主DDR基因作为治疗靶点，是机制认知直接指导病毒改造的典型范例

腺病毒递送p53基因与溶瘤策略

课堂问题：溶瘤腺病毒ONYX-015在p53突变细胞中选择性复制的分子基础是什么？为何临床结果不如预期？

药物开发案例

小节总结 — DNA修复相关药物开发案例

1. 诱导损伤策略：顺铂/卡铂通过铂-DNA加合物过载NER通路；博来霉素直接产生DSB激活HR/NHEJ——均以"损伤积累超过修复阈值"为杀伤原理。

2. 修复靶向策略：替莫唑胺联合MGMT甲基化状态评估，首创分子分型指导治疗；奥拉帕利/尼拉帕利通过PARP抑制与BRCA缺陷形成合成致死，实现修复通路互补性的精准利用。

3. 检查点旁路策略：ATR/WEE1抑制剂（贝祖色替/AZD1775）利用p53缺陷肿瘤对S/G2检查点的绝对依赖，强制带损DNA细胞进入有丝分裂而死亡；与DNA损伤剂联用协同增效。

4. 基因组编辑与基因治疗：CRISPR-Cas9（Casgevy）借助内源HDR精准修正镰状细胞病致病突变；腺病毒载体Gendicine递送野生型p53恢复DDR功能，ONYX-015利用p53缺失选择性裂解肿瘤细胞。

5. 共同主线：七种药物均以DNA损伤应答（DDR）通路为核心靶点——从经典铂类化疗到PARP抑制剂合成致死再到CRISPR基因编辑，体现了DDR机制认知驱动药物创新的完整逻辑。

本讲总结

1. DNA修复：细胞通过BER、NER、直接逆转、跨损伤合成与DSB修复共同维持基因组稳定，检查点系统确保修复与细胞周期协调。

2. 同源重组：同源重组以碱基配对和链入侵为核心，既能精确修复双链断裂，也在减数分裂中产生遗传多样性。

3. 转座与位点特异性重组：可移动遗传元件深刻塑造基因组演化，保守性位点特异性重组机制也被发展为Cre/LoxP等关键遗传学工具。

Lecture 3

RNA 转录

RNA Transcription

Molecular Biology of the Cell

CHAPTER 6 How Cells Read the Genome: From DNA to Protein

从"图书馆"到"工厂"：信息流的下一步

Lecture 1：DNA 复制 → 保证遗传信息代代精准相传
Lecture 2：DNA 修复 + 重组 → 保证基因组不变质、可演化
但是 —— DNA 只是"图书馆的藏书"：不打开来读，对细胞毫无用处
转录（transcription）= 从基因组"图书馆"中复印出 RNA 工作册的第一步
- 读取的是基因组的"指定段落"，而不是全本
- 什么时候读、读哪段、读多少 —— 决定了细胞此刻"在做什么"
中心法则的第一个箭头：DNA → RNA
- 真核细胞还多一步：转录本要经过一系列加工（RNA processing）—— 加帽 / 剪接 / polyA —— 才能出核翻译
- 且部分基因的最终产物本身就是 RNA（非编码 RNA，下页展开）
同一份 DNA，不同细胞读出完全不同的"剧本" —— 神经元、肝细胞、免疫细胞用的是同一基因组的不同章节

本讲核心问题：细胞如何精确、可控、可调节地把 DNA 转换成 RNA？为什么真核细胞的转录如此复杂、还需要那么多加工步骤？

中心法则的第一步：DNA → RNA

RNA 远不只是 mRNA

人类基因组 ~80% 的序列会被转录 —— 但只有 ~1–2% 真正编码蛋白质
其余 RNA 各司其职，构成细胞功能的隐形支柱：
mRNA（信使）—— 编码蛋白质（< 2%）
rRNA（核糖体）—— 占细胞总 RNA 约 80%，构成核糖体大/小亚基
tRNA（转运）—— 翻译时把氨基酸送上核糖体
snRNA / snoRNA —— 剪接 + rRNA 化学修饰
miRNA / siRNA —— 调控基因表达（基因沉默）
lncRNA / circRNA —— 调控、骨架、海绵效应（许多功能仍在发现中）
"RNA 世界"假说：远古生命可能以 RNA 为信息载体 + 催化剂双重身份起源 —— 这一痕迹至今仍刻在剪接体、核糖体的活性中心里（Lecture 4 介绍）

教学要点："基因表达"远不止"做蛋白质"—— 大量 RNA 本身就是终产物，是细胞调控网络的核心。理解转录机制 = 理解整个细胞功能的"开关系统"。

RNA 是细胞中最多变的分子家族

转录已经改变了医学和生物技术

抗生素经典靶点：利福平（Rifampicin）抑制细菌 RNA 聚合酶 β 亚基 → 结核病一线药物，挽救上亿生命
化疗药物：放线菌素 D嵌入 DNA 阻断转录；用于肾母细胞瘤、横纹肌肉瘤等
表观靶向治疗：BET 抑制剂阻断超级增强子驱动的转录 → 治疗 MYC 驱动的恶性肿瘤
炎症 / 免疫调节：JAK 抑制剂（Ruxolitinib）阻断细胞因子 → STAT 转录响应 → 治疗骨髓增殖性疾病、湿疹
RNA 时代的精准疗法：
- mRNA 疫苗（BNT162b2 / mRNA-1273）—— 全球 COVID-19 流行中数十亿剂使用
- 反义寡核苷酸 ASO（Nusinersen）—— 矫正 SMN2 剪接，治疗婴儿型脊髓性肌萎缩症
- siRNA 药物（Patisiran）—— 沉默致病基因，治疗遗传性淀粉样变
研究新范式：RNA-seq、单细胞转录组、空间转录组 → 把"细胞表型"从形态学定义升级为分子表达谱定义

从这里出发：本讲的每一个机制（启动子识别、剪接、polyA、表观调控）都对应着至少一类已上市的药物或正在研发的疗法 —— 理解转录 = 理解 21 世纪药学创新的核心引擎。

mRNA 疫苗：转录生物学走入大众视野

本讲大纲点击条目可直接跳转

一、转录基础与调控

RNA分子是单链的
转录产生与DNA互补的RNA
RNA聚合酶执行转录
细胞产生不同类型的RNA
启动子与终止信号
转录起始/终止信号的多样性
真核转录起始需要多种蛋白
Pol II 与通用转录因子
激活子、Mediator 与染色质修饰
转录产生超螺旋张力
延伸与 RNA 加工的偶联

二、RNA加工与核内组织

5'加帽是 pre-mRNA 第一种修饰
RNA 剪接：移除内含子
剪接位点的核苷酸信号
剪接体执行 RNA 剪接
共转录剪接与外显子定义
剪接错误与人类疾病
mRNA 3'端加工
成熟 mRNA 的核输出
非编码 RNA 的加工
核仁与亚核聚集体

三、RNA转录相关
药物开发案例

Rifampicin（利福平）
Actinomycin D（放线菌素D）
JQ1 / OTX015（BET 溴域抑制剂）
Nusinersen（诺西那生钠）
AAV 基因疗法 / mRNA 药物
Patisiran / Inclisiran（siRNA）
ChAdOx1 / Gendicine（腺病毒载体）

Section I

转录基础与调控

Transcription Basics and Regulation

转录基础与调控

RNA分子是单链的

将DNA部分核苷酸序列（基因）复制为RNA核苷酸序列的过程称为转录
RNA与DNA的化学差异：
— 糖基为核糖（ribose），而非脱氧核糖
— 含尿嘧啶 U代替胸腺嘧啶 T
互补碱基配对规则：G-C、A-U（偶尔G可与U配对）
DNA在细胞中始终以双链螺旋存在；RNA则为单链
RNA单链可折叠成特定三维形状（类似蛋白质折叠）
某些RNA分子因此具有精确的结构功能和催化功能

尿嘧啶 vs 胸腺嘧啶

U-A碱基配对

RNA三维折叠结构

转录基础与调控

转录产生与DNA一条链互补的RNA

转录始于DNA双螺旋局部解旋，暴露碱基
DNA双链中一条链作为模板合成RNA
碱基配对规则：A配U、T配A、G配C、C配G
RNA链逐个核苷酸延伸，方向为5'→3'
与DNA复制不同：RNA链不保持与模板链的氢键结合
— RNA在合成后立即从DNA模板上释放
— DNA螺旋随即重新形成
RNA分子比DNA短得多：大多数RNA仅几千个核苷酸，DNA可达2.5亿碱基对

模板链、编码链与RNA转录本

转录基础与调控

RNA聚合酶执行转录

RNA聚合酶催化核苷酸间磷酸二酯键的形成
沿DNA逐步移动，在活性位点前方解旋DNA暴露模板链
RNA链沿5'→3'方向延伸，底物为核糖核苷三磷酸（ATP、CTP、UTP、GTP）
与DNA聚合酶的关键差异：
— 使用核糖核苷酸而非脱氧核糖核苷酸
— 无需引物即可起始RNA链
— 保真度较低（约每10⁴个核苷酸出1个错）
— 完全的持续合成性（processive）：同一酶分子从头合成到尾
速度约50个核苷酸/秒，同一基因可同时有多个RNA聚合酶转录
具有适度的校对机制：可后退并切除错误的核苷酸

转录泡结构

多个RNA聚合酶同时转录同一基因

转录基础与调控

细胞产生不同类型的RNA分子

mRNA（信使RNA）：编码蛋白质的氨基酸序列
非编码RNA：基因的最终产物即为RNA本身
— 酵母中>1200个基因（>15%）产生非编码RNA
— 人类约产生上万种非编码RNA
rRNA（核糖体RNA）：构成核糖体核心
tRNA（转运RNA）：选择并携带氨基酸到核糖体
snRNA（小核RNA）：指导pre-mRNA剪接
miRNA / siRNA：基因表达的关键调控因子
细胞RNA总量中，rRNA占绝大部分，mRNA仅占3-5%
每个细胞中某种mRNA平均仅10-15个拷贝

细胞内 RNA 主要类型及其功能

RNA类型	功能
mRNA	编码蛋白质
rRNA	核糖体结构与催化
tRNA	氨基酸转运适配器
snRNA	mRNA剪接
snoRNA	rRNA修饰
miRNA/siRNA	基因表达调控
piRNA	保护生殖系免受转座子
lncRNA	多种（正在发现中）

转录基础与调控

DNA信号告诉RNA聚合酶何处起始和终止

原核 RNA 聚合酶组成：核心酶（α₂ββ'ω）+ σ 因子 = 全酶（holoenzyme） —— σ 因子是启动子识别的关键
转录循环对应图示四个阶段：
- ① 启动子识别（initiation binding）：全酶沿 DNA "扫描" → σ 因子识别 -35 / -10 启动子序列 → 形成"封闭复合物"（DNA 未解链）
- ② 转录起始 / 转录泡形成：DNA 在启动子下游局部解链 12–14 bp → "开放复合物" → 开始合成 RNA；起始阶段（abortive initiation）常合成 2–9 nt 短转录本反复脱落
- ③ 启动子清除 + 延伸：合成约 10 nt 后聚合酶"挣脱"启动子 → 释放 σ 因子 → 核心酶进入延伸模式，沿 DNA 移动 ~50 nt/秒
- ④ 终止：终止子序列（A-T 富集 + 上游回文）→ 新合成 RNA 折叠成发卡结构（hairpin） → 牵动 RNA 从活性位点脱离；也存在 Rho 依赖性终止（Rho 蛋白追上聚合酶并解离 RNA）
四步循环完成后 → 核心酶游离 + σ 因子回到全酶启动下一轮，转录起始是基因表达调控的核心节点

原核细胞转录循环：起始 → 延伸 → 终止

转录基础与调控

转录起始和终止信号在核苷酸序列上是多样的

不同启动子序列差异显著——因为细胞需要对不同基因的表达水平进行精细调控
共有序列（consensus sequence）：统计多个启动子序列，取每个位置上出现频率最高的核苷酸，揭示保守骨架
E. coli 两个核心识别元件（由 σ⁷⁰ 因子识别）：
- -10 元件（Pribnow box）：共有序列 TATAAT，AT 富集→易解链形成转录泡
- -35 元件：共有序列 TTGACA，σ 因子与其结合介导初始识别
- 两者间距约 17 bp（可变 15–18 bp）；间距偏差 → 聚合酶结合不良 → 弱启动子
启动子强度由序列与共有序列的吻合程度决定：越接近共有序列 → 启动子越强 → 对应高丰度蛋白
不同 σ 因子识别不同共有序列（热休克 σ³²、鞭毛 σ²⁸ 等）→ 允许细菌在压力下快速切换基因表达程序
终止子序列更多样，共同机制是合成的 RNA 形成发卡结构导致聚合酶脱落

-35序列和-10序列；序列标志（sequence logo）

不同基因的转录方向

转录基础与调控

真核生物的转录起始需要许多蛋白质

真核细胞核含三种RNA聚合酶：
— RNA Pol I：转录rRNA基因（5.8S, 18S, 28S）
— RNA Pol II：转录所有蛋白编码基因及多种非编码RNA
— RNA Pol III：转录tRNA、5S rRNA等小RNA基因
与原核细胞仅需σ因子不同，真核RNA Pol II需要通用转录因子（general transcription factors）
真核转录还需在核小体和更高级染色质结构上进行

真核三类 RNA 聚合酶及其转录靶基因

聚合酶	转录基因类型
RNA Pol I	5.8S, 18S, 28S rRNA
RNA Pol II	蛋白编码基因 + 多种ncRNA
RNA Pol III	tRNA, 5S rRNA, 部分snRNA

原核与真核RNA聚合酶结构比较

转录基础与调控

RNA Pol II需要一套通用转录因子

通用转录因子（General Transcription Factors，GTFs）：TFIIA, TFIIB, TFIID, TFIIE, TFIIF, TFIIH
TFIID首先识别并结合TATA盒（TATA box）
— TATA盒位于转录起始点上游约25 nt
— TFIID的TBP（TATA-binding protein，TATA 结合蛋白）亚基负责识别TATA序列
— TBP结合导致DNA大幅弯曲（~80°）
其他核心启动子元件协同 TATA 共同定位 PIC（Pre-Initiation Complex，前起始复合体 = Pol II + 全套 GTFs 装配体）：
— BRE（TFIIB Recognition Element）：紧邻 TATA 上游（−37~−32），TFIIB 识别 → 锁定转录方向
— INR（Initiator，起始子）：跨越 +1（−2~+4），由 TAF1/2（TBP-Associated Factors，TFIID 的 TBP 相关亚基）识别 → 精确定位起始点
— DPE（Downstream Promoter Element）：起点下游 +28~+32，常见于TATA-less 启动子，与 INR 严格配对，由 TAF6/9（TFIID 异源二聚体亚基，类组蛋白折叠）识别
TFIIH是最复杂的通用转录因子（9个亚基）：
— 含DNA解旋酶活性，ATP水解解开DNA
— 含蛋白激酶活性，磷酸化RNA Pol II的CTD尾巴（Ser5位）
CTD（C-terminal domain）：人类RNA Pol II含52个七氨基酸串联重复
CTD磷酸化促使聚合酶离开启动子，进入延伸模式
大多数通用转录因子随后释放，可参与下一轮转录起始

RNA Pol II 前起始复合体（PIC）
的逐步组装

TFIIE → TFIIH 完成起始复合物组装

TBP 弯曲 TATA 盒 DNA

转录基础与调控

RNA Pol II还需要激活子、Mediator和染色质修饰蛋白

在体内（in vivo），转录起始除 GTFs 外还需要三类辅助系统：
转录激活子（activators）：
— 序列特异性结合 DNA 增强子（enhancer，常位于基因数 kb 甚至 Mb 之外）
— 通过 DNA 成环（looping）把远端调控信号带到启动子
— 招募 Mediator、组蛋白修饰酶、染色质重塑复合物
Mediator 复合物（~25–30 个亚基）：
— 充当激活子 ↔ Pol II / GTFs 之间的"桥梁与翻译器"
— 直接接触 Pol II CTD，影响 CTD 磷酸化与 PIC 稳定性
— 把多种激活信号整合为统一的转录输出
染色质重塑复合物（chromatin remodelers）—— ATP 依赖的"核小体推土机"：
— 利用 ATP 水解能滑动 / 弹出 / 重组核小体 → 暴露启动子 DNA
— 主要家族：SWI/SNF（弹出核小体）、ISWI（精细滑动）、CHD（去除/置换）、INO80（H2A.Z 组蛋白变体置换）
— 突变与癌症密切相关（如 SWI/SNF 在 20% 人类肿瘤中突变）
组蛋白修饰酶（histone modifiers）—— 在组蛋白尾巴写"表观密码"：
— HAT（Histone Acetyltransferase，乙酰转移酶）：H3K9ac / H3K27ac → 中和正电荷，松开染色质 → 活化
— HDAC（Histone Deacetylase，去乙酰化酶）：去除乙酰 → 染色质收紧 → 抑制
— HMT / HDM（甲基转移酶 / 去甲基酶）：H3K4me3 = 启动子活化标记；H3K27me3 / H3K9me3 = 沉默标记
— 修饰被「阅读器」蛋白（如 BRD4 的溴域读 H3K27ac）识别，进一步招募转录机器
三者协同 → 染色质从"紧密无法接触"切换到"开放可转录"状态
起始转录需组装超过 100 个亚基的蛋白质；组装顺序因基因而异，并非固定路径
释放 RNA Pol II 开始转录时，常需激活子蛋白的原位蛋白水解（"用完即拆"）

真核 RNA Pol II 转录起始的
完整调控复合体（体内）

转录基础与调控

转录产生超螺旋张力 (Transcription Creates Superhelical Tension)

DNA双螺旋约每10个碱基对转一个螺旋圈
如果DNA两端固定，每打开10 bp就会产生一个超螺旋（supercoil）
RNA聚合酶沿DNA移动时：
— 前方产生正超螺旋张力（DNA更难打开）
— 后方产生负超螺旋张力（促进核小体部分解包）
真核生物中，DNA拓扑异构酶快速消除超螺旋张力
细菌中专门的DNA旋转酶（gyrase）利用ATP泵入负超螺旋
— 使DNA螺旋解开更有利（促进转录起始）

正超螺旋 vs 负超螺旋；拓扑异构酶的作用

转录基础与调控

真核转录延伸与RNA加工紧密偶联

转录起始后，Pol II 离开启动子进入延伸（elongation）阶段，沿模板持续合成 RNA —— 此时真核细胞同步启动 mRNA 加工，"边转录边加工"
真核mRNA需要经过多步共转录加工（co-transcriptional processing）：
— 5'端加帽（capping）
— RNA剪接（splicing，移除内含子）
— 3'端切割和多聚腺苷酸化（polyadenylation）
CTD（C-terminal domain）磷酸化是偶联加工的关键策略：
— Pol II 离开启动子前，CTD 在 Ser5 位被 TFIIH 磷酸化 → 启动加帽
— 延伸过程中 CTD Ser2 位被 P-TEFb 磷酸化 → 招募剪接 + 3' 端加工因子
— 不同磷酸化模式 = 不同加工酶"乘车上下"的分子条形码
延伸模式的 RNA Pol II 可视为RNA 加工流水线工厂：
— 一边合成 RNA
— 一边把加工酶"挂在 CTD 上"实时处理 RNA
— 保证加工顺序正确、加工与转录速度匹配
CTD 完全伸展时长度约为 Pol II 其余部分的 10 倍，足以同时挂载多个加工因子

RNA Pol II CTD 偶联转录与 mRNA 共转录加工

CTD 尾巴与 RNA 加工因子

小节总结 — 转录基础与调控

1. 转录基本机制：RNA聚合酶以DNA为模板合成RNA，形成转录泡；转录方向5'→3'，模板链3'→5'方向读取；转录单位由启动子、转录区和终止子构成。

2. 转录起始信号：原核细胞σ因子识别-35/-10启动子元件，组装封闭复合物→开放复合物；真核TFIID识别TATA盒，通用转录因子逐步组装RNA Pol II前起始复合物。

3. 真核转录调控：激活子通过增强子远距离发挥作用；Mediator复合体传递信号至RNA Pol II；染色质修饰酶（HAT/HDAC）调控组蛋白乙酰化水平以开放或关闭染色质。

4. 转录延伸与偶联：RNA Pol II的CTD磷酸化将转录延伸与RNA加工（5'加帽、剪接、3'端加工）紧密偶联，确保mRNA成熟有序进行。

Section II

RNA加工与核内组织

RNA Processing and Nuclear Organization

RNA加工与核内组织

RNA加帽是真核pre-mRNA的第一种修饰

RNA Pol II合成约25个核苷酸后，5'端即被修饰
加帽由三种酶依次完成：
— 磷酸酶：去除5'端一个磷酸
— 鸟苷酰转移酶：添加GMP（反向5'→5'连接）
— 甲基转移酶：在鸟苷上加甲基
三种酶均结合在Ser5磷酸化的CTD尾巴上——定位精准
5'甲基帽的功能：
— 标识mRNA，区别于其他类型RNA
— 结合CBC（cap-binding complex），促进后续加工和出核
— 在翻译中发挥重要作用
RNA Pol I 和 III转录的RNA不加帽（无CTD）

7-甲基鸟苷帽

5' 帽反向三磷酸连接结构

RNA加工与核内组织

RNA剪接从pre-mRNA中移除内含子

真核基因的编码序列被内含子（intron）打断，编码区为外显子（exon）
内含子和外显子均被转录为RNA，随后内含子通过RNA剪接被移除
剪接通过两步转酯反应（transesterification）完成：
— 移除内含子形成"套索"（lariat）结构
— 连接两侧外显子
剪接机器极其复杂：5种RNA + 数百种蛋白质 + 大量ATP
内含子的进化优势：
— 促进外显子重排（exon shuffling），加速蛋白质进化
— 约95%的人类基因存在选择性剪接（alternative splicing）
— 同一基因可产生不同蛋白质，扩展基因组编码潜力

外显子-内含子结构

套索（lariat）中间体

选择性剪接示例

RNA加工与核内组织

核苷酸序列指示剪接位点

剪接机器需识别pre-mRNA上的三个位点：
— 5'剪接位点
— 3'剪接位点
— 内含子分支点（branch point，套索的基部）
每个位点都有共有序列（consensus sequence），但变异较大
内含子大小范围极广：约10 nt 到 >100,000 nt
选择性剪接使得仅从基因组序列预测蛋白序列变得困难
这是我们仍仅知道人类基因组编码蛋白质近似数目的主要原因之一

pre-mRNA 内含子三个剪接信号的共有序列

IUPAC 模糊代码： R = puRine（A/G） · Y = pYrimidine（C/U） · N = aNy（任意碱基）

RNA加工与核内组织

剪接体执行RNA剪接 (The Spliceosome)

五种 snRNA（small nuclear RNA，核内小 RNA）U1、U2、U4、U5、U6（均 < 200 nt）+ 蛋白质 = snRNP（核内小核糖核蛋白颗粒），构成剪接体核心
剪接体的 5 个动态阶段：
— E（Early/承诺）：U1 识别 5'SS；SF1（=酵母 BBP，分支点占位）+ U2AF（U2 Auxiliary Factor）标记分支点 A 和 3'SS
— A（前剪接体）：U2 取代 SF1，分支点 A "凸出"
— B（前催化）：U4/U6·U5 三联 snRNP 加入 → 五个 snRNP 集合
— B^act（激活）：RNA-RNA 重排 —— U1、U4 离开，U6 接管 5'SS、与 U2 配对形成催化中心（2× Mg²⁺）
— C（催化）：两步转酯反应 → 释放套索内含子 + 拼接外显子；剪接体解体，snRNPs 回收
识别主要靠 snRNA-pre-mRNA 碱基配对（U1↔5'SS、U2↔分支点、U5↔外显子边界）
剪接体是动态机器：DExD/H box 解旋酶水解 ATP 驱动每次重排，"重排即校验"保证准确性；每次剪接需 ~200 种蛋白
催化由 RNA 完成 → 剪接体本质是核酶（RNA 世界假说证据）
剪接后在外显子接缝上游 ~20-24 nt 沉积 EJC（Exon Junction Complex）—— "剪接历史标签"参与 mRNA 核输出、翻译增强、NMD（详见 Lec 4）

剪接体的逐步装配（snRNP 招募顺序）

RNA-RNA 重排驱动剪接体激活

RNA加工与核内组织

共转录剪接与外显子定义确保剪接准确性

剪接与转录的偶联（co-transcriptional splicing）：
— 剪接组分（U1/U2 snRNP、U2AF、SR 蛋白等）装载在 Pol II CTD（C-terminal domain，磷酸化的 "尾巴"，Ser2-P 模式）上 → 待新生 RNA 露出时直接"跳"到 RNA 上
— 5'剪接位点的snRNP最初只"看到"下一个3'剪接位点
外显子定义（exon definition）策略：
— 核心问题：人类内含子平均 ~3000 nt（最大 1 Mb），外显子仅 ~150 nt —— 剪接机器无法直接跨越巨大内含子识别两端
— 解决方案（Berget 1990s 假说）：先"框定"每个外显子（跨外显子识别 3'SS 和 5'SS，跨度小、容易），再跨内含子拼接相邻外显子
— 外显子大小相对均一（~150 nt）正是为了适配剪接机器跨度；蛋白大小靠外显子数量不同（3→ 数百个），不靠单个外显子变长
— SR 蛋白（Serine/Arginine-rich proteins，富含丝氨酸/精氨酸的剪接因子）结合外显子内 ESE（exonic splicing enhancer）→ 桥接两侧 U2AF / U1 → 标定外显子边界
— SR 蛋白与 hnRNP（结合外显子沉默子 ESS，抑制剪接）竞争性结合，共同决定哪些外显子被选用 → 选择性剪接 + ~10% 致病突变破坏外显子定义导致 exon skipping
染色质结构影响RNA剪接（"动力学耦合"模型）：
— 核小体（~147 bp DNA）尺寸恰好匹配外显子（~150 nt），优先定位在外显子上充当"减速带"
— Pol II 在外显子处暂停减速 → 给剪接机器更多时间识别弱剪接位点 → 倾向保留外显子；反之 Pol II 加速 → 外显子跳跃
— 特定组蛋白修饰是"剪接邮编"：H3K36me3（活跃转录外显子标记，由 SETD2 写入）被 MRG15 阅读 → 招募 PTB → 调控选择性剪接；H3K9me3 抑制剪接；DNA 甲基化和 CTCF 结合也参与定位
RNA剪接具有显著的可塑性——约10%致病突变导致异常剪接

人 / 线虫 / 果蝇基因组的内含子与外显子长度分布

外显子定义假说（exon definition hypothesis）

RNA加工与核内组织

剪接错误与人类疾病：剪接体准确性的失误

剪接体虽精密，但仍可能出错；约 10% 致病突变通过破坏剪接发挥作用
两类典型剪接错误：
— 外显子跳跃（exon skipping）：剪接位点被突变破坏 → 整个外显子被剪掉
— 隐藏剪接位点激活（cryptic splice site activation）：真正剪接位点失效后，剪接体被迫使用附近的"假"位点 —— 位于外显子内 → 外显子被部分截短；位于内含子内 → 部分内含子被错误保留
β-地中海贫血（β-thalassemia）经典案例：
— β-球蛋白基因内含子点突变 → 激活内含子内隐藏剪接位点
— 产生异常 mRNA → β-球蛋白合成减少或缺失 → 红细胞 Hb 不足 → 贫血
— 部分突变通过提前终止密码子触发 NMD 进一步降解 mRNA
其他典型剪接病：
— SMA（脊髓性肌萎缩，SMN2 外显子 7 跳跃，149 页 Nusinersen 靶点）
— DMD（杜氏肌营养不良，dystrophin 外显子跳跃，治疗策略为 ASO 强制跳跃突变外显子）
— 多种癌症（SF3B1、SRSF2、U2AF1 突变常见于 MDS / AML）
教学意义：剪接位点 + ESE/ESS 是基因组中"突变热点"——任何破坏剪接信号的突变都可能致病；这也催生了 ASO 等剪接调控类药物（Lec 3 药物章节）

剪接错误的两种类型

β地中海贫血中 β-球蛋白
pre-mRNA 的异常剪接

RNA加工与核内组织

RNA加工酶产生真核mRNA的3'端

RNA 上两个信号触发 3'端加工：上游 AAUAAA（poly-A 信号）+ 下游 GU/U 富集区
关键蛋白（搭载在 Pol II CTD Ser2-P 上，RNA 露出即跳到 RNA）：
— CPSF（Cleavage and Polyadenylation Specificity Factor）→ 识别 AAUAAA
— CstF（Cleavage Stimulation Factor）→ 识别 GU 富集区
— PAP（Poly-A Polymerase，多聚腺苷酸聚合酶）→ 加 A
三步骤：① CPSF + CstF 识别 → 在 CA 处切割 RNA；② PAP 无模板添加 ~200 个 A；③ PABP 结合 polyA 并"测量"尾巴长度
PABP（Poly-A Binding Protein，多聚腺苷酸结合蛋白）家族 —— 两种亚型分工：
— PABPN1（核内型）：在核内结合新生 polyA，每 ~10 个 A 装载一个 → 反馈抑制 PAP 控制尾巴长度 ~200 nt；伴随 mRNA 出核
— PABPC1（胞质型）：在胞质取代 PABPN1，每 ~25 个 A 装载一个 → 约 8 分子 / 尾巴
— 突变 PABPN1 → 眼咽肌营养不良（OPMD，polyA 中 GCG 异常扩展）
poly-A 尾巴三大功能（均依赖 PABP）：
— 稳定性：PABPC1 包裹 polyA → 阻止 3'→5' 外切酶（CCR4-NOT）；polyA 随时间逐渐缩短 = mRNA "衰老计"
— 翻译效率：PABPC1 ↔ eIF4G ↔ eIF4E ↔ 5'cap → 形成"闭环 mRNA" → 促进核糖体循环利用，~2-10× 翻译效率提升
— 核输出：成熟 polyA + PABPN1 是核输出复合物（TREX）的识别标签
3' 切割后下游 RNA 无 5' 帽保护 → CTD 携带的 Xrn2 5'→3' 外切核酸酶追击 Pol II → "鱼雷模型"撞落聚合酶 → 转录终止

真核 mRNA 3' 端切割与
多聚腺苷酸化

RNA加工与核内组织

成熟真核mRNA选择性地从细胞核输出

pre-mRNA 中仅小部分（成熟 mRNA）对细胞有用；其余（切除内含子、断裂 RNA、异常加工 RNA）潜在有害，必须扣留并销毁
hnRNP（heterogeneous nuclear ribonucleoprotein，异质性核糖核蛋白，约 20-30 种）—— 核内 RNA 的"通用管家"：
— 包装 pre-mRNA：转录刚出来即被包裹成 RNP 颗粒（类似 DNA 缠绕组蛋白）
— 调控剪接：结合 ESS/ISS 沉默子 → 与 SR 蛋白竞争决定外显子去留
— 滞留未加工 RNA：阻止其接近核孔
不合格 RNA 如何被扣留在核内（多层防御）：
— 通行证机制：只有齐备 5'cap + EJC + polyA 的 mRNA 才能招募 TREX 复合物 → NXF1 输出受体 → 通过 NPC（Nuclear Pore Complex，核孔复合物）；缺标签自然出不去
— 主动滞留：U1 snRNP 扣押未剪接 RNA；hnRNP 与核斑（speckle）滞留 retained-intron mRNA
— 主动降解：TRAMP 复合物给异常 RNA 加上短 oligo-A（~5 nt，与成熟 polyA 200 nt 完全不同）→ 喂给核外切体（nuclear exosome，3'→5' 外切核酸酶机器）彻底降解
NPC 是嵌在核膜上的巨型蛋白通道（~100 MDa，~30 种核孔蛋白 Nup 组成，8 重对称），通过中央 FG-repeat 凝胶过滤层实现选择性运输；mRNA 从核中扩散到核孔需几分钟，穿越核孔仅需数十毫秒
核中结合的蛋白（CBC、EJC、PABPN1 等）出核后被替换为胞质对应物（eIF4E、PABPC1 等），最终影响 mRNA 在胞质中的稳定性、翻译效率、定位

核外切体降解废弃 RNA

核孔复合物选择性出核

RNA加工与核内组织

非编码RNA也在细胞核中合成和加工

rRNA占细胞总RNA约80%（快速分裂细胞中）
rRNA基因以多拷贝串联重复排列（人类约200份，分布在5条染色体上）
四种真核rRNA：18S、5.8S、28S（由RNA Pol I转录的前体加工而来）+ 5S（由RNA Pol III单独转录）
13,000 nt的前体rRNA经广泛修饰后切割：
— 约100个2'-O-甲基化
— 约100个假尿苷化（uridine → pseudouridine）
修饰由snoRNA（小核仁RNA）指导：
— 通过碱基配对定位到前体rRNA的精确位点
— 与蛋白质形成snoRNP复合物，携带修饰酶
另一些snoRNA指导前体rRNA的切割加工
许多snoRNA编码在核糖体蛋白基因的内含子中

45S 前体 rRNA 加工

snoRNA 指导的化学修饰

RNA加工与核内组织

核仁是核糖体生产工厂

核仁（nucleolus）：光学显微镜下最显著的核内结构；无膜包裹，是大分子的巨大聚集体（液-液相分离形成）
核仁两大核心功能：rRNA 加工 + 核糖体亚基组装
人类二倍体细胞中：rRNA 基因分布在 5 对染色体末端的 10 个簇中；间期 10 条染色体 DNA 环贡献到核仁；M 期核仁消失
核仁大小反映细胞核糖体产量——可占核体积的 25%（高产细胞如肿瘤、增殖细胞核仁巨大）
核糖体亚基组装流水线（核仁是工厂）：
— ① 核仁内 Pol I 转录 45S 前体 rRNA → 切割为 18S + 5.8S + 28S；5S rRNA 由 Pol III 在核质转录后送入
— ② 约 80 种核糖体蛋白在胞质合成 → 经 NPC（importin 介导）输入核仁
— ③ rRNA + 蛋白 + snoRNP 修饰因子在核仁内组装出 pre-40S 小亚基前体和 pre-60S 大亚基前体
— ④ 两亚基分别经 NPC 出核（不组装在一起出核！）→ 胞质完成最终成熟
— ⑤ 大小亚基只在翻译启动时结合形成 80S → 防止核内意外翻译未成熟 mRNA
核仁也是其他 RNA-蛋白复合物的组装中心：端粒酶（TERC RNA + TERT 蛋白组装）、U6 snRNP、signal recognition particle (SRP) 等
除核仁外，细胞核内还存在多种无膜亚核聚集体（液-液相分离形成）：
— Cajal 体（卡哈尔体）：snRNP / snoRNP 最终成熟 + U4/U6 重装配
— Speckles（核斑）：成熟剪接因子储备库
— 共同构成核内"分区生化车间"，提高加工效率

核仁电镜照片（三区结构）

核糖体组装过程

RNA加工与核内组织

小节总结 — RNA加工与核内组织

1. 转录基础：RNA聚合酶利用DNA模板合成RNA，遵循碱基互补配对（A-U, G-C），沿5'→3'方向延伸，无需引物。

2. 原核细胞转录：单一RNA聚合酶 + σ因子识别启动子起始转录，RNA发卡结构作为终止信号。

3. 真核转录起始：三种RNA聚合酶（I, II, III）；Pol II需通用转录因子（TFIID/TBP识别TATA盒）、激活子、Mediator、染色质重塑复合物。

4. RNA加工三步曲：5'加帽（磷酸酶+鸟苷酰转移酶+甲基转移酶）→ RNA剪接（剪接体/spliceosome移除内含子）→ 3'多聚腺苷酸化（poly-A尾）。

5. 剪接体：由5种snRNA（U1-U6）和~200种蛋白质组成，RNA催化实际化学反应；通过多次RNA-RNA重排确保准确性；~95%人类基因存在选择性剪接。

6. 非编码RNA与核结构：rRNA占细胞RNA~80%，在核仁加工组装；Cajal体和"speckles"等亚核结构提供高效的加工/组装环境。成熟mRNA经核孔选择性出核。

Section III

RNA转录相关药物开发案例

From Transcription Mechanism to Therapeutic Intervention

药物开发案例

Rifampicin：靶向细菌RNA聚合酶β亚基，抗结核经典药

中文药名：利福平
作用环节：细菌RNA聚合酶（RNAP）β亚基结合口袋 → 阻断转录起始
与细菌RNAP β亚基高亲和力结合，阻断RNA链从约3nt开始的延伸
人类RNAP结构差异显著，利福平不能与真核RNAP结合 → 选择性极高
抗结核一线药物；也用于脑膜炎球菌预防；耐药性来源于β亚基突变
重点提示：细菌RNAP与真核RNAP的结构差异是抗菌药选择性设计的典型范例

利福平结合细菌RNAP β亚基

课堂问题：结核分枝杆菌中rpoB基因突变是最常见的利福平耐药机制，这对联合用药策略有何启示？

药物开发案例

Actinomycin D：嵌入GC位点，阻断转录延伸

中文药名：放线菌素D（更生霉素）
作用环节：嵌入DNA双链GC富集区域 → 阻断RNA聚合酶沿模板移动
放线菌素D的发色团嵌入碱基堆积，多肽链与DNA小沟共价结合
对转录的抑制强于对复制的抑制（低浓度时有选择性）
肾母细胞瘤、横纹肌肉瘤等少见儿科肿瘤的一线用药
重点提示：说明"转录延伸的可干预性"及浓度依赖的细胞毒机制

放线菌素D嵌入与转录阻断

课堂问题：放线菌素D既抑制转录又抑制复制，在研究中如何利用这一特性区分两种过程的贡献？

药物开发案例

BET溴域抑制剂（JQ1 / OTX015）：靶向超级增强子，沉默癌基因转录

中文药名：暂无上市中文名（JQ1为研究工具；OTX015/Birabresib进入临床）
作用环节：BRD4溴域与乙酰化组蛋白H4K5ac/H4K8ac结合 → 转录暂停释放受阻
BRD4占据超级增强子，通过P-TEFb释放RNAPII进入高效延伸状态
抑制BRD4 → MYC等原癌基因转录下调 → 多种血液和实体肿瘤增殖受抑
处于临床I/II期；MYC高扩增NMC（中线癌）、急性白血病等响应显著
重点提示：直接连接"组蛋白修饰-转录调控"知识与靶向治疗的新兴方向

BRD4抑制与超级增强子失活

课堂问题：MYC本身难以直接成药，BET抑制剂如何"间接靶向"MYC？这一策略有何局限？

药物开发案例

Nusinersen：反义寡核苷酸靶向pre-mRNA剪接，治疗脊髓性肌萎缩症

中文药名：诺西那生钠
药物类型：反义寡核苷酸（ASO, Antisense Oligonucleotide） —— 短单链化学修饰核酸，通过碱基配对调控靶 RNA
作用环节：靶向SMN2 pre-mRNA上的外显子跳跃调控序列（ISS-N1）
SMA患者SMN1缺失，SMN2因第7外显子被跳过而产生无功能蛋白
ASO阻断ISS-N1抑制序列 → 第7外显子纳入 → 功能性SMN蛋白恢复
首个FDA批准的SMA治疗药物（2016）；鞘内注射，效果持久
重点提示：直接将"转录后RNA剪接调控机制"与儿科罕见病精准治疗连接起来

ASO 反义寡核苷酸：结构与三种作用机制

Nusinersen 纠正 SMN2 外显子跳跃

课堂问题：同样靶向SMN2剪接，口服小分子Risdiplam与鞘内ASO Nusinersen在机制和患者依从性上有哪些差异？

药物开发案例

AAV基因疗法与mRNA药物：重新编写细胞转录输出

技术类别：AAV基因递送（持久转录）/ LNP-mRNA（直接引入成熟转录本）
作用环节（AAV）：病毒载体转导 → 功能基因在细胞核内持续转录 → 补充缺失蛋白
作用环节（mRNA）：LNP递送体外转录mRNA → 绕过转录步骤，直接在胞质翻译
Glybera（AAV1-LPL）首个基因治疗药；Zolgensma（SMA）；Luxturna（视网膜病变）
mRNA疫苗（COVID-19）、个性化肿瘤新抗原mRNA疫苗等正在快速发展
重点提示：启动子设计、增强子选择、内含子剪接优化是AAV疗法中"转录工程"的核心

AAV载体基因转录恢复

mRNA疫苗结构与递送

课堂问题：AAV疗法需要设计靶细胞特异性启动子，mRNA疗法则需要优化5'UTR与密码子——两者分别利用了转录与翻译调控的哪些原理？

药物开发案例

siRNA疗法（Patisiran / Inclisiran）：RNAi沉默靶mRNA，转录后精准调控

技术类别：化学合成双链siRNA经LNP或GalNAc递送 → RISC/Ago2切割靶mRNA → 阻断蛋白翻译
Patisiran（帕替司兰，2018年FDA批准）：首个批准的siRNA药；LNP递送至肝细胞，沉默TTR mRNA，治疗遗传性甲状腺素转运蛋白淀粉样变（hATTR）
Inclisiran（英克司兰）：GalNAc靶向肝细胞递送，沉默PCSK9 mRNA；每年2次皮下注射即可持续降低LDL胆固醇
siRNA选择性依赖种子序列碱基互补，设计不当可引发脱靶转录本降解
Givosiran（急性肝性卟啉症）、Lumasiran（原发性高草酸尿症）等也已获批
重点提示：siRNA直接利用细胞内源性RISC/RNAi机制，是将转录后调控原理转化为药物的里程碑

Inclisiran 治疗高胆固醇血症（GalNAc 偶联靶向肝细胞 PCSK9 mRNA）

siRNA / RISC 通用机制（Ago2 切割靶 mRNA）

课堂问题：GalNAc修饰的siRNA（Inclisiran）为何可以实现每年仅需注射2次的超长效维持？与LNP递送相比有何优劣？

药物开发案例

腺病毒载体（ChAdOx1 / Gendicine）：驱动目的基因高效转录

技术类别：重组腺病毒（dsDNA基因组，非整合）作为基因表达载体；在宿主细胞核内借助宿主RNA pol II高效转录目的基因
ChAdOx1（牛津/阿斯利康COVID-19疫苗）：黑猩猩腺病毒5型载体，携带SARS-CoV-2刺突蛋白基因；人体免疫系统对其预存免疫低，有效性高
Gendicine（今又生，2003年中国批准）：全球首个上市基因治疗药；重组腺病毒载入野生型p53 cDNA，注射至头颈部肿瘤，恢复p53转录调控功能
腺病毒载体优势：包装容量大（~36 kb）、高滴度生产、高感染效率；劣势：不整合、免疫原性强、单次有效期有限
腺病毒内置CMV/RSV启动子确保目的基因在宿主细胞中的高水平转录
重点提示：腺病毒载体的核心设计是"可控转录工程"：启动子选择、poly A信号、内含子插入均影响转录效率

腺病毒载体基因导入与核内转录

课堂问题：腺病毒载体不整合宿主基因组，目的基因的转录是否会持久？与AAV和逆转录病毒载体相比有何取舍？

承上回顾 · RNA 视角

转座元件中的 RNA 生物学 —— 回顾

为什么在此回顾：讲完转录、剪接、mRNA 加工、ASO/siRNA/AAV 等"RNA 生物学"后，再回看 Lec 2 转座那一节，会发现转座元件其实是 RNA 机制的"原型实验室"——它们利用宿主的 Pol II/Pol III、剪接、polyA、逆转录与整合，把"RNA→DNA"这条反向箭头玩到极致。

① LTR 逆转座子（类逆转录病毒）

结构：5′LTR — gag/pol — 3′LTR，LTR 内含 启动子 + polyA
转录：Pol II 从 5′LTR 启动 → 加帽、加 polyA → 出核
逆转录：RT 在胞质 RNA 模板上合成 dsDNA
整合：整合酶在染色质上插入 → 形成 TSD
例子：酵母 Ty1/Ty3、哺乳动物 ERV（内源逆转录病毒）

② 非 LTR 逆转座子（LINE / SINE）

LINE-1：自主，由 Pol II 转录；ORF2 编码自带 RT
SINE（如 Alu）：非自主，由 Pol III 转录（tRNA/7SL 来源的内部启动子）
逆转录在靶位点直接进行（TPRT 机制）→ 不需要先形成自由 dsDNA
截短 + 加 polyA 是其转录本特征 → 整合后基因组里留下 A 尾
人类 ~17% LINE-1 + ~11% Alu，是 RNA 介导扩增的主力

③ 逆转录病毒 vs 逆转座子

共同点：RNA 中间体 + RT + 整合酶，违反 DNA→RNA 单向流
区别：逆转录病毒额外编码 env 蛋白，能装配成传染颗粒离开细胞
HIV：基因组 RNA 既是 mRNA 也是病毒包装的"基因组"
药物启示：AZT、Tenofovir（NRTI）= 核苷类似物阻断 RT；Raltegravir = 整合酶抑制剂

④ 与本讲（Lec 3）的对照

转座 RNA 与 mRNA 共用同一套加工机器：加帽 / 剪接 / polyA
Pol II 启动子 ≈ LTR 启动子；Pol III 启动子 ≈ SINE 内部启动子
逆转录 = "RNA→DNA"，是中心法则反向箭头，与 mRNA→蛋白质（翻译，Lec 4）形成对照
药物开发延伸：LNP-mRNA / GalNAc-siRNA 借用的递送与稳定性原理，最初来自对 RNA 病毒和逆转座子的研究

核心要带走：转座 = "会动的 RNA 基因表达系统"。它教会我们：① 启动子可以内置在元件里；② RT 可让 RNA 反向"写回"基因组；③ 同样的加工/递送原理被自然界和现代核酸药物双重利用。回到 Lec 2 第 90 页可重新审视具体结构与机制图。

药物开发案例

小节总结 — RNA转录相关药物开发案例

1. 靶向RNAP本体：利福平结合细菌RNAP β亚基，利用原核/真核结构差异实现选择性，是抗感染转录抑制的经典教学范本。

2. 表观与信号转录调控：BET溴域抑制剂靶向超级增强子；芦可替尼截断JAK-STAT信号驱动的转录激活，代表从染色质调控到信号通路的多层次干预策略。

3. RNA层面精准干预（ASO/siRNA）：Nusinersen（ASO）纠正SMN2前体mRNA剪接；Patisiran/Inclisiran（siRNA）激活RISC降解靶mRNA，将转录后调控原理直接转化为临床疗法。

4. 生物技术载体驱动的基因转录治疗：腺病毒载体（ChAdOx1、Gendicine）和AAV载体均通过递送目的基因，借助宿主RNA pol II实现治疗性蛋白的持续转录表达，是转录生物学知识在基因疗法中的核心应用。

5. 技术模态对比：小分子（利福平、BET抑制剂）→ 靶向蛋白；ASO/siRNA → 靶向RNA；腺病毒/AAV → 补充基因；mRNA → 直接供给转录本，形成多层级转录干预体系。

本讲总结

1. 转录基础与调控：RNA聚合酶以 DNA 为模板进行 5'→3' 合成；启动子识别、转录泡形成、延伸与终止构成转录起始-延伸-终止三阶段，是基因表达最关键的门控步骤。

2. 真核转录的复杂调控：Pol II 联合通用转录因子（TFII 家族）、Mediator、染色质修饰与重塑复合体协同工作；CTD 磷酸化时序耦联延伸与 RNA 加工；转录还需化解超螺旋张力与核小体障碍。

3. RNA加工与核内组织：5'加帽 → 剪接（剪接体两步酯交换）→ 3'端切割加 polyA → 核输出 → 翻译，构成 pre-mRNA 成熟流水线；核仁、剪接体集中区、副斑等亚核聚集体实现"无膜分区"以提升加工效率。

4. 转录原理转化为药物：从靶向 RNAP（利福平、放线菌素D）到染色质阅读器（BET 抑制剂）到信号轴（JAK-STAT）；从 RNA 层精准干预（ASO 改剪接、siRNA 沉默 mRNA）到病毒/脂质载体重编程细胞转录（AAV、腺病毒、LNP-mRNA），形成多层级转录干预体系。

Lecture 4

蛋白质翻译

Protein Translation

Molecular Biology of the Cell

CHAPTER 6 How Cells Read the Genome: From DNA to Protein

从"图纸"到"工人"：中心法则的最后一步

Lecture 1：DNA 复制 → 信息代代相传
Lecture 2：DNA 修复 + 重组 → 信息不变质、可演化
Lecture 3：RNA 转录 → 信息从基因组复印出"工作册"
但是 —— 到目前为止细胞还什么也没做。RNA 只是中间产物，真正干活的是蛋白质
翻译（translation）= 把 mRNA 上的核苷酸序列"翻译"成蛋白质的氨基酸序列
- 读取的是 mRNA 上的三联体密码（codon）
- 核糖体 + tRNA + 氨基酸 + 起始/延伸/释放因子，构成翻译机器
- 这是中心法则箭头的最后一步：RNA → 蛋白质
翻译是细胞内最耗能、最精密的合成过程之一 —— 一个核糖体每秒可加 ~20 个氨基酸，一个真核细胞同时有 ~10⁷ 个核糖体在工作

本讲核心问题：核糖体如何在三种不同 RNA（mRNA + tRNA + rRNA）的协同下，把核苷酸语言精确翻译成蛋白质语言？错译会带来什么后果？

中心法则的最后一步：
RNA → 蛋白质

蛋白质：生命的"分子工人"

蛋白质是细胞内数量最多、功能最广的大分子 —— 一个典型哺乳动物细胞含 ~10¹⁰ 个蛋白分子，约 2 万种不同蛋白
蛋白质几乎承担细胞所有实际功能：
- 酶：催化几乎全部生化反应（DNA 聚合酶、ATP 合酶、剪接体核心 ...）
- 结构：细胞骨架（actin、tubulin）、胞外基质（胶原蛋白）
- 运输 / 马达：血红蛋白、肌球蛋白、kinesin / dynein
- 信号 / 调控：受体、激酶、转录因子、激素
- 防御：抗体、补体、抗菌肽
蛋白质大小跨度极大：~50 氨基酸（小肽）到 ~34,000 氨基酸（肌联蛋白 titin） —— 但都由同样 20 种标准氨基酸构成
同一氨基酸序列 → 折叠成唯一三维结构 → 决定特异功能。序列即结构、结构即功能是分子生物学的核心信条
因此翻译错误的代价是惨重的：错配氨基酸 → 错误折叠 → 失活 / 聚集 / 毒性蛋白 → 多种神经退行性疾病（AD、PD、ALS）

类比：如果 DNA 是"图书馆藏书"，RNA 是"临时复印件"，那么蛋白质就是按图施工的"工人" —— 而且这些工人本身又能去管理"图书馆"（转录因子）、复印"复印件"（剪接体核心）、甚至建造新的"工人工厂"（核糖体蛋白）。

蛋白质功能多样性 + 序列→结构→功能

翻译为何如此精密复杂？

翻译的"三大挑战"决定了机器的复杂度：
- 语言转换：4 种核苷酸 ↔ 20 种氨基酸 —— 必须有"密码本"（遗传密码）+ "翻译员"（tRNA）
- 精度：错误率必须 < 10⁻⁴ / 氨基酸（否则一个 500 aa 蛋白几乎必错）—— 需要多重校对机制
- 速度：细胞分裂 / 应激时翻译需求陡增 —— 需要并行翻译（一条 mRNA 上多个核糖体形成 polysome 多核糖体）
核糖体（ribosome） = 翻译的核心机器：
- 大 + 小亚基组成；细菌 70S（30S+50S），真核 80S（40S+60S）
- 由 ~60% rRNA + ~40% 蛋白组成 —— 是细胞中最大的核酶
- 催化中心是 rRNA（不是蛋白！）—— 与剪接体一样，RNA 才是真正的催化剂
"RNA 世界"假说的终极证据：核糖体 + 剪接体核心都是 RNA 催化的机器
- 最古老的功能（合成蛋白、剪接 RNA）依然由 RNA 完成 → 远古生命可能以 RNA 既存储信息又催化反应
- 蛋白质后来才"接管"大部分酶活，但最核心的几个反应依然刻在 RNA 上 —— 是分子化石

本讲学习目标：不仅要理解"如何翻译"的机制，更要看到核糖体这个"古老分子机器"如何成为抗生素、化疗、罕见病治疗的关键靶点 —— 翻译机制是连接基础研究与药物开发的重要纽带。

核糖体结构与核酶催化中心

Ramakrishnan · Steitz · Yonath（2009诺贝尔化学奖）

本讲大纲点击条目可直接跳转

一、从RNA到蛋白质

mRNA 三联体密码子解码
tRNA 与密码子匹配（摆动配对）
tRNA 共价修饰
氨酰-tRNA 合成酶（两级接头）
合成酶编辑确保准确性
氨基酸添加到 C 末端（头部生长）
RNA 信息在核糖体中解码
延伸因子驱动翻译 + 校对
克服碱基配对的固有局限
核糖体是一种核酶
主要 RNP 酶汇总（跨四讲）
翻译起始（真核扫描）
翻译起始（原核 SD + IRES）
终止密码子与释放因子
多核糖体（polysome）
遗传密码变异 + 硒代半胱氨酸
原核蛋白合成抑制剂 = 抗生素
mRNA 质控（NMD）
共翻译折叠
分子伴侣 hsp70 / hsp60
疏水信号 = 质控关键
蛋白酶体（区室化蛋白酶）
可调控降解 + degron
从 DNA 到蛋白质完整路径

二、RNA世界与生命起源

单链 RNA 精细折叠结构
RNA 既储信息又能催化
蛋白质合成的进化

三、翻译相关药物

Tetracycline / Tigecycline
Azithromycin / Erythromycin
Linezolid（抗 MRSA）
Bortezomib（蛋白酶体抑制）
PROTAC / ARV-471 ⭐ 新批
Rapamycin / Everolimus
mRNA 疫苗（BNT162b2）
AAV 基因疗法（Zolgensma）
siRNA（Patisiran）
siRNA（RNAi 沉默肿瘤）
ASO 外显子跳跃（DMD）
腺病毒与 AAV 比较

Section I

从RNA到蛋白质

FROM RNA TO PROTEIN

从RNA到蛋白质

mRNA序列以三联体密码子方式解码

RNA到蛋白质的转变是信息从一种语言翻译成另一种语言：4种核苷酸 → 20种氨基酸
核苷酸序列以连续的三联体（triplet）为单位读取，每组三个核苷酸称为一个密码子（codon）
4 × 4 × 4 = 64种可能的密码子组合，编码20种氨基酸 → 遗传密码具有简并性（redundancy）
每个密码子指定一种氨基酸，或一个终止信号
遗传密码在所有生物中几乎通用（少数例外见于线粒体）
阅读框（reading frame）：mRNA 是连续的核苷酸序列，从哪个位点开始"三个三个一组"读取，会产生三种完全不同的密码子组合
- 例：序列 UUC-GAC-AUG-... 偏移 1 位变为 UCG-ACA-UGN-...，氨基酸完全不同
- 三种阅读框中通常只有一种能一直读下去而不撞到终止信号、且编码有功能的蛋白 —— 称为开放阅读框（ORF, open reading frame）
正确阅读框由起始密码子 AUG 的位置定义：核糖体从 5'端扫描到第一个合适的 AUG 处启动翻译，此后严格按每 3 nt 一步前进，不能跳格
- 如果突变插入或删除 1-2 个 nt → 阅读框移位（frameshift mutation）→ 下游氨基酸全部改变，蛋白严重截短或失功能
- 例：杜氏肌营养不良（DMD）中的 frameshift 突变就比 in-frame 缺失严重得多

遗传密码表（The Genetic Code）

从RNA到蛋白质

tRNA分子将氨基酸与mRNA密码子匹配

转运RNA（tRNA）是遗传密码翻译的关键接头分子（adaptor）
tRNA折叠呈三叶草形（cloverleaf）→ 进一步折叠为L形三维结构
L形两端分别承载关键功能：
- 反密码子（anticodon）：与mRNA密码子互补配对（位于L形一端）
- 3'末端：连接对应的氨基酸（位于L形另一端）
密码子简并性意味着：某些氨基酸有多种 tRNA，或某些 tRNA 可识别多个密码子 —— 由"摆动假说"（wobble hypothesis，Crick 1966）解释：
- tRNA 反密码子第 1 位（与 mRNA 密码子第 3 位配对）允许非标准碱基配对，故称"摆动位"
- 反密码子第 1 位若为 I（次黄嘌呤 inosine）→ 可同时配 U / C / A；若为 G → 可配 U / C；若为 U → 可配 A / G
- 解释了为何许多同义密码子仅在第三位核苷酸不同（如 GCU / GCC / GCA / GCG 都编码 Ala）
结果：细胞只需远少于 61 种的 tRNA 就能翻译所有有义密码子 —— 原核约 31 种、人类约 48 种 tRNA
进化意义：① 缓冲突变（第 3 位变化常为同义突变，不改变蛋白质）；② 简化翻译装备（少基因、少装配）

tRNA 分子结构

tRNA 反密码子摆动配对

从RNA到蛋白质

tRNA在离开细胞核前被共价修饰

真核tRNA由RNA聚合酶III合成
原核细胞和真核tRNA通常以较大前体形式合成，随后被修剪成熟
某些tRNA前体含有内含子，需要剪接去除
tRNA 剪接与 pre-mRNA 剪接机制完全不同：
- 不产生套索中间体：pre-mRNA 剪接用分支点 A 的 2'-OH 作亲核试剂形成套索；tRNA 剪接直接用蛋白酶切割两个剪接点，无中间态
- 两步反应"剪切 + 粘贴"：① tRNA splicing endonuclease（TSEN 复合物）在内含子两端精确切割，释放线性内含子；② tRNA ligase 把两个外显子末端粘接（消耗 ATP，与 DNA 连接酶机制类似）
- 由蛋白质催化（不是 RNA）：完全是蛋白酶系统 —— 与 pre-mRNA 剪接（核酶）、自我剪接（RNA 自身）形成鲜明对比，说明剪接机制在进化上是多次独立起源的
- 识别方式不同：TSEN 通过识别 tRNA 的三叶草二级结构（而非剪接位点序列）来定位切割位点 → 折叠错误的 tRNA 不会被切，自带质量控制
- 真核 tRNA 内含子通常 14–60 nt，紧邻反密码子环，远小于 mRNA 内含子（~3000 nt）
前体tRNA必须正确折叠为三叶草构型才能被加工 → 充当质量控制步骤
成熟tRNA中约10%核苷酸是标准核苷酸的化学修饰版本
已知超过50种不同的tRNA修饰类型（如肌苷、二氢尿苷、假尿苷等）
某些修饰影响反密码子构象和碱基配对，促进正确识别mRNA密码子

tRNA 剪接及修饰核苷酸

tRNA 前体剪接机制；
常见修饰核苷酸结构

从RNA到蛋白质

特异性酶将氨基酸偶联到对应的tRNA

氨酰-tRNA合成酶（aminoacyl-tRNA synthetase）负责将正确氨基酸连接到对应tRNA
大多数细胞有20种合成酶，每种对应一种氨基酸
反应分两步进行，与ATP水解偶联：
- 第一步：氨基酸与AMP形成腺苷化氨基酸（adenylated amino acid）
- 第二步：氨基酸转移至tRNA的3'末端，形成高能酯键
高能酯键的能量在后续蛋白质合成时用于形成肽键
合成酶和tRNA共同构成两级接头系统：合成酶识别氨基酸和tRNA → tRNA识别mRNA密码子
经典实验验证（Chapeville & Lipmann，1962） —— 证明"tRNA 才是真正的密码识别者，氨基酸装上去后是'盲目的'"：
- 第一步：用合成酶给 tRNA^Cys 装上正确的半胱氨酸（Cys），得到正常 Cys-tRNA^Cys
- 第二步：用Raney 镍催化脱硫，把已挂在 tRNA 上的 Cys 的 –SH 基团去掉，化学性地变成丙氨酸（Ala） → 得到"杂交"分子 Ala-tRNA^Cys（反密码子还认 Cys 密码子 UGU/UGC，但带的是 Ala）
- 第三步：放进体外翻译系统 + 一条富含 Cys 密码子的 mRNA
- 结果：本应插入 Cys 的位置上全部插入了 Ala —— 证明核糖体只识别 tRNA 反密码子，不复查"挂错"的氨基酸
- 意义：实验验证了 Crick 的"接头假说"（adaptor hypothesis）—— 翻译保真度完全压在合成酶的"装配准确性"上

氨基酸活化反应（合成酶催化的两步法）

遗传密码通过两级接头翻译
（合成酶 + tRNA）

从RNA到蛋白质

tRNA合成酶的编辑确保准确性

氨酰-tRNA合成酶通过两步机制确保正确连接氨基酸
第一步筛选（合成位点）：正确氨基酸对活性位点亲和力最高，较大氨基酸被排斥
第二步编辑（编辑位点）：
- 类似结构的氨基酸难以在第一步区分（如异亮氨酸与缬氨酸仅差一个甲基）
- 编辑口袋精确排斥正确氨基酸，允许错误氨基酸进入并被水解移除
该水解编辑类似于DNA聚合酶的外切核酸酶校对
编辑将tRNA装载的总体准确率提高至约1/40,000的错误率
合成酶还识别tRNA的多个特征：反密码子、受体茎序列等

水解编辑与tRNA识别

合成酶双位点校对机制；合成酶-tRNA识别界面

从RNA到蛋白质

氨基酸被添加到多肽链的C末端

蛋白质合成的基本反应：肽键形成
新肽键连接多肽链末端的羧基与新氨基酸的氨基
蛋白质从N端到C端逐步合成
生长中的多肽链C末端始终通过共价键连接于tRNA（形成peptidyl-tRNA）
每次添加新氨基酸：
- 打断旧tRNA上的高能键
- 在新添加的氨基酸上立即形成相同的键
这是一种"头部生长"型聚合：每个添加的氨基酸携带下一个氨基酸加入所需的活化能

氨基酸掺入蛋白质的过程

从RNA到蛋白质

RNA信息在核糖体中解码

核糖体：由50多种蛋白质和数种rRNA组成的复杂催化机器
分为大亚基和小亚基：
- 小亚基：为tRNA与mRNA密码子配对提供框架
- 大亚基：催化肽键形成
翻译精度约1/10,000（每10,000个氨基酸错1个）
核糖体有四个RNA结合位点：mRNA结合位、A位、P位、E位
翻译延伸的四步循环：
- 步骤1：氨酰-tRNA结合A位
- 步骤2：肽键形成（转肽反应）
- 步骤3：大亚基移位
- 步骤4：小亚基移位（推进3个核苷酸）
速率：真核~2aa/s，原核细胞~20aa/s

核糖体结构与 tRNA 结合腔（A、P、E 位）

翻译延伸的四步循环（结合 → 转肽 → 移位 → 推进）

从RNA到蛋白质

延伸因子驱动翻译并提高准确性

两种延伸因子（elongation factor）在每个翻译循环中进出核糖体、水解 GTP，分别负责"送 tRNA"和"推进核糖体"：
- EF-Tu（真核 = eEF1A）：携带氨酰-tRNA 进入 A 位
- EF-G（真核 = eEF2）：肽键形成后驱动核糖体沿 mRNA 移位 3 nt
EF-Tu 的工作流程 —— 把 aa-tRNA "护送"到 A 位：
- ① EF-Tu·GTP 同时结合 aa-tRNA → 形成"三元复合物"，遮住氨基酸防止它过早反应
- ② 三元复合物进入 A 位 → 反密码子先和密码子试配对（"预筛选"）
- ③ 配对正确 → 触发 EF-Tu 水解 GTP → EF-Tu·GDP 解离 → tRNA 落入 A 位 → 肽键形成
核糖体的双重校对机制（kinetic proofreading，约把错误率从 1/1000 降到 1/10⁴）：
- 第一重（GTP 水解前）：16S rRNA 像"分子卡尺"夹住密码子-反密码子配对 → 三个碱基对都正确才会形成紧密构象 → 触发 GTP 水解；错配则三元复合物原路退回
- 第二重（GTP 水解后）：EF-Tu 解离 → tRNA 还需"摇晃"片刻才完全嵌入 A 位 → 这段时间窗口给错配 tRNA 提供了"重新逃跑"的机会（动力学校对的核心机理）
EF-G 的工作：肽键形成后，EF-G·GTP 进入 → 构象变化推核糖体前进 3 nt → 把 P 位 tRNA 挤到 E 位、A 位 tRNA 挤到 P 位 → GTP 水解，EF-G·GDP 离开 → 准备下一轮
每加一个氨基酸总耗能 ≈ 4 个高能磷酸键：2 个 ATP（合成酶活化氨基酸）+ 2 个 GTP（EF-Tu 校对 + EF-G 移位）—— 远高于一个肽键的能量需求，"多余的能量都花在保证准确性和方向性上"

延伸因子与翻译校对

EF-Tu/EF-G 翻译延伸；
rRNA 对配对的校核

从RNA到蛋白质

克服互补碱基配对的固有局限性

仅靠氢键差异，正确与错误配对的亲和力仅差10~100倍
DNA复制、转录和翻译的实际准确率远高于此 → 需要额外机制
诱导契合（Induced Fit）：
- 密码子-反密码子配对后，核糖体折叠包裹该配对
- 仅正确匹配时折叠完成 → 允许反应继续
- 相当于双重检查：先碱基配对，再通过蛋白/RNA构象变化验证
动力学校对（Kinetic Proofreading）：
- GTP水解创造不可逆步骤，开启时间窗口
- 错误配对的tRNA在此窗口内更易解离
- 消耗能量换取更高特异性
蛋白质合成是细胞中耗能最多的生物合成过程（每个肽键至少消耗4个高能磷酸键）

诱导契合与动力学校对：翻译保真度的两道防线

从RNA到蛋白质

核糖体是一种核酶

核糖体由2/3 RNA和1/3蛋白质组成
2000年测定的三维结构证实：rRNA（而非蛋白质）负责：
- 核糖体整体结构
- tRNA在mRNA上的定位
- 催化肽键形成
rRNA折叠为紧凑精确的三维结构，构成核糖体核心
核糖体蛋白位于表面，填充RNA折叠的间隙，主要作用是稳定RNA核心
转肽酶活性位点完全由RNA构成（最近的氨基酸在1.8nm之外）
23S rRNA形成高度结构化口袋，通过氢键网络精确定位两个反应物
P位的tRNA贡献一个关键的-OH基团参与催化
核糖体可能是RNA世界的遗迹——早期生命由核酶驱动

核糖体rRNA结构与蛋白质分布

rRNA 三维折叠构成核糖体核心；
蛋白质位于表面稳定结构

承上启下 · 跨四讲

主要 RNP 酶汇总 —— RNA 世界的"分子化石"

核心观察：核糖体是核酶 —— 不是孤立现象。本系列贯穿四讲的多种"核心分子机器"，并非纯蛋白酶，而是 RNA + 蛋白 形成的核糖核蛋白复合物（RNP）。其中部分由 RNA 真正催化（"核酶"，RNA 世界假说的活化石），部分则由 RNA 提供导向/模板而蛋白完成催化。

RNP 酶	RNA 组分	蛋白组分	催化反应	RNA 催化？	出现章节
核糖体 ribosome	28S/18S/5.8S/5S rRNA	~80 种核糖体蛋白	肽键形成（蛋白合成）	✓	Lec 4 翻译
剪接体 spliceosome	U1 / U2 / U4 / U5 / U6 snRNA	~200 种蛋白	pre-mRNA 剪接（移除内含子）	✓	Lec 3 RNA 加工
RNase P	M1 RNA（细菌）/ MRP-RNA	1–10 种蛋白	切割 pre-tRNA 5' 端成熟	✓	Lec 4 tRNA 加工
端粒酶 telomerase	TERC（hTR）RNA → 模板	TERT（逆转录酶）+ dyskerin	合成端粒 TTAGGG 重复	✗	Lec 1 复制
SRP 信号识别颗粒	7SL RNA（骨架）	6 种 SRP 蛋白	识别新生肽信号序列 → 定位 ER	✗	未展开 · 细胞生物学课程
RISC (siRNA / miRNA)	siRNA / miRNA → 导向	Argonaute（Ago2 等）	切割或抑制靶 mRNA	✗	Lec 3 药物（Patisiran）
CRISPR-Cas	crRNA / tracrRNA / sgRNA	Cas9 / Cas12 / Cas13	切割 DNA 或 RNA	✗	Lec 2 药物（Casgevy）

A 类（真核酶 / ribozyme）：核糖体 + 剪接体 + RNase P —— 全部承担细胞最古老 / 最基础的功能（合成蛋白、剪接 RNA、加工 tRNA），蛋白质后来加入只起骨架辅助作用。这正是 RNA 世界假说的核心证据。

B 类（RNA 导航 + 蛋白催化）：端粒酶、SRP、RISC、CRISPR-Cas —— 较年轻的功能；RNA 提供序列特异性 / 模板，蛋白完成切割 / 聚合。这种"混合模式"被现代核酸药物大量借鉴（siRNA 治疗 = 借 RISC、CRISPR 编辑 = 借 Cas9）。

从RNA到蛋白质

翻译起始（一）：真核"扫描"模式

起始位点选择至关重要：决定整条 mRNA 的阅读框；偏移 1 nt → 后续所有密码子被误读 → 产生无功能蛋白
起始 tRNA 与众不同：专门的 tRNA^iMet（起始甲硫氨酸 tRNA）直接进入 P 位（其他 tRNA 都从 A 位进入），帮核糖体辨认"这是起始"
真核翻译起始流程（"扫描"模式）：
- ① eIF4F 复合物（eIF4E + eIF4G + eIF4A）结合 mRNA 5' 帽；eIF4G 同时拉住 polyA 上的 PABP，形成闭环 mRNA
- ② 43S 前起始复合物（40S 小亚基 + eIF2·GTP·Met-tRNA^iMet + 其他 eIFs）经 eIF4G 招募到 5' 帽附近
- ③ eIF4A 解旋酶活性松开 5'UTR 二级结构 → 小亚基沿 mRNA 扫描寻找第一个 AUG
- ④ Kozak 序列（见下）决定 AUG 识别效率
- ⑤ AUG 识别 → eIF2 水解 GTP → 释放大部分 eIFs → 60S 大亚基加入 → 80S 启动复合物
Kozak 序列 —— 起始 AUG 周围的"上下文"：
- 共有：(gcc)gccRccAUGG（大写 = 高度保守关键位，小写 = 偏好位，R = 嘌呤 A/G）
- 两个关键位：−3 位（R，嘌呤） + +4 位（G） = 强 Kozak，高效识别
- 弱 Kozak → 可能被渗漏扫描（leaky scanning）跳过：40S 小亚基"路过"该 AUG 不识别，继续扫描到下游下一个强 AUG 才起始 → 可从同一 mRNA 产生不同 N 端的蛋白异构体

真核翻译起始
（eIF4F 帽识别 + 40S 扫描）

从RNA到蛋白质

翻译起始（二）：原核"对号入座"模式 + 病毒 IRES

原核起始 tRNA：fMet-tRNA^fMet（甲酰甲硫氨酸 tRNA）—— 与真核 tRNA^iMet 类似但氨基末端带甲酰基（formyl），用于标识"起始"
原核翻译起始流程（"对号入座"模式）：
- ① 无 5' 帽 → 用 Shine–Dalgarno 序列（SD，共有 AGGAGG，位于起始 AUG 上游 ~7 nt）
- ② SD 与 16S rRNA 3' 端 anti-SD（CCUCCU）碱基互补 → 把 30S 小亚基直接定位到 AUG，无需扫描
- ③ 起始因子 IF1, IF2, IF3 协助；IF2 把 fMet-tRNA^fMet 装到 P 位
- ④ 50S 大亚基加入 → 70S 复合物 → 翻译开始
- ⑤ 优势：可在 mRNA 中部任意 SD 位点起始 → 一条 mRNA 上排列多个 ORF（每个 ORF 编码一个蛋白）
  - 顺反子（cistron）= 经典遗传学术语，指"一个基因 / 一个 ORF / 一段蛋白编码区"
  - 多顺反子 mRNA（polycistronic）= 一条 mRNA 上串联多个 cistron，每个前面有自己的 SD —— 细菌常见（例：lac 操纵子一条 mRNA 同时编码 LacZ/LacY/LacA），相关基因同时开关
  - 单顺反子 mRNA（monocistronic）= 一条 mRNA 只含一个 cistron / 一个蛋白 —— 真核几乎全部如此，因为扫描机制只能识别第一个 AUG
教学延伸 —— 病毒劫持起始的策略：
- HCV、polio 等病毒含 IRES（Internal Ribosome Entry Site，内部核糖体进入位点）
- 无需 5' 帽和扫描，IRES 直接招募核糖体 → 在宿主翻译被抑制时仍能合成病毒蛋白
- 类似机制也存在于某些细胞 mRNA（应激条件下的"备用起始"）

原核翻译起始三步装配（概念图）

典型细菌 mRNA 结构
（编码 α/β/γ 多个蛋白）

从RNA到蛋白质

终止密码子标记翻译终止

三个终止密码子：UAA、UAG、UGA
终止密码子不被任何tRNA识别，不编码氨基酸
释放因子（release factor）结合停在A位的终止密码子
释放因子迫使转肽酶催化水分子（而非氨基酸）对peptidyl-tRNA的添加 → 水解释放多肽
新生多肽通过大亚基中的水性隧道（~10nm × 1.5nm）穿过核糖体
隧道壁由 23S rRNA 构成，化学特性类似厨具不粘锅的"特氟龙"（Teflon / PTFE）涂层 —— 小疏水面嵌入亲水面、交替排列，对任何特定氨基酸序列都不形成强结合 → 所有蛋白质都能均匀滑过，不会被某段序列"卡住"
蛋白质在隧道中大部分处于未折叠状态，部分α螺旋可能在离开前形成
完成翻译后核糖体大小亚基分离，准备开始新一轮翻译

翻译终止与释放因子

从RNA到蛋白质

多核糖体上的蛋白质合成

大多数蛋白质合成耗时20秒至数分钟
多个核糖体可同时翻译同一mRNA → 形成多核糖体（polyribosome / polysome）
相邻核糖体间隔约80个核苷酸
多重起始使细胞在单位时间内产生更多蛋白质分子
原核细胞特有的加速策略 —— "边转录边翻译"（coupled transcription-translation）：
- mRNA 无需加工（无加帽 / 剪接 / polyA / 核输出），转录出来即可被翻译
- 核糖体可紧跟在 RNA 聚合酶后面，在 mRNA 还没合成完就开始翻译 → 转录与翻译同步进行，无核质分隔阻碍
- 电镜下能看到"圣诞树"图像：一条 DNA 上 RNA pol 正在转录，新生 mRNA 上挂着多个核糖体
真核细胞的"空间 + 时间分离" —— 翻译比原核慢得多：
- 转录在核内完成 → mRNA 必须经过加帽 / 剪接 / 加 polyA / 核输出等多步加工（耗时数分钟到小时）
- 成熟 mRNA 出核后才能在胞质被核糖体翻译 → 物理分隔使转录与翻译无法耦合
- 补偿策略：成熟 mRNA 5' cap 与 3' polyA 通过 eIF4G ↔ PABPC1 形成"闭环" → 核糖体完成翻译后处于最佳位置立即重新起始，提高同一 mRNA 的翻译频率

多核糖体结构

从RNA到蛋白质

标准遗传密码的微小变异

遗传密码在三大生命域（Three Domains of Life：细菌 Bacteria + 古菌 Archaea + 真核 Eukarya，Carl Woese 1977 基于 rRNA 序列提出）中几乎通用 → 支持共同祖先 LUCA（Last Universal Common Ancestor）假说
少数例外：
- 白色念珠菌：CUG编码丝氨酸（而非亮氨酸）
- 线粒体：密码有若干特殊变化
翻译重编码（translation recoding）：mRNA 上的额外序列信号（茎环结构、邻近序列等）让核糖体在特定位点临时改变密码子的标准含义
- 表现形式：将终止密码子读通（read-through）插入氨基酸；将一个密码子读成另一个氨基酸；移码读取等
- 不是突变，而是"上下文依赖的灵活解码" —— 同一 mRNA 在同一位置每次翻译都按规则做相同重编码
硒代半胱氨酸（Selenocysteine, Sec, 第 21 种氨基酸）—— 翻译重编码的经典案例：
- UGA 重编码：UGA 本是终止密码子，但当 mRNA 3'UTR 含 SECIS 元件（Selenocysteine Insertion Sequence，特殊的茎环结构）时，UGA 被识别为 Sec 而非终止
- Sec 的合成路径：先用专用 tRNA^Sec 装上丝氨酸（Ser）→ 丝氨酸的 –OH 被硒代 → 在 tRNA 上原位转化为 Sec（"先装错再修正"，独特机制）
- 专用翻译因子：EFSec（替代 EF-Tu）+ SBP2（识别 SECIS）—— 把 Sec-tRNA^Sec 精确送到 UGA 处
- 生理意义：Sec 含硒（Se，比 S 更易电离），出现在 ~25 种人类硒蛋白（如谷胱甘肽过氧化酶 GPX、甲状腺素脱碘酶 DIO）的活性中心，参与抗氧化、甲状腺激素代谢
- 三大生命域（细菌、古菌、真核）都存在 Sec，是古老的进化保留

硒代半胱氨酸的掺入

从RNA到蛋白质

原核蛋白质合成抑制剂可用作抗生素

许多有效抗生素来源于真菌，专门抑制细菌蛋白质合成
真菌与细菌在数百万年的共进化中产生了这些强效抑制剂
利用细菌和真核核糖体的结构与功能差异实现选择性抑制
常见抗生素及作用机制：

抗生素	作用靶点
四环素	阻止aminoacyl-tRNA结合A位
链霉素	阻止起始→延伸的转换，引起错读
氯霉素	阻断转肽酶反应
红霉素	结合出口通道，抑制肽链延伸
嘌呤霉素	模拟aminoacyl-tRNA → 引起提前终止

氯霉素仅抑制线粒体核糖体（反映原核起源），放线菌酮仅作用于胞质核糖体

抗生素在核糖体上的结合位点

各种抗生素在核糖体大小亚基上的结合位置

从RNA到蛋白质

质量控制机制防止受损mRNA的翻译

不正确加工或受损的mRNA若被翻译 → 产生截短或异常蛋白质 → 潜在危害
细胞有多重备份措施：
- 翻译起始时同时识别5'帽和poly-A尾
无义介导的mRNA降解（Nonsense-Mediated mRNA Decay, NMD）：
- 最强大的mRNA监控系统
- mRNA从核孔输出时，核糖体进行"测试翻译"
- 正常翻译时核糖体推移所有外显子连接复合物（EJC）
- 正常终止密码子在最后一个外显子中 → 到达时所有EJC已被清除 → mRNA通过检查
- 若提前遇到终止密码子且仍有EJC残留 → mRNA被快速降解
- 关键蛋白（NMD 核心因子）：
  - UPF1（ATPase / 解旋酶，NMD 总开关）+ UPF2 / UPF3 形成 NMD 复合物，桥接终止核糖体与 EJC
  - SMG1 激酶（PIKK 家族）磷酸化 UPF1 → 激活降解信号
  - SMG5/6/7：招募下游降解机器（SMG6 直接切 mRNA；SMG5/7 招募去 polyA + 脱帽 + Xrn1 外切酶 → mRNA 完全降解）
NMD在进化中的意义：允许细胞探索新基因而不受截短蛋白的伤害
约1/3人类遗传病由无义突变引起，NMD减轻了许多疾病的症状

无义介导的mRNA降解（NMD）

从RNA到蛋白质

部分蛋白质在合成时即开始折叠

新合成的多肽链必须完成多个步骤才能成为功能蛋白：
- 折叠为正确的三维构象
- 结合所需的小分子辅因子
- 经历适当的共价修饰（磷酸化、糖基化、乙酰化等）
- 与其他蛋白亚基正确组装
折叠模式由氨基酸序列决定 → 自由能最低的构象
共翻译折叠（Co-translational folding）：
- 某些蛋白质N端域从核糖体出来后数秒内即形成紧凑结构
- 先形成熔球态（molten globule）→ 再缓慢调整至正确三级结构
合成中等大小蛋白质约需数分钟，部分蛋白质在核糖体释放C末端前已基本折叠完成

蛋白质折叠与共翻译折叠

功能蛋白质形成步骤；
多肽出核糖体隧道后逐步折叠

从RNA到蛋白质

分子伴侣帮助引导蛋白质折叠

大多数蛋白质需要分子伴侣（molecular chaperone）协助正确折叠
没有伴侣时，蛋白质可能陷入"动力学陷阱" → 错误折叠 → 不可逆聚集
分子伴侣特异性识别暴露的疏水表面（正确折叠时应被埋藏）
两大家族：
- hsp70家族：
  - 早期作用（蛋白质仍在核糖体上时）
  - 结合约4-5个疏水氨基酸的短肽段
  - ATP结合 → 释放蛋白 → 给予重新折叠的机会
- hsp60家族（chaperonin）：
  - 形成桶状"隔离室"
  - 在蛋白质完全合成后发挥作用
  - 蛋白被捕获 → 释入亲水内腔 → 加盖密封 → 隔离折叠
不同细胞器有各自特有的hsp60/hsp70（线粒体、ER中的BIP等）
每次折叠循环消耗ATP，用能量换取折叠的准确性

hsp70：早期"接力"结合-释放循环

hsp60（chaperonin）：桶状隔离室折叠

从RNA到蛋白质

暴露的疏水区域是蛋白质质控关键信号

蛋白表面有较大疏水斑块通常意味着异常：
- 折叠未完成
- 部分展开的意外损伤
- 未找到正常的配体亚基
这类蛋白不仅无用，还可能有害（如形成毒性聚集体）
能快速正确折叠的蛋白质不展示疏水模式 → 绕过伴侣系统
无法正确折叠的蛋白质 → 伴侣多次尝试"修复"
- 仍失败 → 启动蛋白酶体降解途径
hsp70最先作用 → hsp60后续介入 → 反复尝试 → 最终若失败 → 蛋白酶体
遗传性疾病中，蛋白质聚集体可导致严重症状甚至死亡（如朊病毒病）

蛋白质折叠质量控制路径

从RNA到蛋白质

蛋白酶体——区室化蛋白酶

蛋白酶体（proteasome）：蛋白质降解的核心机器
结构组成：
- 20S核心：中空圆柱体，由4个七聚体环堆叠形成
- 蛋白酶活性位点朝向内腔 → 防止无差别降解
- 19S帽：位于两端，含六亚基蛋白环，控制底物进入
底物蛋白通过帽中的环被穿线进入核心 → ATP水解驱动 → 同时展开底物蛋白
关键特性：进行性（processivity）——保持底物结合直至完全降解为短肽
降解标记：多聚泛素链（K48连接）
- 泛素（ubiquitin）通过E3连接酶共价标记靶蛋白
- 19S帽识别多聚泛素标签 → 允许底物进入
特异的E3连接酶识别变性/错折叠蛋白质的暴露疏水序列
蛋白酶体广泛分布于细胞质和细胞核

蛋白酶体结构与蛋白降解

20S核心+19S帽结构；泛素标记→穿线→降解过程

从RNA到蛋白质

许多蛋白质受可调控降解的控制

蛋白酶体不仅降解异常蛋白，还调控正常蛋白的寿命
某些蛋白质天然寿命短 → 细胞需快速改变其浓度
调控机制 A —— 激活泛素连接酶（E3）：底物始终存在，E3 平时"关闭"，外界信号让 E3"打开"才启动降解
- E3 磷酸化：激酶修饰 E3 的特定位点 → 构象改变 → 露出底物结合口袋
- 小分子/蛋白结合引起变构：辅因子或配体结合 → 激活 E3 催化活性
- 亚基添加激活：典型例子 APC/C（后期促进复合物）在有丝分裂中加入 Cdc20 亚基 → 激活 → 降解周期蛋白 cyclin B + securin → 触发姐妹染色单体分离和退出 M 期
调控机制 B —— 在靶蛋白上创造/暴露降解信号（degron）：E3 始终存在，底物上的"被识别标签"平时被掩藏，特定事件后暴露
- 磷酸化暴露隐藏 degron：典型例子 IκB 被 IKK 激酶磷酸化 → 暴露磷酸化 degron → SCF^β-TrCP 识别 → 泛素化降解 → 释放 NF-κB 入核 → 启动炎症基因
- 蛋白亚基解离暴露信号：原本被伴侣蛋白盖住的 degron，伴侣离开后暴露
- 肽键切割产生"不稳定 N 端"（N-end rule，N 端规则）：蛋白被蛋白酶切割后，新生 N 端的氨基酸决定半衰期 —— Arg/Lys/Phe 等为"不稳定"残基，被 UBR1 类 E3 快速识别降解；Met/Val/Ala 等为"稳定"残基
人类约80%蛋白质的N-末端被乙酰化，该修饰被特异E3识别
正确折叠时乙酰化N-末端被埋藏 → 蛋白老化或损伤后暴露 → 触发降解

蛋白质调控降解的两种机制

从RNA到蛋白质

从DNA到蛋白质有许多步骤

基因表达的完整路径包含许多步骤，每一步都影响最终蛋白质水平：
- 转录起始
- 加帽、延伸
- 剪接
- 切割、加poly-A尾和终止
- mRNA输出到细胞质
- 翻译起始
- 翻译完成与蛋白质折叠
- mRNA降解
- 蛋白质降解
细胞中蛋白质的最终量取决于合成速率与降解速率的平衡
原则上每一步都可以被调控
细胞投入大量资源降解蛋白质，特别是折叠不正确或老化受损的蛋白质

真核细胞蛋白质产生的完整路径

从RNA到蛋白质

小节总结 — 从RNA到蛋白质

1. 遗传密码：mRNA 以三联体密码子编码 20 种氨基酸；64 个密码子（20 aa + 3 终止）→ 具有简并性；在三大生命域中几乎通用，支持 LUCA 共同祖先假说。

2. tRNA 与氨酰-tRNA 合成酶：tRNA 作为接头分子识别密码子（含摆动配对，~30-48 种 tRNA 覆盖 61 个有义密码子）；合成酶通过"多位点身份元件 + 双层校对"将错误率压到 ~10⁻⁴。

3. 核糖体翻译：核糖体（核酶，rRNA 催化）四步循环合成蛋白（A 位结合→转肽→大亚基移位→小亚基移位）；EF-Tu/eEF1A、EF-G/eEF2 + 动力学校对实现 99.99% 准确率；每加 1 个 aa 耗 4 个高能磷酸键。

4. 翻译起止：真核 eIF4F 帽识别 + 扫描 + Kozak；原核 Shine-Dalgarno + 30S 直接定位（→ 多顺反子 mRNA）；病毒 IRES 旁路；终止由释放因子识别 UAA/UAG/UGA + 水解释放多肽。

5. 蛋白质折叠与质控：共翻译折叠 → hsp70（早期接力）+ hsp60（桶状隔离室）分子伴侣；表面大块疏水斑块 = 异常信号；错折叠蛋白经泛素化 → 26S 蛋白酶体降解；NMD（UPF1/2/3 + SMG）清除异常 mRNA。

6. 调控降解（degron）：蛋白终量由合成 ↔ 降解平衡决定；E3 通过识别 degron（D-box、KEN-box、phosphodegron、N-end rule）决定降解时机；APC/C 驱动 cyclin 降解控制细胞周期；分子胶 / PROTAC 把 degron 概念转化为药物（ARV-471 等）。

Section II

RNA世界与生命起源

THE RNA WORLD AND THE ORIGINS OF LIFE

RNA世界与生命起源

单链RNA可折叠为高度精细的结构

RNA世界假说：RNA是唯一既能携带遗传信息又能催化化学反应的分子
RNA通过互补碱基配对和氢键折叠为独特的三维结构
保守的结构基序（motifs）反复出现：发夹环、凸出、假结、四茎连接等
正确折叠的RNA可形成催化表面，就像蛋白质酶一样
许多核酶利用金属离子协助催化，拓展其反应类型
体外选择（in vitro selection / SELEX）实验：
- 从大量随机RNA序列池中筛选具有特定催化活性的RNA
- 已成功筛选出可催化多种反应的合成核酶
- 催化速率仅比最快的蛋白质酶低几个数量级
但蛋白质有20种氨基酸 vs RNA仅4种核苷酸 → 蛋白质催化策略更丰富

RNA结构基序与核酶

常见RNA结构元素；核酶催化RNA切割的机制

RNA世界与生命起源

RNA既能储存信息也能催化化学反应

RNA独有的特性：可直接指导自身序列复制
这依赖于互补碱基配对 → 一条RNA可作为模板合成互补链
这正是现代细胞中DNA复制和转录的核心原理
要实现高效的模板依赖RNA合成，需要催化剂促进聚合反应
RNA具备催化自身合成所需反应的全部特性 →
提出假说：早期RNA曾充当模板依赖RNA合成的催化剂
虽然自然界尚未发现自复制RNA系统，但实验室中已取得重要进展
成功构建此类系统不能证明但可支持RNA世界假说的合理性

合成核酶的体外选择（SELEX 流程）

能催化自身合成的 RNA 分子（自复制核酶概念）

RNA世界与生命起源

蛋白质合成是如何进化的？

现代蛋白质合成极其复杂，依赖蛋白质-RNA互锁系统 → 蛋白质不可能先于翻译装置存在
无密码的早期肽合成：
- 某些短肽（如抗生素）在现代细胞中不经核糖体合成
- 肽合成酶直接组装特定序列，无需mRNA指导
- 推测RNA世界中此类反应由核酶催化
遗传密码的起源：
- 实验室创造的核酶可执行特异的氨酰化反应（匹配氨基酸和tRNA）
- 类tRNA接头分子可能在RNA世界中演化出 → 遗传密码的雏形
一旦有密码的蛋白质合成进化完成：
- 蛋白质逐渐接管催化和结构任务（20种氨基酸 vs 4种核苷酸 → 更大多样性）
RNA → DNA的转变：
- 核糖 → 脱氧核糖（化学更稳定，可维持更长链）
- 双螺旋和胸腺嘧啶进一步增强稳定性和修复能力

宇宙与生命起源时间线

RNA世界与生命起源

小节总结 — RNA世界与生命起源

1. RNA 的双重能力：RNA 是唯一既能储存遗传信息又能催化化学反应的生物分子，支持 RNA 世界假说（早期生命可能以 RNA 一身二任）。

2. RNA 结构多样性：单链 RNA 可折叠为复杂三维结构，形成催化活性位点；许多核酶利用 Mg²⁺ / K⁺ 等金属离子扩展反应范围（剪接体 / RNase P / 核糖体均如此）。

3. 体外选择（SELEX）实验：从随机 RNA 池中通过迭代"筛选-扩增"循环可人工进化出多种催化活性的合成核酶 → 实验室证明 RNA 自复制可行性。

4. 蛋白质合成的演化：先有无密码的核酶催化短肽合成，后演化出类 tRNA 接头 → 遗传密码 → 现代核糖体；蛋白质逐渐"接管"大部分酶活，但最古老的催化（肽键形成、剪接、tRNA 加工）仍由 RNA 保留—— 见前页 RNP 酶汇总。

5. DNA 的出现：DNA 作为更稳定的遗传信息载体（脱氧核糖更耐水解、双螺旋易于修复、5-甲基胞嘧啶降低突变）最终取代 RNA 成为基因组物质，但 RNA 仍保留催化和调控角色 → 形成"DNA → RNA → 蛋白"的中心法则。

Section III

蛋白质翻译相关药物开发案例

From Ribosome Mechanism to Therapeutic Intervention

药物开发案例

Tetracycline / Tigecycline：阻断氨酰-tRNA进入A位，广谱抑菌

中文药名：四环素 / 替加环素
作用环节：细菌30S小亚基A位 → 阻止氨酰-tRNA与mRNA密码子配对
与30S亚基16S rRNA及蛋白S7结合，阻断aa-tRNA·EF-Tu·GTP三元复合物进入
真核80S核糖体对四环素亲和力低，且缺乏主动摄入系统 → 选择性杀菌
替加环素（第三代）能克服外排泵耐药，用于多重耐药（MDR）感染
重点提示：A位tRNA选择是翻译保真度的关键步骤，也是多类抗菌药的核心靶点

四环素阻断30S A位氨酰-tRNA结合

课堂问题：四环素选择性靶向细菌而非真核细胞的分子基础是什么？细菌为何能通过外排泵快速产生耐药？

药物开发案例

Azithromycin / Erythromycin：结合50S出口隧道，阻断肽链转位

中文药名：阿奇霉素 / 红霉素
作用环节：细菌50S大亚基肽链出口隧道（NPET）→ 阻断肽链延伸与转位
与23S rRNA结合，物理阻塞正在延伸的新生肽链穿越隧道
短肽可勉强合成，但较长肽链合成受阻，导致翻译过早终止
呼吸道感染（肺炎、支原体）常用；阿奇霉素因半衰期长、组织浓度高而广泛应用
重点提示：肽链出口隧道结构变化（23S rRNA甲基化）是大环内酯耐药的分子基础

大环内酯类阻断50S肽链出口隧道

课堂问题：23S rRNA A2058位甲基化如何从结构上解释MLSB耐药表型的形成？

药物开发案例

Linezolid / Tedizolid：阻断70S起始复合物，最后防线抗MRSA

中文药名：利奈唑胺 / 特地唑胺
作用环节：细菌70S起始复合物组装 → 阻止30S·mRNA·fMet-tRNA三元预起始复合物与50S结合
结合23S rRNA V区，阻断IF2/fMet-tRNA在P位的正确定位
对MRSA、VRE等多重耐药革兰阳性菌有效，是医院获得性感染的重要选择
MAO抑制特性导致血清素综合征风险；骨髓毒性限制长疗程使用
重点提示：翻译起始复合物形成是进化上保守但细菌特有细节多的靶点

利奈唑胺阻断70S起始复合物

课堂问题：利奈唑胺耐药率仍相对较低，与其靶位（23S rRNA）改变需要多拷贝突变积累有何关系？

药物开发案例

Bortezomib / Carfilzomib：蛋白酶体抑制，破坏翻译后蛋白质稳态

中文药名：硼替佐米 / 卡非佐米
作用环节：26S蛋白酶体20S催化核心β5亚基 → 抑制泛素-蛋白酶体系统（UPS）
UPS是细胞清除错误折叠/多余蛋白质的主通路，维持翻译后蛋白质稳态
多发性骨髓瘤细胞产生大量免疫球蛋白 → 对UPS依赖性极高 → 蛋白酶体抑制致死
硼替佐米为多发性骨髓瘤一线；卡非佐米毒性更低
重点提示：将翻译后蛋白质质量控制体系（UPS/热休克蛋白）纳入治疗靶点视野

硼替佐米抑制26S蛋白酶体

课堂问题：为什么多发性骨髓瘤对蛋白酶体抑制剂特别敏感，而大多数实体肿瘤响应有限？

药物开发案例

PROTAC / 分子胶：主动"安装" degron，诱导靶蛋白降解

技术类别：PROTAC（PROteolysis TArgeting Chimera，蛋白降解靶向嵌合体）+ 分子胶（molecular glue）
作用环节：不阻断蛋白功能，而是招募 E3 泛素连接酶给靶蛋白强制泛素化 → 蛋白酶体降解 —— 人工"安装" degron
分子结构：warhead（结合靶蛋白）+ linker（连接子）+ E3 ligand（招募端，常用 CRBN / VHL）
三大优势：事件驱动（催化式，剂量低）/ 可降解 undruggable 靶点（转录因子等）/ 克服耐药突变
代表药物：
- Vepdegestrant（ARV-471，Arvinas/Pfizer）：ER 降解剂，ER+/HER2− 转移性乳腺癌，2026 年 5 月 1 日 FDA 批准 —— 全球首个获批的 PROTAC 药物
- Bavdegalutamide（ARV-110）：AR 降解剂 → 去势抵抗性前列腺癌
分子胶前辈：来那度胺（Lenalidomide）—— 结合 CRBN E3 → 让 IKZF1/3 转录因子被降解 → 多发性骨髓瘤一线（沙利度胺类，1950s 致畸药 → 21 世纪明星药）
教学意义：从"抑制功能"到"降解蛋白"—— 范式革命；直接把第 182 页 degron / E3 机制转化为治疗策略

PROTAC 工作机制概念图

ARV-471（Vepdegestrant）结构与机制

课堂问题：PROTAC 不直接抑制酶活而是诱导降解，为什么能克服传统小分子抑制剂的耐药？对于本身没有酶活的转录因子（如 MYC、AR），PROTAC 提供了什么独特机会？

药物开发案例

Rapamycin / Everolimus：抑制mTORC1，下调帽依赖性翻译起始

中文药名：雷帕霉素 / 依维莫司
作用环节：mTORC1 → 4EBP1磷酸化失活 → eIF4E释放 → 帽依赖翻译起始
mTORC1抑制 → 4EBP1不被磷酸化 → eIF4E被封锁 → 含5'TOP/高度结构化mRNA的翻译减少
MYC、Cyclin D1等促癌蛋白的翻译依赖eIF4E，因此mTOR抑制对高PI3K/Akt活性肿瘤有效
肾癌、乳腺癌、胰腺神经内分泌瘤等；也用于器官移植免疫抑制
重点提示：把"营养感应-mTOR通路-翻译调控"链条连成完整的细胞信号-基因表达图景

mTORC1调控4EBP1与帽依赖翻译

课堂问题：mTOR抑制剂对翻译的影响具有mRNA选择性，哪类mRNA的翻译最依赖eIF4E？

药物开发案例

mRNA疗法（BNT162b2 / mRNA-1273）：将翻译机器转变为药物工厂

技术类别：脂质纳米颗粒（LNP）递送体外转录mRNA → 人体细胞核糖体翻译靶蛋白
作用环节：直接提供优化mRNA，利用宿主翻译机器（80S核糖体）合成目的蛋白
mRNA经修饰（N1-甲基假尿嘧啶）降低免疫原性、提高稳定性；5'帽+3'polyA增强翻译效率
编码SARS-CoV-2刺突蛋白（或其他靶蛋白），诱导免疫应答
COVID-19疫苗（2020年）；肿瘤新抗原疫苗、蛋白替代疗法正在临床试验
重点提示：mRNA药物设计的核心正是翻译生物学——密码子优化、UTR调控、核糖体载荷

LNP-mRNA递送与细胞内翻译

课堂问题：密码子优化如何提高mRNA药物的翻译效率？与原始序列相比，优化序列在哪些环节改变了翻译动力学？

药物开发案例

AAV基因疗法（Zolgensma / Luxturna）：递送功能基因恢复正常蛋白翻译

技术类别：腺相关病毒（AAV）载体递送功能性基因拷贝至靶细胞
作用环节：基因转导 → 细胞核内转录 → 功能性mRNA合成 → 80S核糖体翻译产生功能蛋白
Zolgensma（onasemnogene abeparvovec）：AAV9递送SMN1，治疗SMA；单次注射，终身获益
Luxturna（voretigene neparvovec）：AAV2递送RPE65基因，治疗遗传性视网膜营养不良
靶向组织需选择合适的AAV血清型（AAV9→神经系统；AAV2→视网膜）
重点提示：AAV疗法的成功依赖对目标蛋白功能缺失机制、翻译调控及细胞导入效率的深刻理解

AAV载体递送功能基因与蛋白表达恢复

课堂问题：AAV基因疗法和mRNA疗法在持久性、免疫原性和生产复杂度上有何根本差异？各自适合哪类疾病？

药物开发案例

siRNA（Patisiran / Givosiran）：RISC降解mRNA，从源头阻断翻译

技术类别：外源siRNA导入细胞 → 与RISC结合 → Ago2切割靶mRNA → 翻译模板消除
Patisiran（帕替司兰，2018）：LNP包裹siRNA靶向TTR mRNA；TTR蛋白合成受抑，淀粉样蛋白沉积减少，神经病变改善（hATTR）
Givosiran（吉沃司兰，2019）：GalNAc-siRNA靶向ALAS1 mRNA（氨基乙酰丙酸合酶1）；减少δ-ALA毒性代谢物积累，治疗急性肝性卟啉症
siRNA通过消灭翻译模板来阻断蛋白质合成，本质是"上游断源"而非直接干预核糖体
效果持久（mRNA降解后需重新转录才能恢复），每月或每年给药一次即可维持
重点提示：RISC介导的mRNA降解完美诠释了"翻译前调控"对蛋白质输出的决定性影响

siRNA/RISC降解mRNA阻断蛋白翻译

课堂问题：siRNA沉默与反义ASO敲减同样靶向mRNA，二者在作用机制、递送方式和持续时间上有哪些本质区别？

药物开发案例

siRNA（小干扰RNA）：RNAi沉默靶基因，精准阻断DNA修复或肿瘤增殖

技术类别：化学合成21–23nt双链RNA，经LNP或GalNAc递送 → 激活RISC复合物 → 降解靶mRNA
DNA修复关联：siRNA沉默PARP1、BRCA2、RAD51等修复基因可作为体外"功能丧失"研究工具
肿瘤治疗方向：siKRAS（靶向G12D突变胰腺癌）、siPLK1（靶向有丝分裂检查点激酶）已进入临床
Atu027（siPKN3，LNP递送）：首个进入II期临床的siRNA肿瘤药；探索肿瘤血管标靶
与PARP抑制剂或化疗联合，可构建"修复干扰＋细胞毒"的复合方案
重点提示：siRNA让研究者可以"按需敲低"任意修复基因，是解析修复通路层级关系的利器

siRNA激活RISC靶向mRNA降解

课堂问题：siRNA疗法靶向肿瘤细胞的最大挑战之一是递送效率，LNP和GalNAc各擅长递送到哪类组织？

药物开发案例

ASO外显子跳跃（Eteplirsen / Golodirsen）：纠正读码框，恢复功能蛋白翻译

技术类别：反义寡核苷酸（ASO）与pre-mRNA互补结合 → 遮蔽剪接调控序列 → 诱导特定外显子跳跃 → 恢复开放阅读框
Eteplirsen（依特普利森，2016）：靶向DMD基因外显子51的剪接受体区；跳过外显子51恢复部分阅读框，产生截短但仍有功能的肌营养不良蛋白（Duchenne型→Becker型）
Golodirsen / Viltolarsen：分别靶向外显子53，针对不同突变亚型（约8%的DMD患者）
翻译水平：由"截短框移突变→无蛋白"变为"截短但有功能蛋白"，翻译输出质量改变
该策略需根据患者具体突变位置个性化设计外显子跳跃方案（精准医学）
重点提示：ASO外显子跳跃展示了如何通过调控前体mRNA剪接，最终影响翻译产物的结构与功能

ASO外显子跳跃恢复DMD读码框

课堂问题：Eteplirsen只能帮助约13%的DMD患者，为什么外显子跳跃策略不能通用？突变位置与可跳跃外显子的关系是什么？

药物开发案例

腺病毒与AAV基因治疗：递送可翻译基因，恢复缺失蛋白表达

腺病毒（Adenovirus）特点：大包装容量（~36 kb），高感染效率，不整合；在细胞质和核内均可表达，但表达为瞬时性（数周至数月）
AAV特点：小包装容量（~4.7 kb），低免疫原性，部分血清型可长期游离体表达；Zolgensma（SMA）、Luxturna（视网膜病变）已获批
两者均利用宿主核糖体翻译导入的外源基因mRNA，从而补充细胞缺失的功能蛋白
腺病毒适合短期高表达场景（疫苗、肿瘤治疗）；AAV适合长期蛋白替代（遗传病）
密码子优化、Kozak序列设计是提高翻译效率的关键工程要素
重点提示：无论腺病毒还是AAV，最终的治疗效果都取决于宿主翻译机器的效率与调控能力

腺病毒与AAV载体比较

课堂问题：同样治疗SMA，AAV9（Zolgensma）与ASO（Nusinersen）在基因表达层次和治疗逻辑上有何根本不同？

药物开发案例

小节总结 — 蛋白质翻译相关药物开发案例

1. 核糖体靶向抗菌药：四环素（30S A 位）、大环内酯类（50S 出口隧道）、利奈唑胺（70S 起始）分别干预翻译三阶段，利用细菌 70S vs 真核 80S 结构差异实现选择性，是抗菌药物开发的经典教学主线。

2. 翻译后蛋白稳态调控：硼替佐米（蛋白酶体抑制）—— 阻断 UPS 让骨髓瘤细胞中毒蛋白堆积；PROTAC / 分子胶（ARV-471, 2026.5 全球首批 ⭐；Lenalidomide）—— 反向主动诱导降解，把第 22 页 degron 概念变成治疗策略；雷帕霉素抑制 mTORC1-4EBP1 轴调控帽依赖翻译。

3. 核酸药物调控翻译输出：siRNA（Patisiran / Givosiran）激活 RISC 降解 mRNA 断绝翻译原料；ASO 外显子跳跃（Eteplirsen）纠正读码框恢复截短功能蛋白；mRNA 疗法（BNT162b2 / mRNA-1273）直接提供可翻译模板（绕开转录）。

4. 基因递送恢复翻译：AAV（Zolgensma SMA、Luxturna 视网膜病）和腺病毒载体将功能基因导入，借宿主核糖体翻译产生长期 / 瞬时蛋白；密码子优化、Kozak 设计、polyA 长度是工程关键。

5. 技术模态全景（六层干预）：① 小分子直接抑制（抗生素 / 蛋白酶体）→ ② 诱导降解（PROTAC / 分子胶）→ ③ mRNA 靶向（siRNA / ASO）→ ④ mRNA 替代（mRNA 疫苗 / saRNA）→ ⑤ 基因递送（AAV / 腺病毒）→ ⑥ 表观调控（mTOR 信号）。完整覆盖"从基因到蛋白"的多层级干预体系。

本讲总结

1. 翻译机制：遗传密码（64 个三联体 + 简并性 + 摆动配对）通过 tRNA 接头与核糖体（70S/80S，本质是核酶）解码，把 mRNA 核苷酸序列翻译成蛋白氨基酸序列。氨酰-tRNA 合成酶 + EF-Tu / EF-G + 核糖体动力学校对让错误率压到 ~10⁻⁴。

2. 翻译起止与多样性：真核 eIF4F-cap 扫描 + Kozak；原核 SD-anti-SD 配对（→ 多顺反子）；终止由释放因子识别；遗传密码可"重编码"扩展（Sec / Pyl）—— 翻译不是刚性的字典。

3. 蛋白质质量控制 + 调控降解：共翻译折叠 + hsp70/hsp60 分子伴侣；表面疏水斑块 → 26S 蛋白酶体经泛素化降解；NMD（UPF1-SMG）清除异常 mRNA；E3 通过识别 degron（D-box/KEN-box/phosphodegron/N-end rule）实现可调控降解。

4. RNA 世界视角（贯穿四讲）：核糖体 + 剪接体 + RNase P 等核心机器仍由 RNA 催化 —— 是 RNA 世界假说的分子化石；DNA → RNA → 蛋白的中心法则是漫长进化的结果，而非起点。

5. 翻译生物学 → 药物开发：从经典抗生素（核糖体）→ 蛋白酶体抑制（硼替佐米）→ PROTAC 主动降解（ARV-471，2026.5 全球首批 ⭐）→ siRNA / ASO / mRNA / AAV，构成完整的"翻译干预"药物谱，体现基础研究如何驱动临床创新。

课堂问答 · 答案

若单独抑制原料供给，哪些正常组织最容易出现副作用？

核心原则：增殖最快的正常组织 = dNTP 池下降时无法维持复制 → 最早出现毒性。

▸骨髓造血细胞（最显著、剂量限制性毒性）—— 中性粒减少 / 血小板减少 / 贫血
▸胃肠道黏膜上皮（更新周期 3–5 天）→ 黏膜炎、口腔溃疡、腹泻
▸毛囊 → 脱发
▸生殖细胞 → 致畸性、生育力下降；孕期禁用
▸皮肤、指甲（慢性用药）→ 色素沉着、下肢溃疡

关键认知

共同特征 = "高增殖速率 + 高 dNTP 消耗"

静止/分化组织（神经元、心肌、成熟肝细胞）几乎不受影响 —— 因为基本不复制 DNA。

教学引申：这是化疗"治疗指数窄"的根本原因 —— 肿瘤选择性来自"快增殖"，但骨髓 / 肠粘膜 / 毛囊也是快增殖组织，无法完全区分。

→ 后续 PARP 抑制剂的"合成致死"思路反向利用：寻找肿瘤特有的修复缺陷，而非依赖增殖速率差。

课堂问答 · 答案

为什么高增殖肿瘤细胞更敏感，但骨髓和毛囊等正常组织也易受影响？

核心：Topo II 是 DNA 复制和有丝分裂必需酶 —— 所有"快增殖"细胞都高度依赖它，**药物选择性只来自"增殖速率差"**，正常的快增殖组织无法被排除。

为什么肿瘤细胞更敏感

▸持续 S/M 期 → Topo II 活性高 → 药物困住切割复合体 → DSB 大量累积
▸检查点缺陷（p53 / ATM 突变）→ 无法停下来修，直接走向凋亡
▸HR / NHEJ 修复能力受损 → DSB 不能清理

为什么骨髓 / 毛囊 / 肠粘膜也受累

▸都是高分裂指数组织 —— Topo II 活性同样高，分子靶点完全一样
▸p53 完整 → 出现 DSB 反而更易触发凋亡

特征性毒性两个例子

多柔比星 → 心脏毒性：心肌虽不增殖，但表达 Topo IIβ 同源酶；加上 ROS 攻击线粒体 → 累积性、不可逆

依托泊苷 → 继发性 AML：诱发 MLL（11q23）基因易位，1–3% 长生存者发病

教学落点：化疗的"选择性"建立在数量差（增殖快 vs 慢），不是质量差（机制不同）—— 正常的快增殖组织躲不掉。

→ 这是促使药物开发从"普打增殖"走向精准靶向（如 PARP 合成致死）的根本动力。

课堂问答 · 答案

Topo I 与 Topo II 抑制剂在机制和不良反应谱上的差别

核心：Topo I 抑制剂"间接"造 DSB（先困住单链切口，复制叉撞上才转成 DSB）；Topo II 抑制剂"直接"造 DSB（药物诱导的双链切割复合体本身就是 DSB）。

机制差别

维度	Topo I（CPT 类）	Topo II（依托/多柔）
切割类型	单链 SSB	双链 DSB（直接）
ATP 需求	不需	需要
致命损伤来源	复制叉碰撞 → DSB	直接 DSB
细胞周期	强 S 期依赖	S/G2/M 期
同源酶	单一	IIα + IIβ（心肌）

不良反应谱（特征性）

Topo I（伊立替康 / 托泊替康）

▸早发胆碱能综合征（24h 内出汗、急性腹泻）
▸迟发性严重腹泻（剂量限制；SN-38 经 UGT1A1）
▸UGT1A1 *28 多态 → 严重中性粒减少 + 暴发性腹泻

Topo II（依托泊苷 / 多柔比星）

▸多柔比星累积性心脏毒性（不可逆，>450 mg/m² 风险陡增；机制：Topo IIβ + ROS）
▸多柔比星外渗性组织坏死（强发疱剂）
▸依托泊苷继发 AML（t(11q23) MLL 易位，1–3%）

共同毒性：骨髓抑制、脱发、黏膜炎、恶心呕吐

课堂问答 · 答案

同为核苷类似物，为什么不同肿瘤对药物敏感性差异很大？

核心：核苷类似物是"前药"，需要细胞代谢链激活才能起效。这条"激活—失活—利用"链条上每一环都由肿瘤特异表达的酶/转运体决定 —— 任何一环阻塞都显著影响敏感性。

五个关键决定因素

①摄取（hENT1 转运体）：低表达 → 药物进不去 → 耐药；胰腺癌 hENT1 是 gemcitabine 应答预测因子
②激活激酶（DCK）：限速酶，AML 高表达 → ara-C 极敏；下调是经典获得性耐药
③失活酶（CDA）：脱氨基失活药物；实体瘤 CDA 高 → ara-C 几乎无效
④dNTP 池（RNR）：内源 dCTP 与药物竞争掺入；高 RNR → 耐药
⑤增殖速率 + 修复 + 凋亡能力：不复制 → 不掺入 → 没毒性

"同药异效"临床例

药物	高敏感	不敏感
Ara-C	AML / ALL	几乎所有实体瘤
Gemcitabine	胰腺癌、NSCLC	同癌种间差异大
Fludarabine	CLL / 惰性 NHL	实体瘤无效

→ 这是"伴随诊断"理念早期范例（hENT1、DCK、CDA、UGT1A1 都已成为生物标志物）。

课堂问答 · 答案

为何阿昔洛韦对不同病毒家族疗效差异明显？

核心：ACV 的疗效完全取决于两个病毒特异性前提：① 病毒自带 TK且能高效磷酸化 ACV；② 病毒DNA pol 对 ACV-TP 高度敏感。两者任一缺失，药物近乎无效。

选择性指数 ~3000 倍：病毒细胞中 ACV-TP 浓度比未感染细胞高三个数量级。

各病毒家族敏感性

病毒	TK 状况	效果
HSV-1/2	强 TK，高亲和	金标准
VZV	TK ~10× 弱	高剂量有效
EBV	TK 弱	有限有效
CMV	无 TK！用 UL97	无效 → 用 GCV
HIV / HBV / 流感	非疱疹科	完全无效

起效"三步链"

          ACV (前药)

             ↓ 病毒 TK ← 选择性 ①

          ACV-MP

             ↓ 宿主激酶

          ACV-TP

             ↓ 病毒 DNA pol ← 选择性 ②

          掺入 + 链终止 + "死端复合物"

→ CMV 例外正引出下一页 ganciclovir：UL97 替代 TK 角色 → 选择性恢复。

课堂问答 · 答案

在重症或免疫抑制患者中，疗效与毒性如何做动态平衡？

核心：这群患者既"必须用药"（CMV 肺炎死亡率历史 > 50%）又"承受不住毒性"（骨髓刚重建、肾功能受损、多器官受累）。平衡靠风险分层 + 个体化剂量 + 联合降毒 + 监测驱动 + 新机制药物替代。

六个核心策略

①三种治疗时机：普遍预防 / 抢先治疗 / 病灶治疗 —— 根据风险+设施选
②剂量个体化：诱导/维持二相 + CrCl 调整 + TDM
③联合降毒：GCV+Foscarnet 协同；Cidofovir+Probenecid+水化（强制方案）
④CMV-IVIG 联合：尤其 HSCT 后 CMV 肺炎，可减少抗病毒药剂量
⑤支持治疗：G-CSF（GCV 致中性粒减少）、EPO、电解质监测
⑥耐药驱动调整：UL97 突变 → Foscarnet；UL54 多药耐 → Maribavir

游戏规则改变者：新机制药物

Letermovir（terminase 抑制剂）—— 完全不同靶点，无骨髓 / 肾毒 → HSCT 预防一线（NCCN 一类推荐）

Maribavir（UL97 抑制剂）—— 难治/耐药 CMV 救援，安全性远优于 GCV

→ "高毒性药降级为救援药"是当前移植中心的实际做法

教学引申：当一类药物的治疗指数已被"挤干"，真正的进步来自换靶点。

这是从"经验治疗"过渡到"数值驱动 + 实时调整"的现代抗病毒治疗范式。

课堂问答 · 答案

面对耐药上升，临床端和公共卫生端分别可以做什么？

核心：耐药 = 个体用药行为 × 群体使用强度 × 环境基因传播。临床端管"用得对"，公共卫生端管"少诱因 + 监测 + 制度约束 + 创新激励"，两端形成闭环。

临床端

▸Stewardship：该用才用、最短疗程、降阶梯；FQ 不用于单纯 UTI
▸诊断驱动：快速分子诊断、本地 antibiogram、区分定植 vs 感染
▸替代方案：呋喃妥因 / 磷霉素 / TMP-SMX 治疗简单尿感
▸联合用药：严重感染时减少单药耐药出现
▸感染防控（IPC）：手卫生、接触隔离、CRE/MRSA 主动筛查
▸疫苗 + 患者教育：流感 / 肺炎链球菌疫苗减少抗生素需求

公共卫生端

▸监测网络：WHO GLASS、CARSS、One Health（人-动-环境）、污水监测
▸监管立法：处方化、农牧业禁用关键抗生素（mcr-1 后 colistin 限用）
▸国家行动计划：WHO Global Action Plan on AMR；中国国家行动计划
▸研发激励：CARB-X、AMR Action Fund、英国订阅模型、PASTEUR 法案
▸疫苗推广：伤寒结合疫苗 (TCV) 直接削减 FQ 使用
▸WASH 基建：清洁水 + 卫生减少腹泻疾病、减少抗生素需求
▸国际协调：Quadripartite One Health（WHO+WOAH+FAO+UNEP）

教学引申：耐药是"经济外部性"问题（公地悲剧）—— 个体理性选择加总后导致整体灾难。单纯靠教育不够，必须有制度和监管约束；新抗生素研发陷市场失灵 → 需人为创造经济激励。

课堂问答 · 答案

NER 缺陷患者为何既对铂类高度敏感，又易发癌症？

核心：NER 是修复"大体积扭曲损伤"的主力——它同时承担两个角色：① 清除铂类化疗形成的 DNA 加合物；② 清除日常 UV / 致癌物形成的损伤。NER 缺陷 → 两个角色同时崩 → 化疗超敏 + 致癌风险陡增。

为什么对铂类超敏

▸铂类（cisplatin / carboplatin）与嘌呤 N7 共价结合 → 链内 1,2-d(GpG) 加合物
▸这种加合物使双螺旋扭曲 → 主要由 NER 识别清除
▸NER 缺陷 → 加合物累积 → 复制叉撞上 → DSB → 凋亡
▸临床上 NER 缺陷肿瘤对铂类 IC₅₀ 显著降低（~10× 敏感）

为什么易致癌（XP 综合征）

▸UV 形成嘧啶二聚体是 NER 的标准底物
▸NER 缺陷 → 嘧啶二聚体不能被清除 → 复制时产生大量错配 → 突变累积
▸XP 患者：皮肤癌风险 ~1000×（基底细胞癌、鳞癌、黑色素瘤）；常在 10 岁前发病
▸避免日光 + 严密筛查是唯一长期管理

教学要点：这是"修复缺陷的双面性"经典案例 —— 同样的 NER 缺陷在不同情境下：在化疗中是"治疗优势"（药物超敏），在日常生活中是"致命风险"（致癌易感）。这种"同一基因双向作用"现象后续在 BRCA + PARP 合成致死中再次出现。

课堂问答 · 答案

MGMT 启动子未甲基化的肿瘤，TMZ 治疗策略如何调整？

核心：MGMT 启动子未甲基化 = MGMT 蛋白正常表达 = 持续"修复"TMZ 制造的 O⁶-甲基鸟嘌呤损伤 = TMZ 失效。临床策略要么压制 MGMT，要么绕开 MGMT 通路。

机制回顾

TMZ → DNA 上 O⁶-甲基鸟嘌呤 → 与 T 错配 → MMR 触发凋亡

MGMT（O⁶-甲基鸟嘌呤 DNA 甲基转移酶）能"自杀式"接收甲基 → 把 G 还原 → 损伤被消除 → TMZ 失效

MGMT 启动子甲基化 → 表观沉默 → MGMT 表达低 → TMZ 高效；未甲基化反之

临床证据

▸胶质母细胞瘤：MGMT 甲基化者中位生存期 ~21.7 月 vs 未甲基化 ~12.7 月（Stupp 试验）
▸MGMT 状态已成 GBM 治疗的标准伴随诊断

五种调整策略

①剂量密集方案（dose-dense）：剂量分次连续给药耗竭 MGMT 库存；早期试验未显著获益但仍探索中
②MGMT 抑制剂联用：O⁶-苄基鸟嘌呤 / lomeguatrib 直接耗竭 MGMT；增加正常组织毒性，临床受限
③改用其他化疗：PCV 方案（procarbazine + CCNU + 长春新碱）；洛莫司汀等
④联合放疗 + 免疫治疗：放疗 + TMZ + 抗 PD-1（少数 GBM 亚型有效）；TTFields（电场治疗）已获批联用
⑤临床试验：靶向 IDH 突变（vorasidenib）、CAR-T、肿瘤疫苗等

课堂问答 · 答案

合成致死策略缺乏可靠生物标志物时，会面临哪些临床挑战？

核心：合成致死的"精准"完全建立在"能识别脆弱亚组"之上 —— 没有生物标志物 = 大海捞针 + 浪费医疗资源 + 高副作用承担。

五大挑战

①无效率高：HR 完整患者占多数 → PARP 抑制剂对其几乎无效 → 给药 = 浪费
②不必要副作用：贫血、血小板减少、白血病 / MDS（长期 PARP 用药 1–2% 风险）→ 让无效患者承担
③医疗经济压力：PARP 抑制剂年费 ~10 万美元 → 全人群用药不可持续
④临床试验失败：未分层入组的 III 期试验阴性概率高 → 错失真有效药物
⑤耐药机制复杂：BRCA 回复突变 / 53BP1 缺失 / PARP 突变 → 失去敏感性，但无法识别

应对策略 — 标志物在演进

▸BRCA1/2 胚系突变：最早最直接的标志（占适应症 ~10–15%）
▸HRD score：基因组瘢痕评分（如 Myriad MyChoice CDx）—— 整合 LOH + TAI + LST 三个指标，扩大可治疗群体
▸"BRCAness" 表型：广义 HR 缺陷（含 PALB2、RAD51C/D、CHK2 突变）
▸功能性 HR 检测：γH2AX 灶 / RAD51 灶免疫荧光 → 直接看活细胞 HR 能力（开发中）
▸液体活检 ctDNA：动态监测 BRCA 回复突变 → 早期识别耐药
▸联合方案探索：PARP + 免疫治疗 / 抗血管 / ATR 抑制剂 → 扩大获益人群

教学引申：合成致死代表了从"普打增殖"到"精准利用脆弱性"的范式转变，但"精准"必须配套"识别工具"—— 否则"精准"反而变成"碰运气"。这正是伴随诊断（companion diagnostics）这一行业兴起的原因。

课堂问答 · 答案

检查点抑制剂为何通常需要与 DNA 损伤剂联合，而非单药？

核心：检查点抑制剂（ATR / CHK1 / WEE1）只是"解除安全锁"——本身不制造损伤。要让肿瘤细胞死，必须有损伤；DNA 损伤剂正好提供"子弹"。两者协同 = "制造伤口 + 不让修" → 强迫带损细胞分裂 → 死亡。

单药为何效果有限

▸正常细胞内源 DSB / 复制压力很低 → 单药 ATR/WEE1 抑制不会触发明显死亡
▸大多数肿瘤虽有基线复制压力，但单药"剂量窗口窄"
▸例外：ARID1A、ATM、p53 等突变带来内源高复制压力的肿瘤 → 单药也可能有效（少数子集）

联合的协同逻辑

DNA 损伤剂 → 大量 DSB / 复制压力

+ ATR/WEE1 抑制 → 无法停车修理

= 带损细胞强迫进入有丝分裂

→ 有丝分裂灾难 → 凋亡

临床联合方案

检查点抑制剂	联用 DNA 损伤剂
ATR (Berzosertib)	铂类、gemcitabine、放疗
CHK1 (Prexasertib)	铂类、Topo I 抑制剂
WEE1 (Adavosertib)	放疗、PARP 抑制剂、化疗

→ 也常与 PARP 抑制剂联合：PARP 失败 + ATR 失败 = 双重 HR 通路阻断

教学引申：这是"诱导脆弱 + 利用脆弱"的协同治疗范式 —— 与传统化疗"打增殖"思路不同，目标是把每个治疗组分都变成"协同放大器"而非各打各的。

课堂问答 · 答案

博来霉素肺纤维化毒性与肺细胞 DNA 修复能力的关联？

核心：博来霉素肺毒性 = "药物在肺富集 + 肺上皮修复能力相对薄弱 + ROS 触发慢性炎症-纤维化循环"三因素叠加。修复能力差 = 损伤累积持续 → 持续凋亡 → 持续炎症 → 持续成纤维细胞激活 → 不可逆纤维化。

为何肺特异性受害

①肺组织 bleomycin 水解酶（hydrolase）活性极低 → 药物在肺内积累，浓度比其他组织高 5–10 倍
②高氧环境：肺暴露于环境氧（21% / 治疗时常 > 30%）→ 加速 Fe²⁺-博来霉素复合物产生 ROS
③肺泡 II 型上皮细胞修复 DSB 能力相对有限，且更新慢 → 损伤代谢周期长

DNA 损伤 → 纤维化的因果链

ROS + Fe²⁺ → DNA 单/双链断裂
↓
肺上皮持续凋亡 / 衰老（修复不及）
↓
DAMP 释放 → TGF-β、IL-6 信号激活
↓
成纤维细胞活化 → 胶原沉积
↓
不可逆肺纤维化

临床管理

▸累积剂量限制：< 400 U（成年）；超过后肺纤维化风险陡增
▸基线肺功能 + 治疗中监测：DLCO 下降 ≥ 30% 警告
▸避免高 FiO₂ 环境：术中麻醉、高压氧 → 加重氧化应激
▸高危人群避用：老年、吸烟、既往肺病、肾功能不全
▸已发生纤维化：糖皮质激素 + 抗纤维化药（pirfenidone, nintedanib）支持治疗，但难逆转

→ 这正是"DNA 损伤剂的组织特异性毒性"典型例子：损伤普遍发生，但毒性被"局部代谢能力 + 局部修复能力"放大或限制。

课堂问答 · 答案

CRISPR 编辑效率为何高度依赖 HDR vs NHEJ — 与细胞周期 / 类型有何关联？

核心：Cas9 切割只完成"制造 DSB"这一步；后续用 NHEJ 还是 HDR 修复，决定了编辑结果是基因敲除（indel）还是精准敲入/校正。**HDR 仅在 S/G2 期 + 提供模板时可用**，所以编辑细胞类型决定了能做哪种编辑。

NHEJ — 默认主导

▸所有细胞周期都活跃（G1/G0 主导）
▸不需模板，速度快
▸常造成小 indel（1–10 bp 缺失/插入）→ 移码 → 基因敲除
▸哺乳动物体细胞中编辑结果 80–90% 由 NHEJ 决定
▸适合：基因敲除、突变功能研究

HDR — 高精度但受限

▸仅 S / G2 期可用（需姐妹染色单体或外源模板）
▸需提供 ssODN / dsDNA 修复模板
▸精确替换碱基或插入大片段
▸哺乳动物体细胞中效率仅 1–10%（远低于 NHEJ）
▸适合：基因校正、定点敲入

细胞类型对编辑选择的影响

细胞类型	主导通路	CRISPR 适用
胚胎干细胞 / iPSC	NHEJ + HDR 较好	敲除 + 校正都可
造血干细胞	NHEJ 主导	体外同步化提升 HDR
成熟神经元 / 心肌	G0/G1 → 仅 NHEJ	仅适合敲除
肿瘤细胞	NHEJ + HDR（活跃增殖）	两者都可

优化策略

▸细胞同步化：thymidine 阻断 → S/G2 期富集 → 提升 HDR
▸NHEJ 抑制剂：DNA-PKcs 抑制（NU7441）阻 NHEJ → 强行走 HDR
▸HDR 增强剂：RAD51 表达上调；Cas9 与模板共递送
▸绕过 DSB：Base editing / Prime editing（不切双链）→ 不依赖 HDR
▸体外编辑 + 回输：HSCT 路线（Casgevy）—— 体外细胞可同步化

课堂问答 · 答案

溶瘤腺病毒 ONYX-015 在 p53 突变细胞中选择性复制的分子基础？为何临床结果不及预期？

核心：ONYX-015 = 缺失 E1B-55K 基因的腺病毒。理论上：E1B-55K 的功能是失活宿主 p53 → 让病毒复制不被阻断。缺失它后，p53 完整的正常细胞会阻断病毒复制；p53 突变的肿瘤细胞无此屏障 → 病毒复制 + 裂解。但实际并非如此简单，临床效果远低于预期。

设想的分子基础

正常腺病毒 → E1B-55K 蛋白结合并降解 p53 → 病毒在 p53⁺ 细胞复制

ONYX-015（ΔE1B-55K） →

▸ 在 p53 突变肿瘤：p53 已无功能 → 不需 E1B-55K → 病毒可复制 → 裂解

▸ 在 p53 完整正常细胞：p53 触发凋亡 → 阻断病毒复制 → 不裂解

→ 选择性来自"肿瘤特有 p53 缺陷"

临床失败原因

①E1B-55K 不只失活 p53：还参与 mRNA 出核、宿主 mRNA 抑制等多种功能 → 缺失它使病毒在所有细胞复制都受影响
②选择性远不严格：研究发现病毒在 p53 完整细胞中也能部分复制；在某些 p53 突变细胞中反而复制不佳
③免疫清除快：腺病毒高度免疫原性 → 中和抗体快速形成 → 病毒在体内仅几天活性
④递送局限：通常只能局部注射（瘤内）→ 难以治全身性肿瘤
⑤临床试验结果：单药客观应答率 ~10–15%，远低于预期 → 美国未获批

教学引申：ONYX-015 是"分子选择性溶瘤病毒"的开创性尝试，虽未达预期但奠定了路线。中国 H101（基本相同结构）于 2005 年获批用于头颈部肿瘤（联合化疗）—— 是全球首个上市溶瘤病毒。后继者 T-VEC（HSV 改造，2015 FDA 批准黑色素瘤）走了"免疫激活"路线，效果更可靠。

→ 教训："通路缺陷"作为单一选择性基础往往不够鲁棒，需要多机制叠加（如改造 + 免疫激活协同）。

课堂问答 · 答案

rpoB 突变耐药对利福平联合用药策略的启示

核心：单药利福平极易在数周内被 rpoB 单点突变（如 Ser531Leu）"逃逸" —— 因为单一靶点突变即可获得高度耐药。结核治疗必须采用多药联合 + 长疗程策略，将多种独立耐药基因突变同时发生的概率降到可忽略水平。

耐药机制特点

▸rpoB 突变集中于 81 bp "RRDR"（rifampicin-resistance-determining region）
▸单点错义突变（S531L、H526Y 等）→ 利福平结合口袋形状改变 → 亲和力下降 1000×
▸结核杆菌自发突变频率 ~10⁻⁸；每个空洞 ~10⁹–10¹⁰ 菌量 → 单药治疗几乎必然失败
▸耐多药结核（MDR-TB）= 同时耐利福平 + 异烟肼，全球 ~3–4% 新发病例

联合用药策略要点

①标准 RIPE 四联（强化期 2 月）：Rifampicin + Isoniazid + Pyrazinamide + Ethambutol → 同时突变四个独立靶点概率 ≈10⁻³²
②巩固期 4 月（HR 双联）：抑制残余菌；总疗程 6 月起
③耐药检测先行：Xpert MTB/RIF 60 分钟检测 rpoB 突变 → 指导个体化方案
④MDR-TB 全口服方案：Bedaquiline + Pretomanid + Linezolid（BPaL）→ 全新靶点 + 联合
⑤DOT（直接督导治疗）：保证依从性，避免亚治疗剂量诱导耐药

教学要点：这是"突变概率叠加原理"在临床的经典体现 —— 联合用药不仅追求药效协同，更关键是降低耐药突变累积概率。该原理后续在抗 HIV（HAART 鸡尾酒疗法）、抗肿瘤（多药联合化疗、靶向 + 免疫联合）中反复出现。

课堂问答 · 答案

利用放线菌素D的浓度依赖性区分转录与复制的贡献

核心：放线菌素D 对转录的 IC₅₀ 远低于复制（~50–100×差异）。利用低浓度选择性阻断转录，可在保留复制和翻译的同时，观察某细胞过程是否依赖新转录的 mRNA，进而判断转录贡献。

分子基础

▸放线菌素D 嵌入 GC 富集双链小沟 → 阻碍 RNA pol 沿模板滑动
▸低浓度（<0.04 μg/mL）：rRNA 转录（核仁内 pol I）最敏感，mRNA 转录次之
▸高浓度（>1 μg/mL）：复制（DNA pol）和所有转录均被抑制 → 普遍细胞毒
▸蛋白翻译本身不受影响 —— 已存在的 mRNA 仍可被翻译

实验设计范例

①mRNA 半衰期测定：加入 act D 阻断新转录，时间梯度测残余 mRNA → 衰减曲线给出 t₁/₂
②区分转录性 vs 翻译性调控：刺激后蛋白增加 —— 若 act D 预处理能阻断 → 依赖新转录；若不能 → 已存在 mRNA 的翻译激活
③区分应答需要转录 vs 翻译：act D（阻转录）vs 环己酰亚胺（阻翻译）平行处理 → 比较效果差异
④"超诱导"现象：act D 阻断负反馈调控蛋白合成 → 早期反应基因 mRNA 异常累积，可用于克隆早期基因
⑤病毒学：低浓度 act D 抑制宿主 DNA 病毒转录但保留 RNA 病毒（自带聚合酶）的复制，用于区分病毒类型

教学要点：这是"药理学剂量窗口作为研究工具"的经典范例。同样思路应用于：α-鹅膏蕈碱低浓度专一抑 pol II（区分三种 pol）、5,6-DRB 抑 P-TEFb（区分起始 vs 延伸）等。提醒学生："工具药"的选择性来自浓度差异，不是绝对特异性。

课堂问答 · 答案

BET 抑制剂"间接靶向"MYC 的机制与局限

核心：MYC 蛋白本身缺少可结合的口袋（"undruggable"），无法直接被小分子靶向。BET 抑制剂走"上游转录截断"路线 —— 阻断 BRD4 与超级增强子的结合 → 中断 MYC 转录起始 → MYC 蛋白快速衰减。

间接靶向的机制链

▸MYC 基因上游存在超级增强子（SE），BRD4 高度富集
▸BRD4 募集 P-TEFb（CDK9/CyclinT） → 磷酸化 RNAP II CTD Ser2 → 转录暂停释放
▸JQ1 / OTX015 占据 BRD4 溴域 → 不能识别 H3K27ac/H4ac → 从 SE 脱落
▸MYC mRNA t₁/₂ ~30 min、蛋白 t₁/₂ ~20 min → 转录一停，蛋白迅速消失
▸SE-依赖的"癌细胞偏好性"造就一定治疗窗（正常细胞不那么依赖 SE 驱动）

该策略的主要局限

①特异性差：BRD4 调控全局转录组中数千基因，不止 MYC；脱靶引起血液毒性、消化道毒性
②耐药快速出现：肿瘤细胞通过 BRD4 磷酸化、WNT 通路代偿、SE 重塑等机制恢复 MYC 表达
③单药效果有限：临床 I/II 期单药客观应答率仅 ~10–20%；需要联合（化疗、CDK 抑制剂、免疫）
④不能解决 MYC 扩增/易位本质：基因数量没变，只是表达受抑；停药后反弹
⑤替代/补充策略：MYC 直接 PROTAC 降解、Aurora kinase 抑制剂稳定性破坏、MYC-MAX 二聚体阻断剂等正在探索

教学要点："间接靶向 undruggable"是肿瘤药物开发的重要范式 —— 类似策略包括：PROTAC 降解（替代结合抑制）、合成致死（绕开靶点找通路依赖）、转录因子下游 mRNA 沉默（siRNA / ASO）。BET 抑制剂打开了"染色质阅读器"这一全新靶点类别。

课堂问答 · 答案

Risdiplam vs Nusinersen：机制与依从性差异

核心：两者最终效应相同（促进 SMN2 第 7 外显子纳入），但分子模态、递送方式、组织分布截然不同。Risdiplam 是口服小分子剪接修饰剂，Nusinersen 是鞘内注射 ASO。

比较维度	Risdiplam（Evrysdi，2020）	Nusinersen（Spinraza，2016）
分子类型	口服小分子（~400 Da）	18-mer 2′-MOE 化学修饰 ASO
结合靶点	U1 snRNP – SMN2 pre-mRNA 5′ ss 三元复合体（变构稳定）	SMN2 内含子 7 的 ISS-N1 序列（碱基互补）
剪接调控方式	增强弱 5′ 剪接位点识别	遮蔽 hnRNP A1/A2 抑制元件
给药方式	每日口服液（家中自服）	腰穿鞘内注射（前4剂14、28、56、180天，后每4个月）
组织分布	系统性 —— CNS + 外周（肝、肌肉等）均覆盖	仅 CNS —— 不穿过血脑屏障，必须直接给药
依从性挑战	每日服药、需冷藏；婴幼儿可经口/鼻饲	脊柱侧弯/术后患者腰穿困难；需麻醉、影像引导
主要不良反应	发热、腹泻、皮疹；动物毒理见生殖毒性	腰穿相关：头痛、背痛、感染；蛋白尿、血小板减少
年治疗费用（美国）	~34 万美元（体重相关）	首年 ~75 万，维持期 ~37.5 万

教学要点：这是"同一靶点、不同模态"的典型案例。递送方式往往比机制本身更决定患者体验。Risdiplam 的成功证明"小分子也能精准修饰剪接" —— 颠覆了"剪接调控只能靠 ASO"的固有印象。第三种选择 Zolgensma（AAV9 基因疗法）走"一次性根治"路线，三药各占 SMA 治疗市场不同生态位。

课堂问答 · 答案

AAV 启动子 vs mRNA 5′UTR / 密码子：转录与翻译调控的应用

核心：AAV 把转录调控（启动子、增强子、CTD 招募）的全套原理"外包给宿主"，所以工程设计聚焦于如何在何细胞、以何强度被转录。mRNA 疗法跳过了转录步骤，所有调控压力转移到翻译效率、mRNA 稳定性、免疫原性。

AAV：利用的转录调控原理

▸组织特异性启动子：肝（TBG/LP1）、肌肉（MCK/desmin）、视网膜（RPE65）、神经元（hSyn）→ 限定表达细胞
▸强通用启动子：CAG、CMV、EF1α → 最大转录水平（但易触发免疫）
▸增强子序列：上游 cis-element 募集组织特异性转录因子（HNF1/HNF4 → 肝）
▸内含子加入：合成内含子（如 SV40 small t intron）→ 增强转录后剪接 → mRNA 出核效率提升
▸polyA 信号优化：BGH polyA / WPRE → 提高 mRNA 稳定性
▸挑战：AAV 包装容量 ~4.7 kb 限制 → 必须精简启动子；持久转录 → 难关停

mRNA：利用的翻译/RNA 调控原理

▸5′ cap 类似物（Cap1，ARCA）：模拟天然 m7GpppNm-cap → 高效招募 eIF4F → 翻译起始
▸5′UTR 选择：α-/β-globin UTR 或工程序列 → 优化扫描效率、避免上游 ORF
▸密码子优化：避罕用密码子、调节 GC 含量、优化 tRNA 适配；BNT162b2 通过密码子优化使刺突蛋白产量 ~10×
▸3′UTR + polyA 长度：α-globin 3′UTR + ~100-120 nt polyA → 稳定性提升
▸N1-甲基假尿苷（m1Ψ）取代 U：避免 TLR/RIG-I 识别 → 降低先天免疫；同时提升翻译
▸自扩增 mRNA（saRNA）：自带 RNA 复制酶 → 在胞质放大 → 大幅降低剂量
▸挑战：t₁/₂ 数小时-数天 → 需重复给药；不能用于"需要持续表达"的疾病

教学要点："在哪一步介入"决定了能利用哪些调控杠杆。AAV 介入"基因传递"层 → 全转录调控工具箱可用；mRNA 介入"成熟转录本"层 → 仅翻译与 RNA 稳定性工具可用，但避开了核内步骤与整合风险。理想未来：环状 RNA（circRNA）结合 mRNA 的不整合性与近似 AAV 的稳定性。

课堂问答 · 答案

GalNAc-siRNA 超长效维持的机制；与 LNP 递送的优劣

核心：Inclisiran 的"每年两针"来源于三个机制协同：① GalNAc 三聚体高效肝靶向（ASGPR 受体快速内化）；② 化学修饰 siRNA 极度稳定（数月不降解）；③ RISC 复合体一旦装载即长效（肝细胞分裂慢，RISC 持续切 mRNA）。

GalNAc-siRNA 的优势

▸递送高效：三价 GalNAc-ASGPR 结合 K_d ~nM；肝细胞每分钟内化 ~10⁵ 受体
▸小体积皮下注射：~1.5 mL，门诊 5 分钟完成；患者依从性高
▸免疫原性低：无 LNP 脂质引起的输液反应 / 类过敏 / IgE
▸无需冷链：稳定于常温（vs LNP 需 -20℃ 或更低）
▸长效维持：单次注射后效应持续 ~6 个月（LDL-C 降 ~50% 维持半年）
▸局限：仅适用于肝细胞（其他器官 ASGPR 不表达）；不能递送 mRNA 或大型核酸

LNP 递送的特点

▸通用性强：可装载 siRNA、mRNA、saRNA、Cas9 RNP，体积包容 100 kb
▸多组织递送可调：PEG/可电离脂质比例调整可指向肺、脾、骨髓等
▸输液反应：可电离脂质 + PEG 易触发补体激活 → Patisiran 需类固醇预处理
▸静脉滴注：~80 分钟住院滴注；不便于门诊维持
▸冷链严格：mRNA-LNP（Comirnaty）需 -70℃，限制全球可及性
▸维持期短：Patisiran 每 3 周一次（虽然机制同为 RISC 长效）

教学要点："药物 = 活性分子 + 递送系统" —— Patisiran 与 Inclisiran 拥有几乎相同的核酸化学和机制，但递送策略把两者推向完全不同的市场定位：LNP-siRNA = 罕见病住院方案；GalNAc-siRNA = 普通门诊慢病长效用药。未来肝外靶向（抗体偶联、肽偶联、外泌体）正成为下一代核酸递送的研发热点。

课堂问答 · 答案

腺病毒 vs AAV vs 逆转录病毒载体：持久性与取舍

核心：腺病毒载体表达不持久（数周-数月）——目的基因以游离 dsDNA 存在于细胞核内，随细胞分裂被稀释、并被宿主免疫快速清除。AAV 形成稳定的核内 episome（分裂细胞中也会稀释，但非分裂细胞中可终生维持）；逆转录病毒/慢病毒整合到基因组 → 真正"永久"。三者各有不同临床定位。

维度	腺病毒 (Adenovirus)	AAV	逆转录/慢病毒 (Retro/Lenti)
基因组形式	线性 dsDNA（~36 kb）	线性 ssDNA（~4.7 kb）→ 核内成 dsDNA episome	RNA → 逆转录 dsDNA → 整合宿主基因组
包装容量	~8 kb（Gutless 型可达 ~36 kb）	~4.7 kb（最小，限制基因选择）	~8 kb
整合	否（游离）	主要游离 episome（<1% 整合）	是 —— 永久整合
表达持久性	短（数周-数月，免疫清除）	长（非分裂细胞：数年-终身；分裂细胞：稀释）	永久（传给子代细胞）
分裂细胞转导	高效	高效但表达被稀释	逆转录 = 仅分裂细胞；慢病毒 = 全部细胞
免疫原性	强（预存中和抗体常见；可致严重炎症 —— Jesse Gelsinger 事件）	中等（衣壳抗体可能存在，可阻止再次给药）	较低（VSV-G 假型化后更弱）
插入突变风险	无	很低	有（早期 SCID-X1 试验发生 LMO2 激活致白血病）
典型用途	疫苗（ChAdOx1）、溶瘤病毒、瘤内注射；不适合长期表达	单基因疾病（Zolgensma SMA、Luxturna RPE65、Hemgenix 血友病）	CAR-T 体外改造（Kymriah/Yescarta）、SCID-X1、ADA-SCID

教学要点：选择载体本质是"持久性 vs 安全性 vs 容量"的三角权衡。腺病毒 = 短效高表达（适合疫苗、溶瘤）；AAV = 长效游离（适合非分裂细胞单基因病）；慢病毒 = 永久整合（适合干/T 细胞体外改造）。没有"最好的载体"，只有"最适配的载体" —— 临床决策从疾病特征（细胞分裂状态、基因大小、给药次数）反推选择。

课堂问答 · 答案

四环素选择性 + 外排泵耐药

核心：四环素选择性 = 细菌 30S A 位 vs 真核 40S A 位的微小结构差异；外排泵 = 细菌质粒携带的 tetA / tetK 转运蛋白主动把药排出 → 浓度低于抑制阈值。

选择性的分子基础

▸四环素结合 16S rRNA h34 螺旋，遮挡 A 位 → 阻 aa-tRNA 进入
▸真核 18S rRNA 同源区结构略有差异 → 亲和力低 ~100×
▸四环素分子小、亲脂适中 → 易进细菌（被动扩散 + OmpF 通道），但难达高浓度抑真核细胞

外排泵耐药机制

▸tetA/B/K/L 等基因常位于耐药质粒，可水平转移
▸编码膜泵蛋白 → 用 H⁺ 梯度反向输出四环素 → 胞内浓度低
▸新一代 Tigecycline（甘氨酰环素）改造结构 → 不被泵识别 → 重获抗菌活性

课堂问答 · 答案

23S rRNA A2058 甲基化与 MLSB 耐药

核心：大环内酯类（Macrolide）+ 林可酰胺（Lincosamide）+ 链阳菌素 B（Streptogramin B）= MLSB 三类抗生素都结合 50S 出口隧道、依赖 A2058 腺嘌呤的特定取向；erm 基因编码的甲基转移酶将 A2058 N6 双甲基化 → 隧道空间被占 → 三类药物同时失效（交叉耐药）。

分子机制

▸A2058 位于 50S 大亚基出口隧道入口
▸药物大环内酯通过氢键/疏水作用嵌入隧道，关键接触 A2058 的腺嘌呤
▸Erm 甲基转移酶给 A2058 N6 加 两个甲基 → 隧道入口位阻增大 → 药物无法稳定结合

临床意义

▸erm 基因常在质粒上，水平转移导致广泛传播
▸诱导型 erm 在亚抑制浓度药物诱导下表达 → 治疗过程中"突现"耐药
▸对策：新一代酮内酯（telithromycin）多个结合位点 → 部分克服

课堂问答 · 答案

利奈唑胺耐药率低 = 多拷贝突变累积难

核心：细菌染色体有 4-6 个 rRNA 操纵子（rrn），每个含一份 23S rRNA 基因。利奈唑胺靶位 G2576（23S rRNA）突变要"有效"必须在多个 rrn 拷贝同时发生，单点突变效应被野生型拷贝稀释 → 突变积累慢、耐药率低（< 1%）。

基因剂量稀释机制

▸E. coli 7 个 rrn、金葡菌 5-6 个
▸单个 rrn 突变 → 部分核糖体耐药、大部分仍敏感 → 整体表型仍敏感
▸需要多次基因转换 / 同向突变才能让所有拷贝同步突变 → 概率 ~10⁻⁹

"最后防线"地位

▸对 MRSA、VRE、PRSP 等多耐药菌仍敏感
▸口服 100% 生物利用度，可替代万古霉素的静脉给药
▸近期耐药 cfr 基因（质粒携带）开始出现 → 警示需谨慎使用

课堂问答 · 答案

多发性骨髓瘤为何对蛋白酶体抑制剂极敏感

核心：骨髓瘤是浆细胞恶变，每天合成大量免疫球蛋白（Ig），其中相当比例折叠失败 → 高度依赖 UPS 清除。蛋白酶体抑制 → 错折叠 Ig 堆积 → ER 应激 + UPR → 凋亡。实体瘤合成蛋白量小、对 UPS 依赖低 → 响应有限。

骨髓瘤的"软肋"

▸浆细胞每天分泌 ~10,000 个 Ig 分子/秒
▸~30% Ig 折叠失败 → ERAD → 蛋白酶体降解
▸蛋白酶体抑制 → 错折叠堆积 → 不可逆 UPR + 凋亡
▸同时干扰 NF-κB 通路（IκB 降解依赖蛋白酶体）→ 阻断生存信号

实体瘤的局限

▸非分泌型肿瘤的"未折叠蛋白负荷"较低
▸对正常组织（神经、骨髓）毒性限制剂量
▸对策："诱导高分泌"联合策略（如蛋白酶体抑制 + HDAC 抑制）让实体瘤更敏感

课堂问答 · 答案

PROTAC 为何克服耐药 + 攻克 undruggable

核心：传统抑制剂靠"占位"活性口袋，靶点突变常使药物失效；PROTAC 不需要抑制活性—— 只要任何能结合的位点（甚至变构位点）就可招募 E3 → 把整个蛋白降解 → 突变难逃。对转录因子等无酶活靶点（MYC/AR/ER），PROTAC 把"没法抑制"变成"直接清除"。

克服耐药的三种方式

▸活性位点突变：PROTAC warhead 可结合非活性位点 → 突变无效
▸蛋白过表达：PROTAC 催化式作用 → 即使表达升高仍可降解
▸下游代偿信号：靶蛋白被完全清除 → 不仅没活性，还失去 scaffold 功能

攻克 undruggable 靶点

▸转录因子（MYC、STAT3、雌激素受体 ER）：没有酶活，只有 DNA 结合域
▸传统抑制剂找不到"酶口袋"无从下手
▸PROTAC 只需有一个浅口袋 / 表面接触面就能附着 warhead → 招募 E3 → 整体降解
▸例：ARV-471（ER）、ARV-110（AR）成功验证了这一思路

课堂问答 · 答案

mTOR 抑制剂的 mRNA 选择性

核心：mTOR → 磷酸化 4E-BP1 → 释放 eIF4E；mTOR 抑制 → 4E-BP1 抑制 eIF4E → 最依赖 eIF4E 的 mRNA 翻译被优先抑制。这类 mRNA 共同特征：5'UTR 高度结构化 / 含 TOP（terminal oligopyrimidine）模体，编码细胞增殖与生长关键蛋白（如 c-Myc、cyclin D1、核糖体蛋白、eEF 因子）。

最依赖 eIF4E 的 mRNA 类别

▸TOP mRNA：5' 端以 C/T 寡聚开头，编码核糖体蛋白和 eEF 因子
▸5'UTR 高度结构化：含茎环、富 GC，需 eIF4F 复合物（eIF4E + eIF4A 解旋）才能扫描
▸代表蛋白：c-Myc、cyclin D1、VEGF、HIF-1α（增殖 + 血管生成 + 代谢核心）

治疗与临床意义

▸肿瘤细胞特别依赖这些"增殖驱动"mRNA → mTOR 抑制剂有抗肿瘤潜力
▸正常细胞看家蛋白 mRNA 较不依赖 eIF4E → 选择性窗口
▸Rapamycin / Everolimus 临床用于：肾癌、神经内分泌瘤、肝移植免疫抑制、TSC等

课堂问答 · 答案

密码子优化如何提高 mRNA 翻译效率

核心：密码子优化 = 把氨基酸序列相同但选用人体高频密码子的 mRNA → 让稀有 tRNA 不再成为瓶颈 → 翻译速度提升、稳定性增强、免疫原性下降。BNT162b2 / mRNA-1273 的刺突蛋白产量比原始序列高约 10×。

改变的翻译动力学

▸tRNA 适配速度：高频密码子对应丰富 tRNA → 延伸快速
▸核糖体不卡顿：避免稀有密码子导致的暂停（防止移码 + 错配）
▸GC 含量优化：5'UTR 不过度结构化便于扫描

额外工程要素

▸m1Ψ（N1-甲基假尿苷）替代 U → 避免 TLR/RIG-I 触发先天免疫
▸5' cap1（ARCA）+ 3' polyA 120 nt：稳定 + 翻译效率
▸α/β-globin UTR：经典稳定模板

课堂问答 · 答案

AAV vs mRNA：持久性 / 免疫原性 / 生产复杂度

核心：AAV = "一针解决"但生产难、免疫原性高；mRNA = "反复打"但生产简单、灵活。两类药物适用不同时间尺度的疾病。

维度	AAV 基因疗法	mRNA 疗法
持久性	数小时-数天（mRNA 降解）
免疫原性	中-高：衣壳预存抗体、转基因产物可能引发免疫	低-中：m1Ψ 修饰大幅降低；LNP 仍可触发输液反应
生产复杂度	极高：哺乳细胞培养 + 病毒纯化 + 质控（数月）	低：体外转录 + LNP 包装（数天，可大规模）
剂量调整	不可（一次性给药）	可（反复给药）
适合疾病	单基因病（SMA / 视网膜病 / 血友病）；非分裂细胞为主	急性应用：疫苗、肿瘤新抗原、瞬时蛋白替代
典型药物	Zolgensma、Luxturna、Hemgenix	BNT162b2 / mRNA-1273（COVID 疫苗）

课堂问答 · 答案

siRNA vs ASO：机制 / 递送 / 持续时间

核心：同样靶向 mRNA，但 siRNA 借助RISC 内源机器催化式切割 → 长效（每年 2 针）；ASO 单链化学修饰，靠 RNase H 切割或空间位阻 → 需要持续给药。

维度	siRNA	ASO（反义寡核苷酸）
结构	21-23 nt 双链 RNA	~20 nt 单链化学修饰核酸（2'-MOE、PMO 等）
作用机制	装载入 RISC → Ago2 切割靶 mRNA	① RNase H 切割 mRNA；② 空间位阻改剪接或抑制翻译
催化方式	催化式（一个 RISC 切多个 mRNA）→ 持久	化学计量式（一对一）→ 需高浓度
递送方式	LNP（静脉，全身）/ GalNAc 偶联（皮下，肝靶向）	化学修饰自身具备渗透性；常用鞘内（SMA）或皮下
持续时间	~6 个月（Inclisiran 每年 2 针）	~1-4 个月，需重复给药
典型药物	Patisiran (hATTR)、Inclisiran (PCSK9)、Givosiran	Nusinersen (SMA)、Eteplirsen (DMD)、Mipomersen

课堂问答 · 答案

LNP vs GalNAc：擅长哪类组织

核心：LNP（脂质纳米颗粒）→ 大部分被肝细胞 ApoE 受体内吞，全身组织广覆盖（偏肝）；GalNAc（三聚 N-乙酰半乳糖胺）→ 特异结合肝细胞表面 ASGPR 受体，几乎专一靶向肝。

LNP 递送特点

▸装载力强：可装 siRNA / mRNA / saRNA / Cas9 RNP
▸组织分布：默认偏向肝（ApoE 吸附 → LDLR 内吞），可通过脂质比例调向肺、脾、骨髓、肿瘤
▸典型药：Patisiran（LNP-siRNA，hATTR）、Comirnaty（LNP-mRNA，COVID）

GalNAc 递送特点

▸专一肝细胞：ASGPR 受体在肝细胞极高表达，内吞效率 ~10⁵/分钟
▸皮下注射：5 mL 门诊给药，无 LNP 输液反应
▸典型药：Inclisiran（PCSK9）、Givosiran（卟啉症）、Lumasiran（草酸尿症）
▸局限：不能递送大型核酸（mRNA），不能靶向肝外

课堂问答 · 答案

Eteplirsen 适用 13% DMD 的原因

核心：Eteplirsen 设计跳过 外显子 51，**只对在外显子 51 周边失去阅读框的突变患者有效**（占 DMD 的 ~13%）。其他患者的突变位置不同 → 需要跳跃其他外显子 → 必须设计不同 ASO（精准医学）。

突变位置 ↔ 可跳跃外显子

▸DMD 基因 79 个外显子，最大基因之一（~2.4 Mb）
▸突变破坏阅读框 → 移码 + 提前终止 → 无功能蛋白 → DMD
▸跳过特定外显子 → 重新对齐阅读框 → 产生截短但仍部分功能的肌营养不良蛋白（Becker 型）
▸能跳的外显子有限：删后必须保持阅读框

不同患者 → 不同 ASO

▸Eteplirsen：跳 51 → ~13% DMD 患者
▸Golodirsen / Viltolarsen：跳 53 → ~8% 患者
▸Casimersen：跳 45 → ~8% 患者
▸覆盖率：现有 ASO 覆盖 ~30% DMD；其余需基因疗法（AAV-dystrophin）或 read-through 药

课堂问答 · 答案

AAV9（Zolgensma）vs ASO（Nusinersen）治疗 SMA

核心：两者在基因表达层次完全不同：Zolgensma "补充缺失基因"（递送 SMN1 cDNA → 翻译出 SMN 蛋白）；Nusinersen "修正剪接"（让备份基因 SMN2 包含外显子 7 → 产生功能蛋白）。逻辑："补缺" vs "修补"。

维度	Zolgensma（AAV9 基因疗法）	Nusinersen（ASO 剪接修正）
表达层次	基因层面：递送完整 SMN1 cDNA	RNA 层面：调控 SMN2 pre-mRNA 剪接
治疗逻辑	"补缺"：补足缺失的 SMN1	"修补"：让 SMN2 表达完整蛋白
给药次数	一次性（静脉滴注）	每 4 个月鞘内注射
持久性	数年（AAV episome）	数月（ASO 衰减）
适用人群	2 岁以下（AAV9 中和抗体 + 神经元未老化）	任意年龄 SMA 患者
价格	~210 万美元（一次性）	首年 ~75 万，维持 ~37.5 万/年

基因的复制、转录和翻译

生命如此多样，遗传信息如何精确延续？

我们能"改写生命的代码"吗？

一段RNA，为什么能变成疫苗？

细胞像一台信息处理系统

为什么同样的DNA，有的细胞正常分化，有的却失控癌变？

AI技术为认识与理解生命语言提供了有力武器

科学与产业前沿：诺贝尔奖常客，新药研发焦点

核酸药物产业：国际与中国领军企业

生命信息流：DNA → RNA → 蛋白质

课程大纲

DNA 复制

DNA 修复与重组

RNA 转录

蛋白质翻译

DNA 复制

DNA Replication

本讲大纲点击条目可直接跳转

一、DNA序列的维持

二、DNA复制机制

三、染色体复制的起始与完成

四、DNA复制相关药物开发案例

DNA 的基本结构

DNA序列的维持

突变率极低

低突变率对生命至关重要

小节总结 — DNA序列的维持

DNA复制机制

碱基配对是DNA复制和修复的基础

DNA复制叉是不对称的

DNA复制的高保真度需要多种校对机制

只有5'→3'方向的复制才能高效纠错

碱基互变异构与非Watson-Crick错配

链定向错配修复系统

特殊酶在滞后链上合成短RNA引物

特殊蛋白质帮助解开复制叉前方的DNA双螺旋

滑动环将移动中的DNA聚合酶固定在DNA上

复制叉上的蛋白质协同形成复制机器

什么是DNA的"拓扑"与"拓扑异构"

DNA拓扑异构酶防止复制过程中DNA缠绕

真核细胞和原核细胞的DNA复制基本相似

小节总结 — DNA复制机制

染色体DNA复制的起始与完成

DNA合成始于复制起点

原核细胞染色体通常只有一个复制起点

真核染色体含有多个复制起点

真核生物的DNA复制仅在细胞周期的S期进行

同一染色体的不同区域在S期不同时间复制

大型多亚基复合物结合真核复制起点

人类基因组复制起点的特征仍待发现

新核小体在复制叉后方组装

末端复制问题与端粒

端粒酶的结构与工作机制

G-四链体（G4）：端粒上的特殊 DNA 二级结构

端粒被包装成保护染色体末端的特殊结构

端粒长度受到细胞和生物体的调控

小节总结 — 复制起始与完成

DNA复制相关药物开发案例

Hydroxyurea：抑制核糖核苷酸还原酶，限制dNTP供给

Etoposide / Doxorubicin：靶向Topo II，阻断DNA解缠结

Irinotecan / Topotecan：靶向Topo I，诱发复制叉崩溃

Cytarabine / Gemcitabine：核苷类似物干扰DNA链延伸

Acyclovir：经典抗疱疹药，选择性抑制病毒DNA复制

Ganciclovir / Cidofovir：面向CMV等高风险病毒复制抑制

Ciprofloxacin / Levofloxacin：靶向细菌DNA复制机器

小节总结 — DNA复制相关药物开发案例

本讲总结

DNA 修复与重组

DNA Repair and Recombination

你的基因组，每天承受约 10 万次化学攻击

修复失败的代价：癌症、衰老与遗传病

同源重组与转座：基因组是动态的"活图"

本讲大纲点击条目可直接跳转

一、DNA 修复

二、同源重组

三、转座与保守性位点特异性重组

四、DNA修复相关药物开发案例

DNA 修复

没有DNA修复，自发性损伤会迅速改变DNA序列

紫外损伤与化学修饰如何产生突变

三、染色体复制的
起始与完成

四、DNA复制相关
药物开发案例

三、转座与保守性
位点特异性重组

四、DNA修复相关
药物开发案例

三、RNA转录相关
药物开发案例