3.3 进阶A:Attention优化
本组聚焦 Attention 主线,把 RoPE、FlashAttention 和 PagedAttention 串成一条完整优化链路。
导航: 上一组 3.2 过渡篇 | Chapter 3 导学 | 下一组 3.4 进阶B:推理优化
包含内容
学习顺序
建议按 07 -> 08 -> 09 顺序学习。
本组聚焦 Attention 主线,把 RoPE、FlashAttention 和 PagedAttention 串成一条完整优化链路。
导航: 上一组 3.2 过渡篇 | Chapter 3 导学 | 下一组 3.4 进阶B:推理优化
建议按 07 -> 08 -> 09 顺序学习。