Skip to content

3.3 进阶A:Attention优化

本组聚焦 Attention 主线,把 RoPE、FlashAttention 和 PagedAttention 串成一条完整优化链路。

导航: 上一组 3.2 过渡篇 | Chapter 3 导学 | 下一组 3.4 进阶B:推理优化

包含内容

学习顺序

建议按 07 -> 08 -> 09 顺序学习。

Released under the MIT License.