2.7 高级推理优化
本组聚焦 Speculative Decoding、RadixAttention 和量化,目标是理解更进一步的推理优化策略。
导航: 上一组 2.6 核心推理优化 | Chapter 2 导学 | 下一组 2.8 分布式与扩展
包含内容
学习顺序
建议按 18 -> 19 -> 20 顺序学习。
本组聚焦 Speculative Decoding、RadixAttention 和量化,目标是理解更进一步的推理优化策略。
导航: 上一组 2.6 核心推理优化 | Chapter 2 导学 | 下一组 2.8 分布式与扩展
建议按 18 -> 19 -> 20 顺序学习。