3.2 Triton 进阶
本组聚焦复杂融合算子,重点是 softmax、RoPE、FlashAttention、LoRA 和 KV cache。
包含内容
- 06 Triton Fused Softmax
- 07 Triton Fused RoPE
- 08 Triton Flash Attention
- 09 Triton Fused LoRA
- 10 Triton KV Cache and PagedAttention
- 11 Triton Quantization Support
学习顺序
建议按 06 -> 07 -> 08 -> 09 -> 10 -> 11 顺序学习。
