06. 5 Triton Design Patterns | 从算子到设计

本页是 Part 3 的轻量总结页，只负责把 01-06 里出现过的模式收束成几条可复用的设计思路，再把读者自然带到 07-11。

导航：上一组 3.2 过渡篇 | Part 3 导学 | 下一组 3.3 进阶A：Attention优化

1. 模式复盘

请在不写完整 Triton kernel 的前提下，回答下面的问题：

text

output = (x @ W) * sigmoid(x @ W)

这是一个去掉门控分支的 SwiGLU 简化版本。

你可以先思考：

这道题只要求写设计说明，不要求写完整 kernel。

Part 3 后半部分会把这些模式放进更真实的 LLM 推理场景里：

如果说前半部分是在建立 Triton 的设计骨架，那么后半部分就是把这些骨架放进工业级推理路径里。

建议在 3.2 过渡篇 之后、3.3 进阶A：Attention优化 之前先读一遍本页，再进入后续主线。