Appearance
系统性、可交互、带评测的工程实战复习指南
专注 Transformer、MoE、量化、推理加速与显存优化。
要求使用 PyTorch、Triton 或原生的 CUDA C++ 实现核心算子和系统逻辑。
每一道题都内置了工业级测试验证与 Benchmark 性能基准测试。