Appearance
这是 Part 4 的未来扩展页,用来承接 CUDA Graph、编译时优化和更激进的运行时融合。
导航: Chapter 4 导学 | 上一组 4.2 系统级性能优化 | 下一组 4.3 分布式训练工程