1D: 异构调度与算子编程
本组解决“怎么精细控制计算和数据流”的问题,连接 CPU/GPU 协同、CUDA/Triton 和运行时调度。
包含内容
桥接 / 扩展
- 15 CUDA Execution Model
- 16 Warp Block SharedMemory Basics
- 17 CUDA Stream and Asynchrony
- 18 Triton Block Model
- 19 Operator Fusion Introduction
- 29 CUDA Stream Advanced Scheduling
- 29 CUDA Stream Advanced Scheduling Practice
- 30 Dynamic Shape Handling
- 31 GPU Virtualization and MIG
学习顺序
建议按 07 -> 08 -> 15 -> 16 -> 17 -> 18 -> 19 -> 29 -> 30 -> 31 顺序学习。
