04-References
📚 ROCm 优质参考资料精选的 AMD 官方与社区资源
简介
本模块收集整理了 ROCm 和 AMD GPU 相关的优质学习资源,包括官方文档、社区教程、技术博客和相关新闻。帮助你快速找到所需的参考资料。
hello-rocm Skill
hello-rocm Skill 是本项目内置的 AI 助手导航能力。它会把本项目的学习路径、Reference 索引、GPU 架构表、部署教程与排障清单提供给支持 Skills、Rules 或 Agent 配置的 AI 编程工具使用。
| 你想问 | Skill 会索引 |
|---|---|
| 我的 GPU 属于什么架构、对应哪个 gfx? | docs/zh/00-environment/rocm-gpu-architecture-table.md |
| 我想最快跑通第一个模型 | src/hello-rocm-skill/references/quick-deploy/SKILL.md |
| PyTorch / vLLM / Ollama / llama.cpp 在 ROCm 上怎么装? | 本页“框架与推理服务” |
| ROCm / PyTorch / HIP 报错怎么排? | src/hello-rocm-skill/references/troubleshooting/SKILL.md |
| 该从哪个章节开始学习? | README 与各章节 index.md |
一键复制使用提示
将下面这句话复制给你的 AI 编程工具,让它根据自身支持的 Skills、Rules 或 Agent 配置方式自动判断如何加载:
text
请使用当前仓库的 src/hello-rocm-skill 作为 hello-rocm Skill;如果你的工具支持 Skills、Rules 或 Agent 配置,请把它安装或加载到合适位置(例如 .claude/skills、.cursor/skills 或 .agents/skills),然后根据该 Skill 帮我学习、部署和排查 AMD ROCm。如果你想手动安装,也可以按工具复制到对应目录:
bash
mkdir -p .claude/skills
cp -r src/hello-rocm-skill .claude/skills/hello-rocmbash
mkdir -p .cursor/skills
cp -r src/hello-rocm-skill .cursor/skills/hello-rocmbash
mkdir -p .agents/skills
cp -r src/hello-rocm-skill .agents/skills/hello-rocm安装或加载后,新开一个会话并尝试:
text
请加载 hello-rocm skill,帮我判断我的 AMD GPU 应该从哪个 ROCm 教程开始。如果遇到故障排查与常见问题,也可以加入 飞书社区讨论。
官方资源
AMD 官方文档
| 资源 | 描述 | 链接 |
|---|---|---|
| ROCm 文档 | ROCm 平台官方文档 | rocm.docs.amd.com |
| ROCm Release Notes | 版本发布说明 | Release Notes |
| HIP 编程指南 | HIP API 和编程指南 | HIP Docs |
| AMD GitHub | AMD 开源项目仓库 | github.com/amd |
| ROCm GitHub | ROCm 项目仓库 | github.com/ROCm |
AMD GPU 架构白皮书
| 架构 | 适用方向 | 架构概览 | 白皮书 / 官方资料 |
|---|---|---|---|
| AMD CDNA 架构 | Instinct MI100 系列与 Exascale 级 GPU 计算 | AMD CDNA Architecture | AMD CDNA White Paper |
| AMD CDNA 2 架构 | Instinct MI200 系列、科学计算与机器学习加速 | AMD CDNA Architecture | AMD CDNA 2 White Paper |
| AMD CDNA 3 架构 | Instinct MI300 系列与生成式 AI/HPC 加速 | AMD CDNA Architecture | AMD CDNA 3 White Paper |
| AMD CDNA 4 架构 | Instinct MI350 系列与新一代 AI 计算加速 | AMD CDNA Architecture | AMD CDNA 4 Architecture Whitepaper |
| AMD RDNA 架构 | Radeon 图形与游戏 GPU | AMD RDNA Architecture | AMD RDNA Architecture |
架构、产品与 LLVM Target 速查
对初学者来说,可以先用产品名称定位架构,再用 LLVM Target(gfx)选择 ROCm / PyTorch 安装索引。完整 GPU 清单见下方“支持的 GPU 列表”。
CDNA:数据中心 Instinct GPU
| 架构 | 典型产品 | LLVM Target | 主要方向 |
|---|---|---|---|
| CDNA 4 | AMD Instinct MI350 系列(MI355X, MI350X) | gfx950 | 新一代 AI 训练 / 推理与 HPC |
| CDNA 3 | AMD Instinct MI300 系列(MI325X, MI300X, MI300A) | gfx942 | 生成式 AI 与 HPC 加速 |
| CDNA 2 | AMD Instinct MI200 系列(MI250X, MI250, MI210) | gfx90a | 科学计算与机器学习加速 |
| CDNA | AMD Instinct MI100 系列 | gfx908 | Exascale 级 GPU 计算 |
RDNA:Radeon 显卡与 Ryzen APU
| 架构 | 典型产品 / Graphics model | LLVM Target | 主要方向 |
|---|---|---|---|
| RDNA 4 | Radeon RX 9000 系列(RX 9070 XT / 9070 GRE / 9070)与 Radeon AI PRO R9000 系列 | gfx1201 | 游戏显卡、工作站图形与 AI 能力 |
| RDNA 4 | Radeon RX 9060 XT / 9060 系列 | gfx1200 | 主流游戏显卡 |
| RDNA 3.5 | Ryzen AI Max / Max PRO 300(Radeon 8060S / 8050S) | gfx1151 | 移动端 / APU 集成 GPU |
| RDNA 3.5 | Ryzen AI 300 / AI PRO 400(Radeon 890M / 880M / 860M) | gfx1150 | 移动端 / APU 集成 GPU |
| RDNA 3 | Radeon RX 7900 / PRO W7900 / PRO W7800 系列 | gfx1100 | 高端消费级与工作站显卡 |
| RDNA 3 | Radeon RX 7800 / 7700 / PRO W7700 / V710 系列 | gfx1101 | 消费级与工作站显卡 |
| RDNA 3 | Radeon RX 7600 系列 | gfx1102 | 主流消费级显卡 |
| RDNA 3 | Ryzen 200 系列(Radeon 780M / 760M / 740M) | gfx1103 | 移动端 / APU 集成 GPU |
框架与推理服务(ROCm 快速安装入口)
本节面向 hello-rocm Skill 的快速查阅场景:优先给出框架官方或 AMD ROCm 官方安装入口,并附 AMD ROCm Blog 作为实践案例与版本动态的互相印证。
| 类型 | 项目 | ROCm 快速安装 / 官方说明 | AMD 官方实践参考 | 本项目入口 |
|---|---|---|---|---|
| 深度学习框架 | PyTorch | Install PyTorch for ROCm | AMD ROCm Blog - PyTorch | 环境安装 |
| 深度学习框架 | TensorFlow | Install TensorFlow for ROCm | AMD ROCm Blog - TensorFlow | 环境安装 |
| 深度学习框架 | JAX | Install JAX for ROCm | AMD ROCm Blog - JAX | 环境安装 |
| 推理服务 | vLLM | vLLM AMD ROCm installation | AMD ROCm Blog - vLLM | vLLM 部署教程 |
| 推理服务 | Ollama | Ollama GPU docs | AMD ROCm Blog - Ollama | Ollama 部署教程 |
| 推理服务 | llama.cpp | llama.cpp build docs - HIP/ROCm | AMD ROCm Blog - llama.cpp | llama.cpp 部署教程 |
| 推理服务 | LM Studio | LM Studio GPU docs | AMD ROCm Blog - LM Studio | LM Studio 部署教程 |
| 推理运行时 | ONNX Runtime | Install ONNX Runtime for ROCm | AMD ROCm Blog - ONNX Runtime | 环境安装 |
库文档
| 库名称 | 用途 | 文档链接 |
|---|---|---|
| rocBLAS | 基础线性代数库 | rocBLAS Docs |
| MIOpen | 深度学习原语库 | MIOpen Docs |
| RCCL | 集合通信库 | RCCL Docs |
| rocFFT | 快速傅里叶变换 | rocFFT Docs |
| rocSPARSE | 稀疏矩阵库 | rocSPARSE Docs |
社区资源
教程与博客
- AMD ROCm Blog - AMD 官方技术博客
- AMD Developer - AMD 开发者资源中心
- Datawhale - 开源学习社区
视频教程
持续更新中...
论坛与社区
| 平台 | 描述 | 链接 |
|---|---|---|
| AMD Community | AMD 官方社区论坛 | community.amd.com |
| GitHub Discussions | ROCm 项目讨论区 | ROCm Discussions |
| Reddit r/Amd | AMD 相关讨论 | r/Amd |
相关新闻
2026
- 2026.03.11 - ROCm 7.12.0 Preview Release Notes
- 更新 ROCm 7.12.0 预览版发布说明,覆盖 ROCm 组件、安装方式与平台支持变化
- 兼容性信息以 ROCm 7.12.0 Compatibility Matrix 为准
- pip 安装索引按 GPU 架构拆分,便于在虚拟环境中选择对应 wheel 源
2025
- 2025.12.11 - ROCm 7.10.0 发布
- 支持 Windows 平台
- 支持 pip 安装到 Python 虚拟环境
- TheRock 项目重构底层架构
更多新闻持续更新中...
硬件支持
支持的 GPU 列表
Instinct 系列(数据中心)
| 系列 | 型号 | 架构 | LLVM Target | ROCm 支持 |
|---|---|---|---|---|
| MI350 | MI355X, MI350X | CDNA 4 | gfx950 | ✅ |
| MI300 | MI325X, MI300X, MI300A | CDNA 3 | gfx942 | ✅ |
| MI200 | MI250X, MI250, MI210 | CDNA 2 | gfx90a | ✅ |
| MI100 | MI100 | CDNA | gfx908 | ✅ |
Radeon PRO 系列(工作站)
| 系列 | 型号 | 架构 | LLVM Target | ROCm 支持 |
|---|---|---|---|---|
| AI PRO R9000 | R9700, R9600D | RDNA 4 | gfx1201 | ✅ |
| PRO W7000 | W7900 Dual Slot, W7900, W7800 48GB, W7800 | RDNA 3 | gfx1100 | ✅ |
| PRO W7700 | W7700, V710 | RDNA 3 | gfx1101 | ✅ |
Radeon RX 系列(消费级)
| 系列 | 型号 | 架构 | LLVM Target | ROCm 支持 |
|---|---|---|---|---|
| RX 9000 | RX 9070 XT, 9070 GRE, 9070 | RDNA 4 | gfx1201 | ✅ |
| RX 9000 | RX 9060 XT LP, 9060 XT, 9060 | RDNA 4 | gfx1200 | ✅ |
| RX 7000 | RX 7900 XTX, 7900 XT, 7900 GRE | RDNA 3 | gfx1100 | ✅ |
| RX 7000 | RX 7800 XT, 7700 XT, 7700 XE, 7700 | RDNA 3 | gfx1101 | ✅ |
| RX 7000 | RX 7600 | RDNA 3 | gfx1102 | ✅ |
Ryzen APU 系列(笔记本/移动端)
| 系列 | 型号 | Graphics model (iGPU) | 架构 | LLVM Target | ROCm 支持 |
|---|---|---|---|---|---|
| Ryzen AI Max PRO 300 | AI Max+ PRO 395, Max PRO 390/385/380 | Radeon 8060S | RDNA 3.5 | gfx1151 | ✅ |
| Ryzen AI Max 300 | AI Max+ 395, Max 390, Max 385 | Radeon 8060S / 8050S | RDNA 3.5 | gfx1151 | ✅ |
| Ryzen AI PRO 400 | AI 9 HX PRO 475/470, AI 9 PRO 465, AI 7 PRO 450, AI 5 PRO 440/435 | Radeon 890M / 880M / 860M | RDNA 3.5 | gfx1150 | ✅ |
| Ryzen AI 300 | AI 9 HX 375/370, AI 9 365 | Radeon 890M / 880M | RDNA 3.5 | gfx1150 | ✅ |
| Ryzen 200 | 9 270, 7 260/250, 5 240/230/220, 3 210 | Radeon 780M / 760M / 740M | RDNA 3 | gfx1103 | ✅ |
完整支持列表请以 ROCm 7.12.0 Compatibility Matrix 为准。
常用工具
开发工具
| 工具 | 用途 | 安装命令 |
|---|---|---|
| hipcc | HIP 编译器 | sudo apt install hip-dev |
| rocprof | 性能分析工具 | sudo apt install rocprofiler |
| rocgdb | GPU 调试器 | sudo apt install rocgdb |
| hipify-clang | CUDA 到 HIP 转换 | sudo apt install hipify-clang |
AI 框架
| 框架 | ROCm 支持 | 安装方式 |
|---|---|---|
| PyTorch | ✅ | pip install torch --index-url https://download.pytorch.org/whl/rocm6.2 |
| TensorFlow | ✅ | 参考官方文档 |
| JAX | ✅ | 参考官方文档 |
| ONNX Runtime | ✅ | 参考官方文档 |
书籍推荐
持续更新中...
贡献资源
如果你有优质的 ROCm 相关资源想要分享,欢迎提交 PR 或 Issue!
提交要求
- 资源链接有效且内容优质
- 提供简短的资源描述
- 按照现有分类整理