Skip to content

04-References

📚 ROCm 优质参考资料

精选的 AMD 官方与社区资源

返回主页

简介

  本模块收集整理了 ROCm 和 AMD GPU 相关的优质学习资源,包括官方文档、社区教程、技术博客和相关新闻。帮助你快速找到所需的参考资料。

hello-rocm Skill

hello-rocm Skill 是本项目内置的 AI 助手导航能力。它会把本项目的学习路径、Reference 索引、GPU 架构表、部署教程与排障清单提供给支持 Skills、Rules 或 Agent 配置的 AI 编程工具使用。

你想问Skill 会索引
我的 GPU 属于什么架构、对应哪个 gfx?docs/zh/00-environment/rocm-gpu-architecture-table.md
我想最快跑通第一个模型src/hello-rocm-skill/references/quick-deploy/SKILL.md
PyTorch / vLLM / Ollama / llama.cpp 在 ROCm 上怎么装?本页“框架与推理服务”
ROCm / PyTorch / HIP 报错怎么排?src/hello-rocm-skill/references/troubleshooting/SKILL.md
该从哪个章节开始学习?README 与各章节 index.md

一键复制使用提示

将下面这句话复制给你的 AI 编程工具,让它根据自身支持的 Skills、Rules 或 Agent 配置方式自动判断如何加载:

text
请使用当前仓库的 src/hello-rocm-skill 作为 hello-rocm Skill;如果你的工具支持 Skills、Rules 或 Agent 配置,请把它安装或加载到合适位置(例如 .claude/skills、.cursor/skills 或 .agents/skills),然后根据该 Skill 帮我学习、部署和排查 AMD ROCm。

如果你想手动安装,也可以按工具复制到对应目录:

bash
mkdir -p .claude/skills
cp -r src/hello-rocm-skill .claude/skills/hello-rocm
bash
mkdir -p .cursor/skills
cp -r src/hello-rocm-skill .cursor/skills/hello-rocm
bash
mkdir -p .agents/skills
cp -r src/hello-rocm-skill .agents/skills/hello-rocm

安装或加载后,新开一个会话并尝试:

text
请加载 hello-rocm skill,帮我判断我的 AMD GPU 应该从哪个 ROCm 教程开始。

如果遇到故障排查与常见问题,也可以加入 飞书社区讨论

官方资源

AMD 官方文档

资源描述链接
ROCm 文档ROCm 平台官方文档rocm.docs.amd.com
ROCm Release Notes版本发布说明Release Notes
HIP 编程指南HIP API 和编程指南HIP Docs
AMD GitHubAMD 开源项目仓库github.com/amd
ROCm GitHubROCm 项目仓库github.com/ROCm

AMD GPU 架构白皮书

架构适用方向架构概览白皮书 / 官方资料
AMD CDNA 架构Instinct MI100 系列与 Exascale 级 GPU 计算AMD CDNA ArchitectureAMD CDNA White Paper
AMD CDNA 2 架构Instinct MI200 系列、科学计算与机器学习加速AMD CDNA ArchitectureAMD CDNA 2 White Paper
AMD CDNA 3 架构Instinct MI300 系列与生成式 AI/HPC 加速AMD CDNA ArchitectureAMD CDNA 3 White Paper
AMD CDNA 4 架构Instinct MI350 系列与新一代 AI 计算加速AMD CDNA ArchitectureAMD CDNA 4 Architecture Whitepaper
AMD RDNA 架构Radeon 图形与游戏 GPUAMD RDNA ArchitectureAMD RDNA Architecture

架构、产品与 LLVM Target 速查

对初学者来说,可以先用产品名称定位架构,再用 LLVM Target(gfx)选择 ROCm / PyTorch 安装索引。完整 GPU 清单见下方“支持的 GPU 列表”。

CDNA:数据中心 Instinct GPU

架构典型产品LLVM Target主要方向
CDNA 4AMD Instinct MI350 系列(MI355X, MI350X)gfx950新一代 AI 训练 / 推理与 HPC
CDNA 3AMD Instinct MI300 系列(MI325X, MI300X, MI300A)gfx942生成式 AI 与 HPC 加速
CDNA 2AMD Instinct MI200 系列(MI250X, MI250, MI210)gfx90a科学计算与机器学习加速
CDNAAMD Instinct MI100 系列gfx908Exascale 级 GPU 计算

RDNA:Radeon 显卡与 Ryzen APU

架构典型产品 / Graphics modelLLVM Target主要方向
RDNA 4Radeon RX 9000 系列(RX 9070 XT / 9070 GRE / 9070)与 Radeon AI PRO R9000 系列gfx1201游戏显卡、工作站图形与 AI 能力
RDNA 4Radeon RX 9060 XT / 9060 系列gfx1200主流游戏显卡
RDNA 3.5Ryzen AI Max / Max PRO 300(Radeon 8060S / 8050S)gfx1151移动端 / APU 集成 GPU
RDNA 3.5Ryzen AI 300 / AI PRO 400(Radeon 890M / 880M / 860M)gfx1150移动端 / APU 集成 GPU
RDNA 3Radeon RX 7900 / PRO W7900 / PRO W7800 系列gfx1100高端消费级与工作站显卡
RDNA 3Radeon RX 7800 / 7700 / PRO W7700 / V710 系列gfx1101消费级与工作站显卡
RDNA 3Radeon RX 7600 系列gfx1102主流消费级显卡
RDNA 3Ryzen 200 系列(Radeon 780M / 760M / 740M)gfx1103移动端 / APU 集成 GPU

框架与推理服务(ROCm 快速安装入口)

本节面向 hello-rocm Skill 的快速查阅场景:优先给出框架官方或 AMD ROCm 官方安装入口,并附 AMD ROCm Blog 作为实践案例与版本动态的互相印证。

类型项目ROCm 快速安装 / 官方说明AMD 官方实践参考本项目入口
深度学习框架PyTorchInstall PyTorch for ROCmAMD ROCm Blog - PyTorch环境安装
深度学习框架TensorFlowInstall TensorFlow for ROCmAMD ROCm Blog - TensorFlow环境安装
深度学习框架JAXInstall JAX for ROCmAMD ROCm Blog - JAX环境安装
推理服务vLLMvLLM AMD ROCm installationAMD ROCm Blog - vLLMvLLM 部署教程
推理服务OllamaOllama GPU docsAMD ROCm Blog - OllamaOllama 部署教程
推理服务llama.cppllama.cpp build docs - HIP/ROCmAMD ROCm Blog - llama.cppllama.cpp 部署教程
推理服务LM StudioLM Studio GPU docsAMD ROCm Blog - LM StudioLM Studio 部署教程
推理运行时ONNX RuntimeInstall ONNX Runtime for ROCmAMD ROCm Blog - ONNX Runtime环境安装

库文档

库名称用途文档链接
rocBLAS基础线性代数库rocBLAS Docs
MIOpen深度学习原语库MIOpen Docs
RCCL集合通信库RCCL Docs
rocFFT快速傅里叶变换rocFFT Docs
rocSPARSE稀疏矩阵库rocSPARSE Docs

社区资源

教程与博客

视频教程

持续更新中...

论坛与社区

平台描述链接
AMD CommunityAMD 官方社区论坛community.amd.com
GitHub DiscussionsROCm 项目讨论区ROCm Discussions
Reddit r/AmdAMD 相关讨论r/Amd

相关新闻

2026

2025

  • 2025.12.11 - ROCm 7.10.0 发布
    • 支持 Windows 平台
    • 支持 pip 安装到 Python 虚拟环境
    • TheRock 项目重构底层架构

更多新闻持续更新中...

硬件支持

支持的 GPU 列表

Instinct 系列(数据中心)

系列型号架构LLVM TargetROCm 支持
MI350MI355X, MI350XCDNA 4gfx950
MI300MI325X, MI300X, MI300ACDNA 3gfx942
MI200MI250X, MI250, MI210CDNA 2gfx90a
MI100MI100CDNAgfx908

Radeon PRO 系列(工作站)

系列型号架构LLVM TargetROCm 支持
AI PRO R9000R9700, R9600DRDNA 4gfx1201
PRO W7000W7900 Dual Slot, W7900, W7800 48GB, W7800RDNA 3gfx1100
PRO W7700W7700, V710RDNA 3gfx1101

Radeon RX 系列(消费级)

系列型号架构LLVM TargetROCm 支持
RX 9000RX 9070 XT, 9070 GRE, 9070RDNA 4gfx1201
RX 9000RX 9060 XT LP, 9060 XT, 9060RDNA 4gfx1200
RX 7000RX 7900 XTX, 7900 XT, 7900 GRERDNA 3gfx1100
RX 7000RX 7800 XT, 7700 XT, 7700 XE, 7700RDNA 3gfx1101
RX 7000RX 7600RDNA 3gfx1102

Ryzen APU 系列(笔记本/移动端)

系列型号Graphics model (iGPU)架构LLVM TargetROCm 支持
Ryzen AI Max PRO 300AI Max+ PRO 395, Max PRO 390/385/380Radeon 8060SRDNA 3.5gfx1151
Ryzen AI Max 300AI Max+ 395, Max 390, Max 385Radeon 8060S / 8050SRDNA 3.5gfx1151
Ryzen AI PRO 400AI 9 HX PRO 475/470, AI 9 PRO 465, AI 7 PRO 450, AI 5 PRO 440/435Radeon 890M / 880M / 860MRDNA 3.5gfx1150
Ryzen AI 300AI 9 HX 375/370, AI 9 365Radeon 890M / 880MRDNA 3.5gfx1150
Ryzen 2009 270, 7 260/250, 5 240/230/220, 3 210Radeon 780M / 760M / 740MRDNA 3gfx1103

完整支持列表请以 ROCm 7.12.0 Compatibility Matrix 为准。

常用工具

开发工具

工具用途安装命令
hipccHIP 编译器sudo apt install hip-dev
rocprof性能分析工具sudo apt install rocprofiler
rocgdbGPU 调试器sudo apt install rocgdb
hipify-clangCUDA 到 HIP 转换sudo apt install hipify-clang

AI 框架

框架ROCm 支持安装方式
PyTorchpip install torch --index-url https://download.pytorch.org/whl/rocm6.2
TensorFlow参考官方文档
JAX参考官方文档
ONNX Runtime参考官方文档

书籍推荐

持续更新中...

贡献资源

  如果你有优质的 ROCm 相关资源想要分享,欢迎提交 PR 或 Issue!

提交要求

  • 资源链接有效且内容优质
  • 提供简短的资源描述
  • 按照现有分类整理

欢迎分享更多优质资源! 🎉

提交 Issue | 提交 PR

最后更新: