hello-rocm面向 AMD GPU 的 ROCm 教程与实践案例

从环境安装、模型部署、模型微调到算子优化，系统整理 AMD ROCm 在大模型场景下的学习路径。

hello-rocm Skill

把本项目一键交给你的 AI 助手

复制下面这句话，粘贴给支持 Skill / Rules / Agent 配置的工具，让它自动判断如何加载 src/hello-rocm-skill。

适合询问 GPU 架构、ROCm 快速安装、vLLM / Ollama / llama.cpp 部署、常见报错排查与学习路径。

先完成 ROCm、PyTorch 与 uv 环境配置，为后续部署、微调和算子实践建立统一前置条件。

覆盖 LM Studio、vLLM、Ollama、llama.cpp 等常见框架在 AMD GPU 上的部署流程。

以 Qwen3、Gemma4 等模型为例，记录 ROCm 环境下的 LoRA 微调实践。

从 AMD AI 硬件与 ROCm 软件栈出发，逐步进入 HIP 算子、PyTorch 自定义算子和性能优化。

收集 ROCm、AMD GPU、AI 开发相关的优质资料，方便进一步查阅。

汇总社区项目案例，包括本地智能体、模型训练、视觉应用和工具实践。

模块	内容
基础环境	ROCm 基础环境安装、配置、校验与 GPU 架构对照
大模型部署	Qwen3、Gemma4 等模型的多框架本地部署
大模型微调	ROCm 环境下的大模型微调记录
算子优化	AMD AI 硬件、ROCm 软件栈、HIP 算子与 PyTorch 自定义算子
参考资料	ROCm 与 AMD AI 生态相关资料
AMD 实践案例	面向 AMD 平台的应用案例与社区项目