Torch-RecHub 推荐系统实战

本目录收录 Torch-RecHub 在 AMD GPU / ROCm 环境下的推荐系统实战教程。目标不只是跑通几个模型，而是理解一个现代推荐系统训练链路如何组织：特征定义、数据生成器、训练器、排序与召回模型、实验跟踪，以及面向服务部署的模型导出。

Torch-RecHub 是一个轻量、高效、易用的 PyTorch 推荐系统框架，面向工业级推荐实验的快速复现与扩展。项目提供 30+ 主流推荐模型，覆盖精排、召回、多任务学习和生成式推荐，并提供统一的数据加载、训练评估、实验跟踪和 ONNX 导出能力。

为什么放在 hello-rocm

在 hello-rocm 中，这组案例聚焦 AMD GPU / ROCm 上的推荐系统实践。你会学习如何安装 ROCm 适配的 PyTorch，如何在 AMD 硬件上运行 Torch-RecHub 教程，并把训练流程进一步连接到 ONNX 导出、轻量召回验证等部署相关环节。

这些教程使用轻量样例数据，适合在本地快速验证完整流程。文中的指标主要用于确认链路跑通，不代表生产数据集上的最终效果。

PyTorch 优先：基于 PyTorch 动态图和硬件加速能力，支持 CPU、NVIDIA CUDA GPU、AMD ROCm GPU 和华为昇腾 NPU。
模型库丰富：内置 30+ 推荐模型，覆盖 ranking、matching、multi-task learning 和 generative recommendation。
模块化设计：特征、层、训练器、损失、指标和工具相互解耦，方便扩展新模型和新数据集。
标准化流程：提供统一的数据加载、训练、评估、实验跟踪和模型导出路径。
部署友好：支持 ONNX 导出和推理验证，帮助从训练走向服务化。
实验跟踪：统一接入 WandB、SwanLab、TensorBoardX，便于记录超参和指标。