2.1. 协同过滤

协同过滤(Collaborative Filtering)是推荐系统中最基础的技术之一,其核心假设是:相似的用户会喜欢相似的物品。只需收集用户的历史行为数据,就能在用户或物品之间建立相似关系,进而生成推荐——无需任何物品的内容信息。

本章沿着协同过滤的技术演进脉络,介绍四个代表性方法:

ItemCF:基于物品相似度的协同过滤。找到与用户历史交互物品相似的其他物品进行推荐,是工业界最早大规模落地的协同过滤方案。

Swing:面向工业场景的相似度优化。ItemCF对热门物品和噪声行为敏感,Swing通过分析用户-物品二部图的子结构,更准确地捕捉物品间的真实关联。

UserCF:基于用户相似度的协同过滤。找到与目标用户兴趣相似的其他用户,推荐这些用户喜欢的物品,更擅长发现用户的潜在兴趣。

矩阵分解:从相似度计算到向量表示学习。不再显式计算相似度,而是学习用户和物品的低维隐向量,让向量空间中的距离自然反映偏好关系,标志着协同过滤向机器学习方法的转变。