本章总结 ======== 本章围绕推荐系统召回阶段的核心问题——如何从海量候选中高效筛选出与用户相关的候选集——介绍了五类技术方法。 **协同过滤**\ 从用户-物品交互矩阵出发。ItemCF通过物品共现关系建立相似度矩阵,Swing进一步通过二部图中的swing结构过滤热门物品的噪音干扰。UserCF从用户视角出发,用相似用户的行为来预测目标用户的偏好。矩阵分解是这一阶段的关键转折:从FunkSVD到BiasSVD,它将用户和物品映射到连续的低维向量空间,引入了向量化表示的思想,为后续所有基于嵌入的技术奠定了基础。 **I2I召回**\ 将NLP中Word2Vec的序列建模思想迁移到推荐场景,把用户行为序列当作“句子”来学习物品向量。Item2Vec是最直接的迁移,EGES通过融合商品属性信息解决冷启动问题,Airbnb的实践则展示了如何将业务目标(预订转化)融入序列的构建方式。 **双塔模型**\ 将推荐问题拆成用户编码和物品编码两个独立子问题,物品向量离线预计算,用户向量实时生成,通过近似最近邻搜索完成匹配。FM首次实现了用户-物品交互的向量分解,DSSM用深度网络提升表达能力,YouTubeDNN将召回重新定义为“预测用户下一个行为”并在超大规模场景下验证了双塔架构的实用性。 **序列召回**\ 关注的是双塔模型忽略的问题:用户兴趣的多样性和时效性。MIND用多个向量分别捕捉用户的不同兴趣维度,SDM将兴趣显式拆分为短期即时需求和长期稳定偏好,通过门控机制动态融合。 **流式索引召回**\ 跳出了模型内部“压缩”的思路。Trinity将物品映射到聚类空间,用统计直方图完整保留用户的全量历史兴趣,设计了多元兴趣、长尾兴趣和长期兴趣三个互补的召回器。Streaming VQ则解决索引时效性问题,让物品到聚类的映射关系实时更新,不再需要定期重建。 这五类方法共享一条演进脉络:协同过滤提出了向量化表示的思想,I2I和双塔将其与深度学习结合并建立了高效的检索范式,序列召回引入时序建模拓展了可利用的信息维度,流式索引从结构层面突破了压缩机制和静态索引的局限。无论哪种方法,召回阶段追求的核心目标始终一致:在保持计算效率的前提下,尽可能全面地理解用户兴趣,为后续的排序模型提供高质量的候选集。