本章总结
========

本章围绕推荐系统召回阶段的核心问题——如何从海量候选中高效筛选出与用户相关的候选集——介绍了五类技术方法。

**协同过滤**\ 从用户-物品交互矩阵出发。ItemCF通过物品共现关系建立相似度矩阵，Swing进一步通过二部图中的swing结构过滤热门物品的噪音干扰。UserCF从用户视角出发，用相似用户的行为来预测目标用户的偏好。矩阵分解是这一阶段的关键转折：从FunkSVD到BiasSVD，它将用户和物品映射到连续的低维向量空间，引入了向量化表示的思想，为后续所有基于嵌入的技术奠定了基础。

**I2I召回**\ 将NLP中Word2Vec的序列建模思想迁移到推荐场景，把用户行为序列当作“句子”来学习物品向量。Item2Vec是最直接的迁移，EGES通过融合商品属性信息解决冷启动问题，Airbnb的实践则展示了如何将业务目标（预订转化）融入序列的构建方式。

**双塔模型**\ 将推荐问题拆成用户编码和物品编码两个独立子问题，物品向量离线预计算，用户向量实时生成，通过近似最近邻搜索完成匹配。FM首次实现了用户-物品交互的向量分解，DSSM用深度网络提升表达能力，YouTubeDNN将召回重新定义为“预测用户下一个行为”并在超大规模场景下验证了双塔架构的实用性。

**序列召回**\ 关注的是双塔模型忽略的问题：用户兴趣的多样性和时效性。MIND用多个向量分别捕捉用户的不同兴趣维度，SDM将兴趣显式拆分为短期即时需求和长期稳定偏好，通过门控机制动态融合。

**流式索引召回**\ 跳出了模型内部“压缩”的思路。Trinity将物品映射到聚类空间，用统计直方图完整保留用户的全量历史兴趣，设计了多元兴趣、长尾兴趣和长期兴趣三个互补的召回器。Streaming
VQ则解决索引时效性问题，让物品到聚类的映射关系实时更新，不再需要定期重建。

这五类方法共享一条演进脉络：协同过滤提出了向量化表示的思想，I2I和双塔将其与深度学习结合并建立了高效的检索范式，序列召回引入时序建模拓展了可利用的信息维度，流式索引从结构层面突破了压缩机制和静态索引的局限。无论哪种方法，召回阶段追求的核心目标始终一致：在保持计算效率的前提下，尽可能全面地理解用户兴趣，为后续的排序模型提供高质量的候选集。