2.2.3. 总结

向量召回技术的核心贡献在于将推荐系统从“匹配”转向“搜索”,通过向量化表示实现了从\(O(U \times I)\)\(O(U + I)\)的复杂度优化。这一转变不仅解决了大规模推荐系统的计算瓶颈,更重要的是为推荐算法提供了统一的数学框架——将用户和物品都映射到同一个向量空间中,让“距离”代表“相似度”。

I2I召回的演进脉络:从NLP领域的Word2Vec出发,I2I召回经历了三个关键发展阶段。Item2Vec实现了从“词语-句子”到“物品-用户序列”的直接迁移,验证了序列建模在推荐系统中的可行性;EGES通过构建商品关系图和融合辅助信息,解决了稀疏性和冷启动问题,展现了图结构和属性信息的价值;Airbnb则将业务目标深度融入序列构建,通过会话切分、全局上下文和市场感知负采样,实现了从相似性到转化率的跨越。这一演进过程本质上是对“序列”概念的不断深化——从简单的共现关系到复杂的业务逻辑。

U2I召回的技术路径:U2I召回以双塔模型为核心架构,体现了“分而治之”的设计哲学。FM通过数学变换首次实现了用户-物品交互的向量分解,奠定了双塔模型的理论基础;DSSM用深度神经网络替代线性变换,将双塔模型的表达能力推向新高度,同时建立了多分类训练范式和工程化部署模式;YouTubeDNN则通过“预测下一个观看视频”的任务重定义,引入了时序分割、负采样优化等关键工程技巧,展现了双塔模型在超大规模场景下的实用价值。

核心技术洞察:向量召回的成功建立在几个关键洞察之上。首先是向量空间的语义性——通过合适的训练目标,向量间的距离能够反映真实的用户偏好和物品相似性;其次是架构的可分解性——双塔设计实现了训练复杂度和服务效率的平衡,物品向量可离线预计算,用户向量可实时生成;最后是序列的信息密度——用户行为序列蕴含着丰富的偏好信号,通过不同的序列构建和建模方式可以挖掘出不同层次的用户意图。

技术边界与挑战:向量召回在解决效率问题的同时,也带来了固有的局限性。双塔之间缺乏深度交互可能损失复杂的用户-物品关系,向量表示的有限维度难以完全捕捉丰富的语义信息,这些挑战推动了后续序列建模技术的发展。向量召回的使命是在庞大的物品库中高效筛选出与用户兴趣匹配的候选集,为后续的精排模型提供高质量输入,它更像是推荐系统的“粗筛”阶段,追求的是召回率而非精确率。