7.4. 本章总结

本章从推荐、搜索、广告三个核心业务场景出发,系统介绍了端到端生成式模型如何通过统一架构突破传统多阶段级联系统(MCA)的结构性瓶颈,展示了生成式范式在工业级系统中的革新实践。

级联架构的共同困境:无论是推荐、搜索还是广告,传统MCA架构都面临三类相似的深层问题:各阶段独立优化目标导致全局次优和误差累积;计算资源碎片化使GPU利用率远低于大语言模型;多阶段信息传递导致用户意图在流转过程中不断损失。这些结构性缺陷推动了端到端生成式建模范式的兴起。

推荐场景的端到端探索:快手的OneRec是本章最系统的工业实践。OneRec-V1通过协同感知多模态表示学习与RQ-Kmeans层次量化构建语义ID,将推荐重新定义为用户上下文条件下的语义ID序列生成任务;Encoder-Decoder架构实现了从用户特征到推荐序列的端到端建模。OneRec-V2在此基础上引入重排感知的生成框架,通过强化学习对齐线上业务目标,在快手平台的大规模部署中验证了生成式推荐在工业环境下的可行性与有效性。

搜索场景的双阶段覆盖:电商搜索面临“文本查询→商品结果”的跨模态匹配挑战。OneSug针对搜索链路前半段(查询补全),将查询生成重定义为条件文本生成任务,通过PRE模块增强短前缀语义、多级反馈的Reward-Weighted Regression优化排序能力,解决了短前缀歧义和个性化与流行度平衡的难题;OneSearch针对后半段(商品检索),通过SKU语义ID和Encoder-Decoder架构实现了从查询到商品列表的端到端生成,同时引入Listwise偏好优化提升整体检索质量。两者共同展示了生成式架构在搜索全链路的覆盖能力。

广告场景的机制融合:在线广告在推荐与搜索的技术挑战之上额外叠加了经济学约束。EGA通过Token级竞价与POI级支付的双层设计,在生成过程中内嵌激励相容性(IC)与个体理性(IR)约束,实现了竞价机制与生成模型的深度统一;GPR则通过异构层次化解码器和预训练范式,在微信生态超长异构序列中实现了多场景广告的统一建模。广告场景的实践表明,端到端生成式建模不仅能处理技术层面的优化问题,还能在系统层面融合复杂的业务规则。

跨场景的共同启示:三个场景的端到端实践呈现出若干共性洞察:语义ID设计是连接生成模型与推荐数据的核心桥梁;Encoder-Decoder架构在需要深度融合上下文的场景中展现出强大的表达能力;强化学习是对齐生成过程与线上业务目标的关键工具;而端到端优化的真正价值,不仅在于消除级联误差,更在于为整个系统引入全局优化的可能性。