我要投稿

行业落地分享：大模型在小红书推荐的应用

发布日期：2025-07-20 20:52:59 浏览次数： 3996

作者：数据思考笔记

微信搜一搜，关注“数据思考笔记”

在 2025 年全球机器学习技术大会上，小红书推荐算法负责人严岭分享了大模型在小红书推荐系统中的应用实践，为行业带来诸多启发。

小红书作为内容分享平台，拥有海量的用户和丰富多样的内容生态。如何精准地将优质内容推送给用户，一直是推荐系统的核心任务。

在小红书的首页信息流中，无论是图文推荐还是视频推荐，海量的用户和丰富的内容在这里相聚。这背后意味着什么？它意味着小红书已经不仅仅是一个购物攻略平台，更是一个涵盖生活方方面面的分享社区。用户在这里可以找到关于时尚的穿搭灵感、运动的健身计划、生活仪式感的营造方法，甚至更多。

小红书推荐系统：在海量数据中精准筛选有价值信息

在小红书这个拥有数亿级笔记的庞大内容池中，如何让用户快速找到真正有价值的信息？这就需要强大的推荐系统来发挥作用。小红书的推荐系统通过多轮筛选和排序，确保用户能够看到最符合自己需求的内容。

首先，从数亿级的笔记池中，系统会通过多路召回的方式，初步筛选出上万篇可能符合用户兴趣的笔记。这一阶段的筛选基于多种维度，包括内容标签、用户行为等，确保初步筛选的内容具有较高的相关性。
接下来，系统会通过简单模型进行粗排，将召回的笔记数量进一步缩减至5000+。这一阶段主要通过一些基础的规则和算法，快速过滤掉不符合要求的内容，提升推荐效率。
随后，深度模型会介入进行精排，将笔记数量进一步缩小到500+。深度模型能够更精准地理解用户兴趣和内容质量，通过复杂的算法和模型训练，筛选出最优质的内容。
最后，系统会进行多样性重排混排，将最终筛选出的80+篇笔记按照用户的个性化需求进行排序。这一阶段不仅考虑内容的相关性，还会兼顾内容的多样性，确保用户不会被单一类型的内容“刷屏”，同时也能探索到更多新的兴趣领域。

小红书的推荐系统不仅仅是简单的信息筛选工具，它背后还承载着平台的“算法价值观”。在内容侧，小红书坚持平权分发的原则，确保每一个创作者的内容都有机会被看见，即使是粉丝数量较少的普通用户，也能获得足够的曝光机会。据统计，小红书有50%以上的流量会分配给粉丝量在千粉以下的普通用户。

在用户侧，小红书的推荐系统致力于链接更多个体，促进更多内容消费。通过精准的个性化推荐，系统能够帮助用户发现更多感兴趣的内容，同时也为创作者提供了更多的展示机会。

此外，小红书还引入了CES（Customer Engagement Score，用户参与度评分） 机制，通过分析用户的兴趣利用和兴趣探索行为，进一步优化推荐结果。这种机制不仅能够满足用户当前的兴趣需求，还能引导用户发现新的兴趣点，提升用户的参与度和平台的活跃度。

高效分发基石：理解每一篇内容，解锁小红书推荐的秘密

小红书的内容形式丰富多样，既有图文笔记，也有视频笔记。为了更好地理解这些内容，小红书采用了多模态内容理解技术。基于超过10亿量级的图文和视频笔记，小红书进行了大规模的多模态预训练，支持BERT、RoBERTa、ResNet、Swin-T、ViT等多种先进架构。

通过对海量内容的深度学习和分析，小红书能够自动识别和分类每一篇笔记的核心主题和语义。这种分类方式不仅更加精准，还能实时适应内容的变化。无论是时尚穿搭、美妆教程，还是旅行攻略、美食分享，小红书都能快速理解其核心价值，并将其推送给真正感兴趣的用户。

新笔记冷启动的挑战

新笔记发布时，由于缺乏足够的用户行为数据，其行为表征学习往往不充分。这意味着推荐系统很难在第一时间精准地将新笔记推送给真正感兴趣的用户。这种“冷启动”问题，是所有内容推荐平台都必须面对的挑战。

内容信息提取和初始化

新笔记发布后，小红书首先通过多模态理解技术提取笔记的标签、话题、类目等信息，并生成基于多模态的内容表征。这些信息为后续的精准分发提供了基础。

种子人群圈选和投放

接下来，小红书通过话题圈选和标签圈选的方式，快速圈选出与新笔记主题相关的种子人群。这些种子人群是新笔记的首批潜在受众。

Lookalike 扩散

在种子人群的基础上，小红书利用 Lookalike 扩散技术，进一步扩大新笔记的触达范围。通过分析种子人群的行为特征，系统能够找到更多具有相似兴趣的用户，从而实现更广泛的分发。

模型承接与在线学习

新笔记在分发过程中，会通过召回模型、初排模型和精排模型进行多轮筛选和排序。同时，系统会基于用户的行为反馈，实时更新笔记的向量表征，并通过 Bayesian Optimizer 自动调节提权系数，确保新笔记能够快速适应用户需求。

互动目标建模与优化：多目标预估与强化学习的结合

小红书通过超长序列建模，深入挖掘用户的长期兴趣历史。系统利用目标侧笔记的类目和语义信息，提取用户在过去的行为中表现出的长期兴趣点。这种建模方式能够帮助系统更好地理解用户的偏好，并在推荐中体现这些长期兴趣。

为了更精准地捕捉用户的实时兴趣变化，小红书采用了实时多行为序列建模。用户的行为数据会在秒级回流到系统中，系统能够快速捕捉用户兴趣的正向和负向反馈。例如，如果用户频繁点赞某一类内容，系统会加强这类内容的推荐；反之，如果用户对某些内容不感兴趣，系统会减少这类内容的曝光。

此外，小红书还引入了实时 context 特征，例如过去 5 分钟内用户与同类目内容的交互次数。这种实时特征能够帮助系统更精准地判断用户的即时兴趣，从而提供更符合用户当前需求的内容。

在多目标建模方面，小红书采用了多目标 CGC 模型。通过门控网络，系统实现了专家网络的共享和局部独立。这种设计既保证了多任务建模能够共享信息，又维持了各目标之间的差异性。例如，系统可以在推荐点击率（CTR）和用户互动时长等目标之间找到平衡，确保推荐结果既能吸引用户点击，又能提升用户的互动体验。

小红书的推荐系统还具备强大的ODL（Online Deep Learning）能力，能够处理千亿级的 Embedding 参数特征，并在分钟级完成在线更新。这种高效的更新机制确保了系统能够快速适应用户行为的变化，从而提供更精准的推荐。

小红书利用强化学习（RL） 技术优化用户的互动偏好。RL Agent 会接收用户的实时状态特征，并评估当前是否适合给用户曝光某种可能产生互动行为的笔记。如果用户产生了预期的互动行为，Agent 会强化这类内容的曝光力度；反之，如果没有按预期产生互动行为，Agent 会弱化探索性流量。通过这种方式，系统能够最大化用户在长周期内的累计互动次数。

小红书的 RL Agent 采用了多种算法，包括 DQN、DDPG 和 PPO。这些算法能够根据用户的实时反馈动态调整推荐策略，确保推荐结果既能满足用户的当前兴趣，又能引导用户发现新的兴趣点。

小红书的良好社区氛围使得其能够利用大规模图模型来建模“内容 – 用户 – 作者”之间的关系。相比传统的 Feed forward DNN，图模型能够从社交关系网的结构中挖掘出更丰富的语义信息。小红书基于图模型对用户、内容和作者进行聚类，形成了“圈层”这一概念，并以此指导推荐分发，最大化社交互动行为。

在推荐过程中，小红书还面临一个挑战：用户对密集推荐的兴趣点容易快速遗忘，如何保证兴趣的多样性？为此，小红书采用了召回向量扰动和遗传算法，结合 U2U（User to User）机制进行兴趣探索。

大模型 X 社区推荐：突破信息茧房，理解内容与用户

传统的推荐系统主要依赖用户的行为数据，如笔记历史交互记录等。然而，这种模式存在一些明显的问题：

无法真正理解内容：推荐系统往往只能根据用户的历史行为进行简单匹配，而无法真正理解笔记的核心内容和价值。这导致新笔记在发布初期由于缺乏足够的行为数据，难以获得足够的曝光机会，进而陷入“马太效应”——强者越强，弱者越弱。
缺乏推理能力：传统推荐系统缺乏逻辑推理能力，容易让用户陷入“信息茧房”。用户只能看到与自己现有兴趣高度相关的内容，而难以接触到新的、多样化的信息，导致内容推荐的同质化严重。

在实际应用中，大模型（LLM）相比传统的 Bert 模型，展现出了更强大的文本理解能力和开放世界的泛化知识体系。LLM 通过辅助任务强化了推理能力，能够更好地理解用户行为背后的逻辑，从而提供更精准、更多样化的推荐。

多模态表征能力的引入

传统的推荐系统在处理内容时，往往只能依赖单一模态（如文本或图片）的特征。然而，小红书的内容形式丰富多样，仅靠单一模态难以全面理解笔记的价值。为此，小红书引入了多模态表征能力，通过结合文本、图片甚至视频等多种模态的特征，实现更精准的内容理解。

（一）多模态融合模块

小红书的多模态表征能力基于SigLip 模型，预训练了强大的 Vision Encoder（视觉编码器）。在此基础上，系统通过Fusion 模块实现了模态内融合和模态后融合。具体来说：

模态内融合：在 LLM（大语言模型）内部，对不同模态的特征进行初步融合，确保每个模态的特征都能被充分利用。
模态后融合：在 LLM 后续处理阶段，进一步整合不同模态的特征，形成更全面、更丰富的内容表征。

（二）上下文学习与行为监督

为了进一步提升多模态表征的准确性和实用性，小红书还引入了上下文学习和用户行为信息监督的对比学习。通过这种方式，系统能够更好地理解用户在不同情境下的兴趣偏好，并根据用户的行为反馈动态调整内容表征。

全链路应用：召回与排序的优化

小红书的大模型技术不仅在内容理解层面发挥了重要作用，还贯穿了整个推荐流程，从召回阶段到排序阶段，实现了全链路的优化。

用户兴趣推理：从已知到未知

小红书的用户兴趣推理技术基于自研的 tomato-7B 大模型。该模型通过 simcse 计算预测结果与标签体系中的所有标签的相似度，从而实现标签映射。这一过程不仅能够识别用户已有的兴趣点，还能推理出用户的潜在兴趣，为用户推荐更多相关但不完全相同的内容。

用户信息的多维度分析

在推理过程中，小红书会综合考虑用户的多维度信息，包括：

基本信息：年龄、性别、城市、日期等。
已有兴趣：用户的长期、中期和短期兴趣点，涵盖话题、类目等多个维度。

例如，对于一位 25 岁的用户，系统会分析其基本信息和已有的兴趣点，推理出潜在的兴趣方向。如果用户对“阅读”感兴趣，系统可能会推理出其对“新书推荐”也感兴趣；如果用户近期对“漫画”表现出兴趣，且长期兴趣中有“搞笑视频”，系统可能会进一步推理出其对“搞笑漫画”感兴趣。

Prompt 设计：引导模型推理

为了更好地引导大模型进行兴趣推理，小红书设计了专门的 Prompt。Prompt 的设计类似于一个任务指令，告诉模型如何根据用户的基本信息和已有兴趣点，推理出潜在的兴趣方向。例如：

“你是一名精通兴趣归纳的数据分析师，我会提供用户的基本信息和已有兴趣点，你需要根据给出的信息，返回符合上述要求的潜在兴趣。”

通过这种方式，模型能够更精准地理解任务要求，从而生成更符合用户潜在兴趣的推荐内容。

推理过程与置信程度

在推理过程中，小红书不仅会给出用户的潜在兴趣点，还会提供推理过程和置信程度。例如：

新兴趣点：搞笑漫画、美妆技巧等。
推理过程：考虑到 25 岁的年轻人一般对新鲜事物有好奇心，且用户对“阅读”也有兴趣，因此推理出其可能对“新书推荐”感兴趣。用户近期对“漫画”表现出兴趣，且长期兴趣中有“搞笑视频”，因此推理出其可能对“搞笑漫画”感兴趣。
置信程度：根据推理的逻辑和数据支持，系统会给出每个潜在兴趣点的置信程度，帮助推荐系统更精准地筛选内容。