微信扫码
添加专属顾问
我要投稿
小红书如何用大模型技术精准匹配用户与内容?揭秘其推荐系统背后的算法逻辑与价值观。核心内容: 1. 小红书推荐系统的多层级筛选机制(召回-粗排-精排-混排) 2. 平台独特的算法价值观:平权分发与50%流量倾斜普通创作者 3. 多模态内容理解与CES用户参与度评分机制的应用
在 2025 年全球机器学习技术大会上,小红书推荐算法负责人严岭分享了大模型在小红书推荐系统中的应用实践,为行业带来诸多启发。
小红书作为内容分享平台,拥有海量的用户和丰富多样的内容生态。如何精准地将优质内容推送给用户,一直是推荐系统的核心任务。
在小红书的首页信息流中,无论是图文推荐还是视频推荐,海量的用户和丰富的内容在这里相聚。这背后意味着什么?它意味着小红书已经不仅仅是一个购物攻略平台,更是一个涵盖生活方方面面的分享社区。用户在这里可以找到关于时尚的穿搭灵感、运动的健身计划、生活仪式感的营造方法,甚至更多。
在小红书这个拥有数亿级笔记的庞大内容池中,如何让用户快速找到真正有价值的信息?这就需要强大的推荐系统来发挥作用。小红书的推荐系统通过多轮筛选和排序,确保用户能够看到最符合自己需求的内容。
小红书的推荐系统不仅仅是简单的信息筛选工具,它背后还承载着平台的“算法价值观”。在内容侧,小红书坚持平权分发的原则,确保每一个创作者的内容都有机会被看见,即使是粉丝数量较少的普通用户,也能获得足够的曝光机会。据统计,小红书有50%以上的流量会分配给粉丝量在千粉以下的普通用户。
在用户侧,小红书的推荐系统致力于链接更多个体,促进更多内容消费。通过精准的个性化推荐,系统能够帮助用户发现更多感兴趣的内容,同时也为创作者提供了更多的展示机会。
此外,小红书还引入了CES(Customer Engagement Score,用户参与度评分) 机制,通过分析用户的兴趣利用和兴趣探索行为,进一步优化推荐结果。这种机制不仅能够满足用户当前的兴趣需求,还能引导用户发现新的兴趣点,提升用户的参与度和平台的活跃度。
小红书的内容形式丰富多样,既有图文笔记,也有视频笔记。为了更好地理解这些内容,小红书采用了多模态内容理解技术。基于超过10亿量级的图文和视频笔记,小红书进行了大规模的多模态预训练,支持BERT、RoBERTa、ResNet、Swin-T、ViT等多种先进架构。
通过对海量内容的深度学习和分析,小红书能够自动识别和分类每一篇笔记的核心主题和语义。这种分类方式不仅更加精准,还能实时适应内容的变化。无论是时尚穿搭、美妆教程,还是旅行攻略、美食分享,小红书都能快速理解其核心价值,并将其推送给真正感兴趣的用户。
新笔记发布时,由于缺乏足够的用户行为数据,其行为表征学习往往不充分。这意味着推荐系统很难在第一时间精准地将新笔记推送给真正感兴趣的用户。这种“冷启动”问题,是所有内容推荐平台都必须面对的挑战。
新笔记发布后,小红书首先通过多模态理解技术提取笔记的标签、话题、类目等信息,并生成基于多模态的内容表征。这些信息为后续的精准分发提供了基础。
接下来,小红书通过话题圈选和标签圈选的方式,快速圈选出与新笔记主题相关的种子人群。这些种子人群是新笔记的首批潜在受众。
在种子人群的基础上,小红书利用 Lookalike 扩散技术,进一步扩大新笔记的触达范围。通过分析种子人群的行为特征,系统能够找到更多具有相似兴趣的用户,从而实现更广泛的分发。
新笔记在分发过程中,会通过召回模型、初排模型和精排模型进行多轮筛选和排序。同时,系统会基于用户的行为反馈,实时更新笔记的向量表征,并通过 Bayesian Optimizer 自动调节提权系数,确保新笔记能够快速适应用户需求。
小红书通过超长序列建模,深入挖掘用户的长期兴趣历史。系统利用目标侧笔记的类目和语义信息,提取用户在过去的行为中表现出的长期兴趣点。这种建模方式能够帮助系统更好地理解用户的偏好,并在推荐中体现这些长期兴趣。
为了更精准地捕捉用户的实时兴趣变化,小红书采用了实时多行为序列建模。用户的行为数据会在秒级回流到系统中,系统能够快速捕捉用户兴趣的正向和负向反馈。例如,如果用户频繁点赞某一类内容,系统会加强这类内容的推荐;反之,如果用户对某些内容不感兴趣,系统会减少这类内容的曝光。
此外,小红书还引入了实时 context 特征,例如过去 5 分钟内用户与同类目内容的交互次数。这种实时特征能够帮助系统更精准地判断用户的即时兴趣,从而提供更符合用户当前需求的内容。
在多目标建模方面,小红书采用了多目标 CGC 模型。通过门控网络,系统实现了专家网络的共享和局部独立。这种设计既保证了多任务建模能够共享信息,又维持了各目标之间的差异性。例如,系统可以在推荐点击率(CTR)和用户互动时长等目标之间找到平衡,确保推荐结果既能吸引用户点击,又能提升用户的互动体验。
小红书的推荐系统还具备强大的ODL(Online Deep Learning)能力,能够处理千亿级的 Embedding 参数特征,并在分钟级完成在线更新。这种高效的更新机制确保了系统能够快速适应用户行为的变化,从而提供更精准的推荐。
小红书利用强化学习(RL) 技术优化用户的互动偏好。RL Agent 会接收用户的实时状态特征,并评估当前是否适合给用户曝光某种可能产生互动行为的笔记。如果用户产生了预期的互动行为,Agent 会强化这类内容的曝光力度;反之,如果没有按预期产生互动行为,Agent 会弱化探索性流量。通过这种方式,系统能够最大化用户在长周期内的累计互动次数。
小红书的 RL Agent 采用了多种算法,包括 DQN、DDPG 和 PPO。这些算法能够根据用户的实时反馈动态调整推荐策略,确保推荐结果既能满足用户的当前兴趣,又能引导用户发现新的兴趣点。
小红书的良好社区氛围使得其能够利用大规模图模型来建模“内容 – 用户 – 作者”之间的关系。相比传统的 Feed forward DNN,图模型能够从社交关系网的结构中挖掘出更丰富的语义信息。小红书基于图模型对用户、内容和作者进行聚类,形成了“圈层”这一概念,并以此指导推荐分发,最大化社交互动行为。
在推荐过程中,小红书还面临一个挑战:用户对密集推荐的兴趣点容易快速遗忘,如何保证兴趣的多样性?为此,小红书采用了召回向量扰动和遗传算法,结合 U2U(User to User)机制进行兴趣探索。
传统的推荐系统主要依赖用户的行为数据,如笔记历史交互记录等。然而,这种模式存在一些明显的问题:
在实际应用中,大模型(LLM)相比传统的 Bert 模型,展现出了更强大的文本理解能力和开放世界的泛化知识体系。LLM 通过辅助任务强化了推理能力,能够更好地理解用户行为背后的逻辑,从而提供更精准、更多样化的推荐。
传统的推荐系统在处理内容时,往往只能依赖单一模态(如文本或图片)的特征。然而,小红书的内容形式丰富多样,仅靠单一模态难以全面理解笔记的价值。为此,小红书引入了多模态表征能力,通过结合文本、图片甚至视频等多种模态的特征,实现更精准的内容理解。
小红书的多模态表征能力基于SigLip 模型,预训练了强大的 Vision Encoder(视觉编码器)。在此基础上,系统通过Fusion 模块实现了模态内融合和模态后融合。具体来说:
为了进一步提升多模态表征的准确性和实用性,小红书还引入了上下文学习和用户行为信息监督的对比学习。通过这种方式,系统能够更好地理解用户在不同情境下的兴趣偏好,并根据用户的行为反馈动态调整内容表征。
小红书的大模型技术不仅在内容理解层面发挥了重要作用,还贯穿了整个推荐流程,从召回阶段到排序阶段,实现了全链路的优化。
小红书的用户兴趣推理技术基于自研的 tomato-7B 大模型。该模型通过 simcse 计算预测结果与标签体系中的所有标签的相似度,从而实现标签映射。这一过程不仅能够识别用户已有的兴趣点,还能推理出用户的潜在兴趣,为用户推荐更多相关但不完全相同的内容。
在推理过程中,小红书会综合考虑用户的多维度信息,包括:
例如,对于一位 25 岁的用户,系统会分析其基本信息和已有的兴趣点,推理出潜在的兴趣方向。如果用户对“阅读”感兴趣,系统可能会推理出其对“新书推荐”也感兴趣;如果用户近期对“漫画”表现出兴趣,且长期兴趣中有“搞笑视频”,系统可能会进一步推理出其对“搞笑漫画”感兴趣。
为了更好地引导大模型进行兴趣推理,小红书设计了专门的 Prompt。Prompt 的设计类似于一个任务指令,告诉模型如何根据用户的基本信息和已有兴趣点,推理出潜在的兴趣方向。例如:
“你是一名精通兴趣归纳的数据分析师,我会提供用户的基本信息和已有兴趣点,你需要根据给出的信息,返回符合上述要求的潜在兴趣。”
通过这种方式,模型能够更精准地理解任务要求,从而生成更符合用户潜在兴趣的推荐内容。
在推理过程中,小红书不仅会给出用户的潜在兴趣点,还会提供推理过程和置信程度。例如:
往期推荐
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-29
2025-05-23
2025-04-29
2025-05-07
2025-05-07
2025-05-07
2025-06-01
2025-04-29
2025-06-07
2025-05-20
2025-07-19
2025-07-19
2025-07-19
2025-07-19
2025-07-19
2025-07-18
2025-07-18
2025-07-18