微信扫码
添加专属顾问
我要投稿
大模型正在从单一模态向多模态发展,多模态成为大模型落地发展的必经之路。
一方面多模态数据无处不在且加速增长,未来用于大模型训练的数据中多模态数据占比将越来越大;另一方面,文本大模型只能理解文本意思并进行文本类的表达,但人类并不是从单模态中进行学习的,恰恰相反,我们会同时结合来自不同类型数据的信息来理解这个世界。
越来越多的基础大模型正在遵循人类学习的路径,基于多种模态数据进行训练,这些额外的模态将有助于大模型更好地理解现实世界,并超越目前所能达到的水平。
当前,已有企业将多模态大模型应用于实际的业务场景,沙丘智库通过研究贝壳找房、喜马拉雅、平安、海尔等企业的多模态大模型实践,旨在为其他企业提供参考。
▎案例1:贝壳找房家装领域大模型实践
家装行业存在家装链条长、用户决策周期长、营销效果图成本高的问题。贝壳找房推出DreamHome大模型,通过AIGC技术,结合空间输入、装修需求描述和参考输入,利用文生图模型、空间控制模型和风格控制模型生成灵感图,重构了全链路流程。
基于DreamHome大模型,贝壳打造了面向B/C两端的家装AIGC产品“设牛”,主要功能包括“拍照生图”、“选户型生图”、“风格模板”、“传参考图生图”和“直连设计师”,成功提升了用户在家装过程中的体验。
完整内容:贝壳找房家装领域大模型实践
▎案例2:喜马拉雅音频创作AI Agent实践
传统音频内容创作的周期非常长,用户对有声内容的需求远大于供给。喜马拉雅建设音频大模型,并基于音频大模型打造音频创作AI Agent,可端到端完成音频创作工作,大幅缩短音频内容的创作周期。
▎案例3:平安基于多模态大模型的智能品控实践
面对医疗健康服务中的客户投诉问题,平安利用多模态大模型技术,自动收集多模态数据,通过统一流程和方案实现全方位、全旅程、高时效、准实时的质量品控。具体措施包括自动总结、语音品控、图文品控,以及覆盖事中提醒、事中服务预警和事后品控抽检的方案设计。
完整内容:海尔智家HomeGPT大模型实践
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-22
小参数,大能力 | 星际视觉语言大模型再进化,0.8B轻量版正式发布
2026-06-16
RapidOCR: 从 setup.py 迁移到 pyproject.toml 打包实践
2026-06-12
PaddleOCR 3.7 正式接入ONNX Runtime,一个参数换后端,轻量部署新选择
2026-06-11
本地部署OCR,可能是AI进单位的第一道门
2026-06-08
正式推出 Gemma 4 12B: 一款统一、免编码器的多模态模型
2026-05-30
还在用 MinerU 解析 PDF?这个 2B 小模型直接把 olmOCR-bench 刷到 87.6%,速度还快 3.68 倍
2026-05-30
Qwen-VLA:迈向通用具身智能的统一动作框架
2026-05-25
罗福莉说的“伪多Agent”,我试了OmniWork后发现,真全干专家长这样
2026-04-22
2026-04-01
2026-04-02
2026-03-29
2026-04-27
2026-04-21
2026-04-09
2026-03-31
2026-04-15
2026-04-02
2026-03-12
2025-12-31
2025-08-04
2025-05-26
2025-05-13
2025-04-08
2025-04-05
2025-03-30