微信扫码
添加专属顾问
我要投稿
那这样一个混合模型有什么好处呢?当用户输入一个问题时,会进行意图识别,优先匹配擅长这块领域的大模型进行回答。
目前来看并没有一个大模型敢说自己在各个领域全方面领先,哪怕强如 GPT-4O 和 Claude3.5 也不行。而这样集各家之所长的“大模型”,可以说基本全方面达到最优,集成了国内大部分头部模型。
这其中最关键的问题就是:怎么知道哪个大模型在哪块领域擅长?于是 360 用自己过去积累的用户真实数据,找了几千万条问题,划分成 4000 个类别,对这些模型进行测试。
包括写作、代码生成、翻译、比一比、诗词赏析、知识问答等,决策出各个分类下的最强大模型。
最终它得出了各个模型擅长的领域如下:
相当于普通人的测试结果来说,360 测量得出的结果肯定更加准确。
有一个场景,之前单问某个模型,回答一直很傻逼。就是让它生成一个笑话,看看单个模型回答的结果:
看看 Kimi、文心一言、通义千问生成的笑话,是真的不好笑啊,属实有点尬。
而通过混合模型生成的效果明显就好上不少,看生成结果里显示是调用的豆包模型。
这就是混合模型的强大,生成的结果起码在国内应该是最优的,而对于使用者来说可以将它只当做是单个模型使用。
当然如果你想自己指定某个模型回答也是可以的,在这个网页上你可以随意切换模型,不需要登录到各个模型的官网上。
现在体验比较不好的一点是:不支持文件上传。因为 CoE 混合模型本身不具备文件读取的能力,就无法识别要调用哪个模型,这个需要 360 进一步优化了。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-16
新版 GPT-5 刚刚发布,最卷 AI 连肝代码 7 小时,编程工具大洗牌开始了
2025-09-16
Subagents:构建高可靠 AI Coding 专家顾问团
2025-09-16
刚刚!阿里发新模型,幻觉率爆降70%
2025-09-16
Agent三大痛点:知识库+工作流+Prompt工程
2025-09-16
Anthropic发布首个AI经济指数报告:越富越用AI,企业比个人更信任AI
2025-09-16
Claude Code与GitHub结合使用的实践指南
2025-09-16
企业复杂Agent落地的12个工程化原则 | 原则二:构建Prompt工程可扩展、可维护、可调试、可回滚 | 提示词A/B实验
2025-09-16
OpenAI深夜放出「编程核弹」:GPT-5-Codex 正式发布,能独立爆肝7 小时
2025-08-21
2025-06-21
2025-08-21
2025-08-19
2025-06-19
2025-07-29
2025-09-08
2025-08-19
2025-08-20
2025-07-04
2025-09-14
2025-09-12
2025-09-11
2025-09-11
2025-09-09
2025-09-09
2025-09-08
2025-09-08