微信扫码
添加专属顾问
我要投稿
今天,我们发布了全链路领域增强大模型Baichuan4-Finance。
Baichuan4-Finance在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。
在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上均登上榜首,金融专业能力和场景应用能力大幅领先GPT-4o。
Baichuan4-Finance API现已在百川智能官网正式上线,感兴趣的朋友可以随时移步官网了解并申请体验。
网址:https://platform.baichuan-ai.com/finPage
整体准确率领先GPT-4o近20%,登顶多个权威金融评测
为了让大家更好地了解Baichuan4-Finance的能力,我们在多个权威金融评测基准上对其进行了评测。
FLAME(Financial Large-Language Model Assessment and Metrics Evaluation)是中国人民大学财政金融学院12月17日发布的金融评测体系(github地址:https://github.com/FLAME-ruc/FLAME/tree/main)。
作为国内顶尖高校背书的金融领域最新的评测体系,FLAME兼顾专业性和实用性,由两个方向的评测基准组成,分别是:
FLAME-Cer评测结果显示,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。
GPT-4o大家非常熟悉,是金融领域公认的综合实力最强的通用模型之一;而XuanYuan3-70B-Chat则是国内首个开源中文金融大模型。
目前百川智能已经服务了数千家客户, 包括北电数智、完美世界游戏、爱奇艺、360集团、生学教育、爱学堂等各行业的领军企业,并且与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴,以及华为、中科曙光等硬件厂商,中国移动、中国电信、中国联通等运营商达成合作,携手构建百川大模型生态。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-21
AI 也会做梦?拆解 OpenClaw 独特的梦境记忆系统
2026-06-21
[译] 我所知的全部智能体工程技巧
2026-06-20
13人团队叫板Anthropic:我们造了一个更快更便宜的大模型
2026-06-20
微信左上角长出“两只眼睛”:小微测试版,可能是微信 AI 化最关键的一步
2026-06-20
Agent Skill 管理范式探索:像管理软件包一样管理 Agent 能力
2026-06-18
企业智能体的下半场,如何让智能体越用越聪明?
2026-06-18
你的 Harness 工作流真的在进步吗?我们用一场考试撕掉了遮羞布
2026-06-18
Agent 记忆,我们全都理解错了?
2026-04-15
2026-04-07
2026-04-07
2026-03-31
2026-04-24
2026-04-17
2026-03-31
2026-04-05
2026-04-02
2026-04-05
2026-06-18
2026-06-18
2026-06-10
2026-06-10
2026-06-07
2026-06-06
2026-06-03
2026-06-02