微信扫码
添加专属顾问
我要投稿
今天,我们发布了全链路领域增强大模型Baichuan4-Finance。
Baichuan4-Finance在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。
在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上均登上榜首,金融专业能力和场景应用能力大幅领先GPT-4o。
Baichuan4-Finance API现已在百川智能官网正式上线,感兴趣的朋友可以随时移步官网了解并申请体验。
网址:https://platform.baichuan-ai.com/finPage
整体准确率领先GPT-4o近20%,登顶多个权威金融评测
为了让大家更好地了解Baichuan4-Finance的能力,我们在多个权威金融评测基准上对其进行了评测。
FLAME(Financial Large-Language Model Assessment and Metrics Evaluation)是中国人民大学财政金融学院12月17日发布的金融评测体系(github地址:https://github.com/FLAME-ruc/FLAME/tree/main)。
作为国内顶尖高校背书的金融领域最新的评测体系,FLAME兼顾专业性和实用性,由两个方向的评测基准组成,分别是:
FLAME-Cer评测结果显示,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。
GPT-4o大家非常熟悉,是金融领域公认的综合实力最强的通用模型之一;而XuanYuan3-70B-Chat则是国内首个开源中文金融大模型。
目前百川智能已经服务了数千家客户, 包括北电数智、完美世界游戏、爱奇艺、360集团、生学教育、爱学堂等各行业的领军企业,并且与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴,以及华为、中科曙光等硬件厂商,中国移动、中国电信、中国联通等运营商达成合作,携手构建百川大模型生态。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-03
从 CLI 到桌面:Codex 把 coding agent 变成“任务指挥台”
2026-02-03
谷歌重大更新:国内手动开启 Gemini AI 侧边栏与 Auto Browse 自动浏览全攻略
2026-02-03
OpenAI 发布新的 Codex 桌面版,我现在不骂 Codex 难用了
2026-02-03
OpenClaw 技术解析:Agent Skills 机制与应用
2026-02-03
Claude Skills 官方最全指南
2026-02-03
一文搞懂Claude Skills和SubAgents及背后本质
2026-02-03
刚刚!OpenAI 正式发布 Codex App,一人指挥一支 AI 军队,Cursor 慌了?
2026-02-03
深度解读:OpenClaw 架构及生态
2026-01-24
2026-01-10
2025-11-19
2025-11-13
2026-01-26
2026-01-01
2025-12-09
2025-11-12
2026-01-09
2025-11-15
2026-02-03
2026-02-03
2026-02-02
2026-02-02
2026-02-02
2026-01-31
2026-01-30
2026-01-29