微信扫码
添加专属顾问
我要投稿
今天,我们发布了全链路领域增强大模型Baichuan4-Finance。
Baichuan4-Finance在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。
在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上均登上榜首,金融专业能力和场景应用能力大幅领先GPT-4o。
Baichuan4-Finance API现已在百川智能官网正式上线,感兴趣的朋友可以随时移步官网了解并申请体验。
网址:https://platform.baichuan-ai.com/finPage
整体准确率领先GPT-4o近20%,登顶多个权威金融评测
为了让大家更好地了解Baichuan4-Finance的能力,我们在多个权威金融评测基准上对其进行了评测。
FLAME(Financial Large-Language Model Assessment and Metrics Evaluation)是中国人民大学财政金融学院12月17日发布的金融评测体系(github地址:https://github.com/FLAME-ruc/FLAME/tree/main)。
作为国内顶尖高校背书的金融领域最新的评测体系,FLAME兼顾专业性和实用性,由两个方向的评测基准组成,分别是:
FLAME-Cer评测结果显示,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。
GPT-4o大家非常熟悉,是金融领域公认的综合实力最强的通用模型之一;而XuanYuan3-70B-Chat则是国内首个开源中文金融大模型。
目前百川智能已经服务了数千家客户, 包括北电数智、完美世界游戏、爱奇艺、360集团、生学教育、爱学堂等各行业的领军企业,并且与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴,以及华为、中科曙光等硬件厂商,中国移动、中国电信、中国联通等运营商达成合作,携手构建百川大模型生态。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-07
为什么同一个模型,在 Claude Code/Codex CLI 里感觉像换了个脑子?
2026-05-07
尝试在Warp里使用claude code
2026-05-07
我用 Claude Code CLI 搭了一套「不丢上下文」的工作流
2026-05-07
Anthropic 上线「做梦」功能,让 Agent 越睡越聪明
2026-05-06
Android CLI 实战指南:借助任意智能体,实现 3 倍速高效开发
2026-05-06
刚刚,GPT-5.5 Instant全员免费!数亿人的ChatGPT变了
2026-05-06
M365 Copilot :App Builder 它不仅是单次代码生成
2026-05-06
GPT-5.5 Instant 来了,但这次重点不是“更强”,而是“更像人”
2026-04-15
2026-03-31
2026-03-13
2026-02-14
2026-03-17
2026-02-09
2026-04-07
2026-03-17
2026-03-21
2026-02-20
2026-05-07
2026-04-26
2026-04-22
2026-04-18
2026-04-13
2026-04-12
2026-04-07
2026-04-01