微信扫码
添加专属顾问
我要投稿
今天,我们发布了全链路领域增强大模型Baichuan4-Finance。
Baichuan4-Finance在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。
在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上均登上榜首,金融专业能力和场景应用能力大幅领先GPT-4o。
Baichuan4-Finance API现已在百川智能官网正式上线,感兴趣的朋友可以随时移步官网了解并申请体验。
网址:https://platform.baichuan-ai.com/finPage
整体准确率领先GPT-4o近20%,登顶多个权威金融评测
为了让大家更好地了解Baichuan4-Finance的能力,我们在多个权威金融评测基准上对其进行了评测。
FLAME(Financial Large-Language Model Assessment and Metrics Evaluation)是中国人民大学财政金融学院12月17日发布的金融评测体系(github地址:https://github.com/FLAME-ruc/FLAME/tree/main)。
作为国内顶尖高校背书的金融领域最新的评测体系,FLAME兼顾专业性和实用性,由两个方向的评测基准组成,分别是:
FLAME-Cer评测结果显示,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。
GPT-4o大家非常熟悉,是金融领域公认的综合实力最强的通用模型之一;而XuanYuan3-70B-Chat则是国内首个开源中文金融大模型。
目前百川智能已经服务了数千家客户, 包括北电数智、完美世界游戏、爱奇艺、360集团、生学教育、爱学堂等各行业的领军企业,并且与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴,以及华为、中科曙光等硬件厂商,中国移动、中国电信、中国联通等运营商达成合作,携手构建百川大模型生态。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-14
AI时代如何为企业和个人赋能
2025-06-14
没吃透 Function Calling?难怪你不理解 AI Agent 为何非来不可!
2025-06-14
浅尝一下微软的AutoGen框架
2025-06-14
基于大模型的智能运营 | 智能体式编排,业务流程管理的新阶段
2025-06-14
从Manus爆火看Agent AI的技术演进与市场变革——AI Agent全景研报
2025-06-14
张鹏对谈李广密:Agent 的真问题与真机会,究竟藏在哪里?
2025-06-14
为什么说Maus是未来任务型AI系统的代表?
2025-06-14
AI agent如何进化为天网
2025-05-29
2025-03-20
2025-03-21
2025-04-11
2025-03-20
2025-03-19
2025-03-20
2025-03-19
2025-03-19
2025-03-19
2025-06-14
2025-06-14
2025-06-13
2025-06-13
2025-06-13
2025-06-13
2025-06-12
2025-06-12