微信扫码
添加专属顾问
我要投稿
溯源/引用,工业界应用老板们最喜欢加的一个东西。总的来说,这个文章也没啥。做了一个评测基准,开源了一个用于溯源sft的45k数据集,开源了2个模型,介绍了他们的数据生成pipeline。
主要看看数据生成的pipeline把,如下图:3步+1步过滤 (为啥不一步到位了,说是这样更干净,先出答案,在生成引用)
数据比例,中文占比比较多。 可以比较好的利用私有场景~
整体就是效果更好
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-12
57分钟、6次交互、上千行深度思考!GLM-5从0到1开发因果关系图谱抽取及可视化系统实录
2026-02-12
GLM-5开源:迈向Agentic Engineering新范式
2026-02-12
GLM-5深夜登场,这是国产开源模型首次逼平Claude Opus 4.5。
2026-02-12
OpenClaw核心组件与飞书部署实践
2026-02-11
后发先至,新模型发布,全球进入DeepSeek狂欢周,连珠炮响了!
2026-02-11
Agent “案底”可追溯:前 GitHub CEO 再创业,把思考过程写进 Git
2026-02-11
GitHub 上狂揽 1.3 万 Star!港大开源的轻量版 Clawdbot。
2026-02-11
OpenClaw近一半用户来自中国,大家在FOMO什么?
2025-11-19
2026-01-27
2026-01-29
2026-01-12
2025-12-22
2026-01-30
2025-11-17
2025-12-10
2026-01-28
2025-12-23
2026-02-11
2026-02-05
2026-01-28
2026-01-26
2026-01-21
2026-01-21
2026-01-20
2026-01-16