微信扫码
添加专属顾问
我要投稿
据路透社报道,来自三个不同科学机构的六名中国研究人员,通过Meta所发布的开源模型Llama的早期版本,开发了名为“ChatBIT”的人工智能应用。
其中两位研究人员来自军事科学机构,研究人员使用Meta于2023年2月发布的Llama 2大型语言模型进行了微调,构建了一个聚焦军事的AI工具,旨在收集和处理情报,为作战决策提供准确可靠的信息。
1:学术研究的合理性
将研究成果以论文形式发表,彰显了科研的本质。这种做法不仅是对技术的探索,也是大模型在不同领域应用的一次良好尝试。开放的学术环境应该欢迎这样的创新,无论其出发点如何。
2:Meta的反应与政策
目前,Llama模型的权重是开源的,Meta在技术上无法限制其使用。但它从授权形式上设置了一些限制,比如要求拥有超过7亿用户的服务向其申请许可,并禁止将这些模型用于“军事、战争、核工业或间谍活动”等受美国国防出口管制的领域,但这在一定程度上展现了科技霸权。
既然选择了开源,就应该允许全球不同国家和领域的研究者进行探索,这才符合互联网的开放精神,难道只能美国才能研究?
3:Meta为何选择开源
开源背后必然有其动机,扎克伯格曾表示,Meta起步较晚,缺乏竞争优势,因此选择开放源代码,以从周围生态中获益。
这种策略显然有助于Meta的股票上涨,且带动了众多基于Llama的下游服务商建立生态,赚翻了!
4:大模型的真正开源
虽然Llama的权重是开源的,但训练方法和数据并未开放,因此这种开源形式实际上是“伪开源”。Meta仍然掌握着技术的核心和优势。在缺乏广泛生态利益或对下游行业的控制时,完全开源几乎是不可能的。
即使技术上可行,普通开发者也难以复刻这些超大规模模型,巨大的成本与潜在的版权问题都是障碍,Meta不可能将技术优势给予和他一样规模的公司。
OSI标准化组织定义了大语言模型开源标准OSAID,动机是好的也是单纯的,但估计根本不具备可实施性。
5:国内大模型的发展现状
通过上图可以推测,目前许多企业在大语言模型的应用上策略不明确,动机令人质疑。若继续以当前方式推进,大多数企业可能因资金不足而消亡。
未来,存活的大模型企业应具备以下特点:一是财力雄厚,二是技术积累深厚,三是领导者具备强烈的技术洞察力。例如,百度和科大讯飞在自然语言处理(NLP)领域已有一定基础,李彦宏在无人驾驶领域的持续探索也显示了对科技发展的渴望。
国内未来可能仅需2至3家大模型企业,盲目烧钱毫无意义。即使在利用开源技术的过程中,企业也应将大模型技术融入自身产品中,例如百度地图和百度文库的集成。通过不断打磨与实践,才可能实现真正的技术突破。
通义千问不得不提,在推特上经常看到很多国外的从业者对于它的评测,开源做的很不错,可见对于大模型发展来说,领导人的智慧很重要,他们可能看的更远。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-30
DeepSeek Prover-V2,这才是探索AGI 的正确姿势!
2025-04-30
速报!DeepSeek-Prover-V2-671B 悄然上线,或为 R2 铺路?
2025-04-30
“Qwen3之后,我才真正敢投AI应用”
2025-04-30
真·开源MCP平台来了!ACI.dev能一站直连600+工具,让你的智能体秒变全能王!
2025-04-30
n8n:免费+开源的自动化神器,比dify更简单,比Make更强大!
2025-04-30
宝藏发现:Sim Studio,一款让AI工作流搭建变简单的开源利器
2025-04-29
我们有必要使用 Qwen3 吗?
2025-04-29
Qwen3开源发布:Think Deeper, Act Faster!社区推理、部署、微调、MCP调用实战教程来啦!
2024-07-25
2025-01-01
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-07-11
2024-06-12
2024-08-13
2024-12-26
2025-04-30
2025-04-29
2025-04-28
2025-04-28
2025-04-28
2025-04-21
2025-04-19
2025-04-17