2026年4月9日 周四晚上19:30分,来了解“从个人单点提效,到构建企业AI生产力”(限30人)
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

谷歌Gemma 4深夜炸场:首次采用 Apache 2.0 开源,或暗藏新Siri模型

发布日期:2026-04-03 09:21:35 浏览次数: 1548
作者:AI寒武纪

微信搜一搜,关注“AI寒武纪”

推荐语

谷歌Gemma 4系列震撼开源,首次采用Apache 2.0协议,为开发者带来前所未有的商业自由度,或将重塑移动AI生态。

核心内容:
1. Gemma 4系列四大版本详解,从移动端到工作站全覆盖
2. 端侧AI的重大突破:支持多模态、低延迟处理与离线运行
3. 开源生态与商业应用:硬件适配、开发者工具及成功案例

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


↑阅读之前记得关注+星标⭐️,😄,每天才能第一时间接收到更新


 

谷歌正式发布开源模型 Gemma 4系列,不得不说,谷歌还是太全能了!

Gemma 4 基于与 Gemini 3 相同的研究和技术构建,这次最大变化是谷歌终于采用 Apache 2.0 开源协议发布,允许商业使用,开发者对数据、基础设施和模型拥有完整控制权,可在本地或云端任意环境部署,这比之前的 Google 自家的许可协议好得多。

四个尺寸,覆盖从手机到工作站

本次发布共四个版本:E2B、E4B、26B MoE(混合专家)和 31B Dense(稠密模型)。

其中,31B 模型在 Arena AI 文本排行榜上位列全球开源模型第三,26B 模型排名第六。这两个模型可以在参数量仅为竞争对手二十分之一的情况下超越对方。

谷歌野心很大,这次要改变端侧市场!E2B 和 E4B 专为移动端和物联网端设备设计,支持多模态能力、低延迟处理,可在手机、树莓派、NVIDIA Jetson Orin Nano 等边缘设备上完全离线运行。谷歌与 Pixel 团队、高通、联发科等移动硬件厂商紧密合作,推动这两款模型落地。Android 开发者现在可以通过 AICore 开发者预览版提前体验智能体开发流程。

全系模型标配原生处理图像和视频,支持可变分辨率,擅长 OCR 和图表理解。E2B 和 E4B 还支持原生音频输入,可语音识别和理解,E4B 和 E2B 听起来像是为传说中的苹果新 Siri准备的。

端侧模型上下文窗口为 128K,大模型最高支持 256K,可在单次提示中传入完整代码仓库或长文档。

原生支持 140 多种语言训练。

多步规划和复杂逻辑推理能力增强,在数学和指令跟随基准测试上表现突出。

原生支持函数调用、结构化 JSON 输出和系统指令,可构建能与外部工具和 API 交互的自主智能体。

支持高质量离线代码生成,可将本地工作站变成 AI 代码助手。

硬件适配方面

26B 和 31B 模型的未量化 bfloat16 权重可在单张 80GB NVIDIA H100 GPU 上运行,量化版本则可在消费级 GPU 上本地运行。

26B MoE 模型在推理时只激活 38 亿参数,在保证速度的同时降低硬件需求;31B Dense 则追求更高质量,也是微调的更好基础。

谷歌已通过这一路线验证了实际效果,包括:INSAIT 基于 Gemma 构建了保加利亚语优先的语言模型 BgGPT;与耶鲁大学合作的 Cell2Sentence-Scale 项目发现了癌症治疗的新路径。

获取和使用方式

现在可以通过以下渠道使用 Gemma 4:

在 Google AI Studio 中体验 31B 和 26B MoE 模型,在 Google AI Edge Gallery 中体验 E4B 和 E2B 模型。Android 开发者可在 Android Studio 中使用 Agent Mode,并通过 ML Kit GenAI Prompt API 构建生产级应用。

模型权重可从 Hugging Face、Kaggle 或 Ollama 下载,支持 Hugging Face 全系工具、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM、LM Studio 等主流框架。

训练和微调支持 Google Colab、Vertex AI 及本地 GPU。云端部署可通过 Vertex AI、Cloud Run、GKE、Sovereign Cloud 和 TPU 加速服务扩展至生产规模。

硬件方面,Gemma 4 针对 NVIDIA Blackwell GPU、AMD ROCm 栈、谷歌 Trillium 和 Ironwood TPU 均做了专项优化。

参考:

https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/?utm_source=tw&utm_medium=social&utm_campaign=og&utm_content=&utm_term=

 


--end--


最后记得⭐️我,每天都在更新:如果觉得文章还不错的话可以点赞转发推荐评论

/...@作者:你说的完全正确(YAR师)

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询