微信扫码
添加专属顾问
我要投稿
谷歌Gemma 4系列震撼开源,首次采用Apache 2.0协议,为开发者带来前所未有的商业自由度,或将重塑移动AI生态。核心内容: 1. Gemma 4系列四大版本详解,从移动端到工作站全覆盖 2. 端侧AI的重大突破:支持多模态、低延迟处理与离线运行 3. 开源生态与商业应用:硬件适配、开发者工具及成功案例
谷歌正式发布开源模型 Gemma 4系列,不得不说,谷歌还是太全能了!
Gemma 4 基于与 Gemini 3 相同的研究和技术构建,这次最大变化是谷歌终于采用 Apache 2.0 开源协议发布,允许商业使用,开发者对数据、基础设施和模型拥有完整控制权,可在本地或云端任意环境部署,这比之前的 Google 自家的许可协议好得多。
本次发布共四个版本:E2B、E4B、26B MoE(混合专家)和 31B Dense(稠密模型)。
其中,31B 模型在 Arena AI 文本排行榜上位列全球开源模型第三,26B 模型排名第六。这两个模型可以在参数量仅为竞争对手二十分之一的情况下超越对方。
谷歌野心很大,这次要改变端侧市场!E2B 和 E4B 专为移动端和物联网端设备设计,支持多模态能力、低延迟处理,可在手机、树莓派、NVIDIA Jetson Orin Nano 等边缘设备上完全离线运行。谷歌与 Pixel 团队、高通、联发科等移动硬件厂商紧密合作,推动这两款模型落地。Android 开发者现在可以通过 AICore 开发者预览版提前体验智能体开发流程。
全系模型标配原生处理图像和视频,支持可变分辨率,擅长 OCR 和图表理解。E2B 和 E4B 还支持原生音频输入,可语音识别和理解,E4B 和 E2B 听起来像是为传说中的苹果新 Siri准备的。
端侧模型上下文窗口为 128K,大模型最高支持 256K,可在单次提示中传入完整代码仓库或长文档。
原生支持 140 多种语言训练。
多步规划和复杂逻辑推理能力增强,在数学和指令跟随基准测试上表现突出。
原生支持函数调用、结构化 JSON 输出和系统指令,可构建能与外部工具和 API 交互的自主智能体。
支持高质量离线代码生成,可将本地工作站变成 AI 代码助手。
硬件适配方面
26B 和 31B 模型的未量化 bfloat16 权重可在单张 80GB NVIDIA H100 GPU 上运行,量化版本则可在消费级 GPU 上本地运行。
26B MoE 模型在推理时只激活 38 亿参数,在保证速度的同时降低硬件需求;31B Dense 则追求更高质量,也是微调的更好基础。
谷歌已通过这一路线验证了实际效果,包括:INSAIT 基于 Gemma 构建了保加利亚语优先的语言模型 BgGPT;与耶鲁大学合作的 Cell2Sentence-Scale 项目发现了癌症治疗的新路径。
获取和使用方式
现在可以通过以下渠道使用 Gemma 4:
在 Google AI Studio 中体验 31B 和 26B MoE 模型,在 Google AI Edge Gallery 中体验 E4B 和 E2B 模型。Android 开发者可在 Android Studio 中使用 Agent Mode,并通过 ML Kit GenAI Prompt API 构建生产级应用。
模型权重可从 Hugging Face、Kaggle 或 Ollama 下载,支持 Hugging Face 全系工具、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM、LM Studio 等主流框架。
训练和微调支持 Google Colab、Vertex AI 及本地 GPU。云端部署可通过 Vertex AI、Cloud Run、GKE、Sovereign Cloud 和 TPU 加速服务扩展至生产规模。
硬件方面,Gemma 4 针对 NVIDIA Blackwell GPU、AMD ROCm 栈、谷歌 Trillium 和 Ironwood TPU 均做了专项优化。
参考:
https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/?utm_source=tw&utm_medium=social&utm_campaign=og&utm_content=&utm_term=
--end--
最后记得⭐️我,每天都在更新:如果觉得文章还不错的话可以点赞转发推荐评论
/...@作者:你说的完全正确(YAR师)
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-03
Gemma 4 来了:谷歌最强开源模型,把 Gemini 3 的能力塞进你的手机
2026-04-03
Google Gemma 4 开源|全面解读
2026-04-02
炸裂!Seedance 2.0 免费用!全网第一只接入的开源龙虾,效果离谱
2026-04-02
GLM-5.1 来了:开源模型第一次在长程任务上断档领先
2026-04-02
送你一只「传奇」稀有度的Claude Code电子宠物
2026-04-01
震惊!刚刚,Anthropic掀了桌子:OpenClaude横空出世,大模型闭源时代彻底终结?
2026-04-01
IMClaw:通过微信/飞书操控ClaudeCode/Codex/GeminiCLI/Pi Agent蜂群
2026-04-01
众智FlagOS 2.0正式发布:32款AI芯片、497算子、Skills专业技能库首发
2026-01-30
2026-01-27
2026-01-12
2026-01-29
2026-01-27
2026-01-21
2026-01-28
2026-01-06
2026-01-23
2026-01-26
2026-04-01
2026-03-17
2026-03-13
2026-03-02
2026-02-05
2026-01-28
2026-01-26
2026-01-21