万益资讯网

谷歌DeepMind重磅炸场!Gemma 4 12B以“统一无编码器”多模态架构

谷歌DeepMind重磅炸场!Gemma 4 12B以“统一无编码器”多模态架构杀出,将图像、音频和256K超长上下文塞进一台普通笔记本,就能本地跑出接近前沿级的推理能力!

Gemma 4 12B是一个统一的、无需单独编码器的多模态模型,直接将原始图像patch和音频波形通过轻量线性投影注入LLM的嵌入空间,支持图像、音频输入和256K上下文窗口,完全开源Apache 2.0许可。它能在普通笔记本(8-16GB RAM,通过GGUF/Unsloth量化)本地高效运行,同时保持强大推理能力。DeepMind CEO Demis Hassabis发文庆祝Gemma系列累计下载量突破1.5亿。