谷歌Gemini 3.1 Flash-Lite，轻量模型大能量

IT界那些事儿

95人浏览 · 2026-03-04 18:40:47

IT界那些事儿 · 2026-03-04 18:40:47 发布

谷歌正式发布Gemini 3.1 Flash-Lite，作为Gemini系列轻量级多模态AI模型，成本与速度显著优化，性能表现出色，已在相关平台开放预览。

成本与速度优化

Gemini 3.1 Flash-Lite专为高吞吐、低复杂度任务设计。输入价格每百万token仅0.25美元，输出为1.50美元，远低于Gemini 3.1 Pro，在成本上极具优势。

性能大幅提升

内部测试显示，较前代Gemini 2.5 Flash提速45%，首token响应时间缩短至2.5倍。支持100万token上下文输入，能生成长达64,000 token文本，还可生成可执行代码。

基准测试领先

在11项基准测试中，6项表现最优，超越GPT - 5 mini与Claude 4.5 Haiku，在博士级科学问答集GPAQ Diamond中领先。不过，在高难度HLA基准得分较低。

应用场景明确

该模型定位清晰，聚焦翻译、内容审核、原型生成等高并发场景，适用于生成BI仪表盘等可视化资产。

开放预览使用

目前已在Google Cloud Vertex AI平台开放预览，并集成于Google AI Studio，方便开发者通过自然语言快速构建应用。

编辑观点：谷歌Gemini 3.1 Flash-Lite成本低、速度快，性能亮点多，虽有小短板，但在高并发场景潜力大，将推动开发者构建更多创新应用。

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

cover

ComAct：工业 Agent 为什么要把专业软件变成可执行动作

龙虾开发者社区

cover

程序员必看！自定义Skill原来这么简单

龙虾开发者社区

cover

解构 Agent Skills：从意图匹配到工具调用的完整链路（上篇）

龙虾开发者社区

所有评论(0)

查看更多评论

IT界那些事儿

已为社区贡献50条内容