谷歌正式发布Gemini 3.1 Flash-Lite,作为Gemini系列轻量级多模态AI模型,成本与速度显著优化,性能表现出色,已在相关平台开放预览。

成本与速度优化

Gemini 3.1 Flash-Lite专为高吞吐、低复杂度任务设计。输入价格每百万token仅0.25美元,输出为1.50美元,远低于Gemini 3.1 Pro,在成本上极具优势。

性能大幅提升

内部测试显示,较前代Gemini 2.5 Flash提速45%,首token响应时间缩短至2.5倍。支持100万token上下文输入,能生成长达64,000 token文本,还可生成可执行代码。

基准测试领先

在11项基准测试中,6项表现最优,超越GPT - 5 mini与Claude 4.5 Haiku,在博士级科学问答集GPAQ Diamond中领先。不过,在高难度HLA基准得分较低。

应用场景明确

该模型定位清晰,聚焦翻译、内容审核、原型生成等高并发场景,适用于生成BI仪表盘等可视化资产。

开放预览使用

目前已在Google Cloud Vertex AI平台开放预览,并集成于Google AI Studio,方便开发者通过自然语言快速构建应用。

编辑观点:谷歌Gemini 3.1 Flash-Lite成本低、速度快,性能亮点多,虽有小短板,但在高并发场景潜力大,将推动开发者构建更多创新应用。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐