
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
谷歌2026年推出的Gemini3.5Flash(代号“雪兔”)是一款革命性的轻量级AI模型,该模型面向普通用户、开发者和企业提供免费开放服务,涵盖搜索优化、智能助手、自动化工作流等场景,真正实现了“高性能+低成本”的AI普惠化目标。

MiniCPM-o 2.6是面壁智能推出的全新端侧全模态模型,拥有强大的端到端多模态架构,是MiniCPM-0系列最新、性能最佳的多模态大模型,具有8B参数量。在视觉、语音和多模态直播等多个领域,MiniCPM-o 2.6达到了与GPT-40相当的性能水平。模型还支持实时双语语音识别,超越了 GPT-40实时识别的表现。值得一提的是,MiniCPM-o 2.6在保持强大能力的同时,还针对边缘设备的

是百度推出的新一代多模态大模型,属于,采用,总参数规模达,激活参数。该模型基于开发,支持文本与视觉的联合训练,具备强大的多模态理解和生成能力。1.2.3.

当其他AI巨头还在比拼万亿参数时,字节跳动用20B的全新多模态大模型,横扫各大权威测试榜单,拿下了多项SOTA。

出门问问最新开源语音合成模型,具有超强语音合成能力

MiniCPM-V 4.5 是 OpenBMB 最新 8B 多模态大模型,基于 Qwen3-8B + SigLIP2-400M,在 OpenCompass 平均 77.0 分,超越 GPT-4o-latest 与 Qwen2.5-VL 72B;独创 3D 重采样器实现 96× 视频令牌压缩,10 FPS 长视频理解不增成本;可控混合快速/深度思维一键切换;180 万像素 OCR 与 PDF 解析领

Gemma-3n-E4B-it(简称 E4B-IT)是 Google 于 2025 年 6 月 26 日推出的轻量级开源多模态 AI 模型,属于 Gemma 3n 系列的高阶版本(E4B 指“有效参数 4B”),专为移动设备和边缘计算场景设计,支持本地处理文本、图像和音频输入,并生成文本输出。E4B-IT 的音频功能支持设备端语音转文本和翻译(英法/英西翻译准确率超 92%),视觉功能由 Mobi

3月6日,阿里宣布开源推理模型 QwQ-32B,320亿参数却实现了与 DeepSeek-R1 满血版相匹敌的性能,甚至在多项测试中实现了超越。这一突破打破了“参数规模决定性能”的固有认知,将推理能力提升至新的高度。

“开源之光”通义千问,再次突破了AI的边界。

《AI算力危机爆发:DeepSeek宕机12小时揭示产业困局》3月29日,DeepSeek平台突发大规模宕机,暴露中国AI产业爆发增长与算力短缺的尖锐矛盾。








