logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

不止一个Max:从阿里“七连发”看全模态AI的技术版图

阿里巴巴在2025云栖大会发布了通义大模型系列七连发,涵盖Qwen3-Max(万亿参数基座模型)、Qwen3-VL(视觉语言模型)、Qwen3-Omni(全模态模型)等七大产品,构建了覆盖全尺寸、全模态的AI技术版图。其中,旗舰模型Qwen3-Max采用MoE架构,具备1M Token上下文能力;Qwen3-VL实现视觉Coding;Qwen3-Omni首创思考者-表达者架构,实现端到端多模态协同

#人工智能#深度学习#机器学习
不止一个Max:从阿里“七连发”看全模态AI的技术版图

阿里巴巴在2025云栖大会发布了通义大模型系列七连发,涵盖Qwen3-Max(万亿参数基座模型)、Qwen3-VL(视觉语言模型)、Qwen3-Omni(全模态模型)等七大产品,构建了覆盖全尺寸、全模态的AI技术版图。其中,旗舰模型Qwen3-Max采用MoE架构,具备1M Token上下文能力;Qwen3-VL实现视觉Coding;Qwen3-Omni首创思考者-表达者架构,实现端到端多模态协同

#人工智能#深度学习#机器学习
阿里深夜连发三款多模态大招,Qwen3-Omni“全能”登场

阿里发布三大多模态AI模型,开启融合新时代。Qwen3-Omni作为首个原生端到端全模态模型,统一处理文本、图像、音频和视频,采用混合专家架构和思考者-表达者机制,在多项测试中表现优异。配套发布的Qwen3-TTS-Flash语音模型支持多语言情感化语音合成,Qwen-Image-Edit-2509图像编辑模型实现高保真多图融合。这组技术突破将推动数字人、电商、游戏等领域的创新应用,标志着多模态A

文章图片
#人工智能
深度解析:从vLLM到icepop的AI推理优化技术

本文系统梳理了2022-2025年大模型推理优化技术演进路线。早期通过FlashAttention、vLLM等存储优化技术解决显存瓶颈;2024年后MoE架构(如美团LongCat、蚂蚁Ring-flash)通过部分参数激活实现高效推理;2025年蚂蚁icepop算法突破RL与MoE结合的训练难题。开发者可通过七牛云等平台直接调用经过深度优化的高效推理模型。这些技术共同推动AI应用朝着更省、更快、

文章图片
#人工智能
MoE效能革命:从美团、蚂蚁最新开源模型谈起

国内AI大模型领域迎来效能革命,美团和蚂蚁集团相继开源基于MoE架构的大语言模型。美团LongCat通过创新设计实现高效能,聚焦智能体能力;蚂蚁Ring-flash攻克MoE与强化学习结合难题。两家企业的开源行动标志着AI大模型竞争转向效能比优化,MoE架构成为平衡能力与成本的最优解。这一趋势为开发者带来新机遇,可通过统一接入平台便捷应用前沿模型,推动AI技术普惠化发展。

文章图片
深度解析DeepSeek V3.1-Terminus:技术演进与Agent实践

DeepSeek发布V3.1-Terminus版本,标志着AI大模型向智能体时代的重大演进。该版本基于685B参数的MoE架构,优化了语言一致性和两大核心能力:Code Agent可自动修复代码错误并生成测试,Search Agent能自主完成复杂信息检索。在SWE-bench等评测中性能显著提升。创新性地提供"思考模式"与"非思考模式"双推理架构,前者可展

文章图片
#人工智能
Grok 4 Fast vs GPT-5-mini:新一代高效AI模型开发者选型指南

2025年下半年,AI大模型竞争进入高性价比时代。OpenAI的GPT-5-mini和xAI的Grok 4 Fast相继发布,前者以接近旗舰模型的85-95%性能但仅五分之一的成本成为性价比之王,后者则以二十五分之一的成本和344 tokens/秒的极速响应著称,特别擅长网络研究与实时信息整合。开发者应根据场景需求选择:Grok 4 Fast更适合实时信息处理,GPT-5-mini则擅长结构化任务

文章图片
#人工智能
Grok 4 Fast vs GPT-5-mini:新一代高效AI模型开发者选型指南

2025年下半年,AI大模型竞争进入高性价比时代。OpenAI的GPT-5-mini和xAI的Grok 4 Fast相继发布,前者以接近旗舰模型的85-95%性能但仅五分之一的成本成为性价比之王,后者则以二十五分之一的成本和344 tokens/秒的极速响应著称,特别擅长网络研究与实时信息整合。开发者应根据场景需求选择:Grok 4 Fast更适合实时信息处理,GPT-5-mini则擅长结构化任务

文章图片
#人工智能
深度解析:Grok 4 Fast的统一架构与Agentic能力实现

xAI公司发布Grok 4 Fast模型,以1/25成本和344令牌/秒的速度刷新行业记录。其创新统一架构整合推理与快速响应功能于单一模型,通过系统提示切换模式,减少40%思考令牌。强大的Agentic能力使AI能自主搜索网络,整合多源信息完成研究任务。xAI还通过系统提示词等方案确保模型安全性。Grok 4 Fast不仅提升了AI效率,更推动了从知识问答向自主行动的范式转变,为智能应用开发开辟新

文章图片
#人工智能
深度解析:Grok 4 Fast的统一架构与Agentic能力实现

xAI公司发布Grok 4 Fast模型,以1/25成本和344令牌/秒的速度刷新行业记录。其创新统一架构整合推理与快速响应功能于单一模型,通过系统提示切换模式,减少40%思考令牌。强大的Agentic能力使AI能自主搜索网络,整合多源信息完成研究任务。xAI还通过系统提示词等方案确保模型安全性。Grok 4 Fast不仅提升了AI效率,更推动了从知识问答向自主行动的范式转变,为智能应用开发开辟新

文章图片
#人工智能
    共 73 条
  • 1
  • 2
  • 3
  • 8
  • 请选择