logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

通义千问Qwen3-30B-A3B-Thinking-2507技术解析:推理模型的工程实践突破

阿里云发布Qwen3-30B-A3B推理模型,采用MoE架构和GQA机制,显著提升计算效率。该模型在数学(AIME25得分85)和编程(LiveCodeBenchv6得分66)测试中表现优异,支持256K长文本处理且显存占用降低67%。通过"强到弱蒸馏"策略和36万亿token训练数据增强,其STEM能力显著提升。应用测试显示,该模型在科研分析、代码审查等场景中展现出色性能,但

#人工智能#自然语言处理#深度学习
通用大模型、生成大模型、推理大模型:关系与区别详解

本文面向普通读者,全面介绍了通用大模型、生成大模型和推理大模型的定义、特点及相互关系。通用大模型作为基础框架,具备多模态处理能力和广泛的任务适应性;生成大模型通过学习数据分布实现内容创作,如文本和图像生成;推理大模型则强调逻辑推理与多步骤问题解决,在数学和决策等领域表现突出。三者关系上,生成与推理大模型多为通用模型的功能延伸,应用场景互补。未来发展趋势包括能力融合、行业垂直化以及效率优化,推动大模

#人工智能#自然语言处理#深度学习 +1
通用大模型、生成大模型、推理大模型:关系与区别详解

本文面向普通读者,全面介绍了通用大模型、生成大模型和推理大模型的定义、特点及相互关系。通用大模型作为基础框架,具备多模态处理能力和广泛的任务适应性;生成大模型通过学习数据分布实现内容创作,如文本和图像生成;推理大模型则强调逻辑推理与多步骤问题解决,在数学和决策等领域表现突出。三者关系上,生成与推理大模型多为通用模型的功能延伸,应用场景互补。未来发展趋势包括能力融合、行业垂直化以及效率优化,推动大模

#人工智能#自然语言处理#深度学习 +1
腾讯混元3D世界模型1.0:开源、沉浸与实用的技术解析

在2025世界人工智能大会上,腾讯发布并开源了混元3D世界模型1.0,成为业界首个支持沉浸漫游、交互与仿真的开源世界级3D生成模型。该模型采用两阶段生成架构与语义分层算法,支持文本与图像输入,可生成可编辑、可导出的高质量3D场景,广泛适用于游戏、影视、教育等领域。开源策略和技术创新显著降低了3D创作门槛,具备较强实用性与生态潜力。

#3d#深度学习#人工智能 +1
通义千问Qwen3-30B-A3B-Thinking-2507技术解析:推理模型的工程实践突破

阿里云发布Qwen3-30B-A3B推理模型,采用MoE架构和GQA机制,显著提升计算效率。该模型在数学(AIME25得分85)和编程(LiveCodeBenchv6得分66)测试中表现优异,支持256K长文本处理且显存占用降低67%。通过"强到弱蒸馏"策略和36万亿token训练数据增强,其STEM能力显著提升。应用测试显示,该模型在科研分析、代码审查等场景中展现出色性能,但

#人工智能#自然语言处理#深度学习
每日AI观察 | 多模态编辑、研究Agent、云端智能体一览

过去24小时内,Runway推出多任务视频编辑模型Aleph,支持对象增删、风格转换与镜头迁移;微软为Edge浏览器引入Copilot模式,升级为“AI原生”浏览器;阶跃星辰发布AI研究助手“深研”,可十分钟生成专业报告;阿里云推出AgentBay,三行代码接入云端AI能力;昆仑万维开源多模态模型Skywork UniPic;OpenAI上线ChatGPT Study学习模式,强调引导式学习与批判

#人工智能#自然语言处理#github +1
到底了