logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-V3.2 正式发布:开源模型也能“边想边用工具”!

这一次,不仅推理能力逼近 GPT-5 和 Gemini-3.0-Pro,更首次实现了 “思考 + 工具调用”的深度融合,让开源模型真正具备了实用级 Agent 能力。在多个权威推理评测(如 AIME、HMMT、LiveCodeBench)中,V3.2 的表现与 GPT-5 相当,仅略逊于 Gemini-3.0-Pro。在主流 Agent 评测(如 Tool-Decathlon、MCP-Mark)中

文章图片
#人工智能
智能体版中科院学术GPT上线内测!AI与科研的深度碰撞

中科院推出智能体驱动的学术研究平台AcademicAgentsStudio,将传统科研助手升级为主动型"科研伙伴"。该平台集成GPT等主流AI模型,支持工具调用和流程规划,覆盖文献检索、论文写作、数据可视化等全流程科研场景。通过开源共建模式,平台致力于构建透明开放的学术AI生态,实现从被动工具到主动智能体的转变,推动科研创新模式变革。目前平台已开放免费内测,旨在帮助科研工作者提

文章图片
#人工智能
Claude Code 子代理上线:一人公司,全员AI专家!

Claude Code 推出 Sub Agents 子代理功能,让你告别单一AI助手,组建专属“AI专家团队”。每个子代理专注特定领域(如前端、后端、测试),拥有独立上下文与定制提示词,避免信息过载,提升开发效率。支持自动委派或显式调用,可跨项目复用并共享协作。从代码生成到架构设计,一人即可驱动全员AI的高效开发流程——真正实现“一人公司,全员AI专家”!

文章图片
#人工智能
GPT-5.1发布!你的AI更暖更智能!

2025 年 11 月 12 日OpenAI 官方正式推出了 GPT-5.1。OpenAI 明确表示,这次升级的核心目标是:让 AI 不仅要“智能”,还要“聊起来很愉快”(enjoyable to talk to)。我们为你逐字逐句地拆解了这篇官方博客,带你深入了解 GPT-5.1 到底强在哪里。

文章图片
#人工智能#神经网络#AIGC
谷歌Nano Banana 2爆火!1秒生4K图、推演微积分

谷歌DeepMind推出的NanoBanana2带来图像生成技术革命,支持2K原生分辨率(可扩展至4K),生成速度比传统AI快340%,仅需3.8秒完成4K图像处理。其突破性表现在:精确理解复杂提示词(如数学公式推导)、照片级细节还原(面部、光影等),以及仅256MB的内存占用。相比前代,新模型在图像质量、文字渲染和复杂场景处理上均有显著提升,使AI创意工具进入实时创作新阶段。

文章图片
#人工智能
百度发布文心一言5.0预览版大模型:多模态能力全面超越GPT-5?

百度声称,该模型的多模态融合使其能够比依赖特定模态编码器的模型更有效地生成和解读视觉内容,并具备更强的上下文感知能力。虽然百度没有公开完整的基准测试细节或原始分数,但其性能定位表明,百度有意将 ERNIE 5.0 定位为旗舰模型,而不是小众的多模态系统,该旗舰模型可以与通用推理领域最大的封闭模型相媲美。百度声称,该模型在基于文档和图表的基准测试中击败了 GPT-5-High 和 Gemini 2.

文章图片
6B参数“小巨人”如何撼动生图格局?阿里开源Z-Image实测,效果直逼SOTA

阿里开源6B参数图像生成模型Z-Image,在消费级显卡上实现2-3秒快速出图,生成质量媲美主流大模型。该模型通过数据、架构等系统性优化,在细节刻画、光影表现等方面表现突出,支持本地部署和商用。Z-Image的出现标志着"专家模型"时代的到来,未来AI生态可能由众多专注领域的小模型协同构成,通用大模型则扮演智能调度中枢角色。这种轻量化、专业化的发展路径,或将推动AI向更实用、高

文章图片
#人工智能#AI作画
Claude Code 火了!凭什么成为 AI 编程天花板?手把手教你复刻同款魔力

2025年2月上线的Claude Code是当下热门终端AI编程助手,基于Claude Opus 4.1等先进模型,在SWE-bench、Terminal-bench测试中成绩优异,远超业界平均水平与GPT-4.1,还获开发者认可,能大幅提升效率。它有四大核心优势:200K token超大上下文窗口与多模态理解、终端优先的交互模式、跨文件编辑等代码能力、自主规划的任务管理。其成功还源于三大设计原则

文章图片
#人工智能
千问 APP 深度体验:阿里巴巴打造的 “会聊天、能办事“ 的 AI 超级助手

阿里巴巴推出新一代AI助手"千问APP",基于Qwen3开源模型打造。该应用集智能对话与任务执行为一体,具有三大核心优势:采用混合推理架构实现高效响应,专业领域问答准确率超92%;支持119种语言,提供多模态知识获取方式;简约界面整合办公、学习、生活等实用功能。作为阿里进军C端AI市场的战略产品,千问APP融合了阿里在AI领域的技术积累,致力于成为用户的全能智能助手。

文章图片
#人工智能
DeepSeek开源IMO金牌模型:AI数学垄断时代终结

DeepSeek开源数学大模型DeepSeekMath-V2在IMO级别问题上实现突破性进展。该模型具备自验证机制,通过"阅卷老师+督导"双重验证系统确保推理严谨性,在IMO2025、CMO2024等竞赛中达到金牌水平,并在Putnam2024获得118/120的超高分数。相比传统AI仅关注答案正确性,DeepSeekMath-V2创新性地采用"诚实奖励机制&quot

文章图片
#人工智能
    共 155 条
  • 1
  • 2
  • 3
  • 16
  • 请选择