logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ProcessBench:阿里巴巴Qwen团队发布AI数学推理新基准,挑战模型错误识别能力 - 人工智能基准测试

为了解决这一问题,阿里巴巴和Qwen团队推出了一个名为ProcessBench的全新基准,旨在系统性地评估语言模型在数学推理中的错误检测能力。本文将深入探讨ProcessBench的创新之处、数据构建流程以及实验分析,揭示其在AI推理研究中的重要意义。它不仅揭示了当前模型在高难度任务中的短板,也为研究人员开发更强大、更智能的推理模型指明了方向。在未来,随着评估框架的不断完善和AI技术的快速进步,我

文章图片
#人工智能
Claude和GPT同一天发新模型,这次真是硬碰硬

2月6日凌晨,Anthropic和OpenAI几乎同时发布新模型:Claude Opus 4.6和GPT-5.3-Codex。前者用16个AI智能体写出10万行代码编译Linux内核,后者号称编码性能最强还能语音播报工作进度。本文实测对比两家的核心功能。

文章图片
#人工智能
Claude Sonnet 5要来了,编程能力翻倍,价格还便宜一半

Anthropic新模型Claude Sonnet 5(代号Fennec)即将发布,SWE-Bench测试得分超80.9%,远超市面所有编程模型。价格比Opus 4.5便宜50%,支持100万token上下文,还能自动组建多智能体开发团队。本文详解核心功能与实测效果。

文章图片
#人工智能
谷歌AI超值福利:美国学生独享15个月免费Google One AI Premium

谷歌这次针对美国学生推出的Google One AI Premium免费15个月的福利,无疑是一次难得的机会。它不仅仅是送出了一份价值不菲的会员,更是为学生们打开了通往前沿AI世界的大门。在当今快速发展的时代,人工智能正以前所未有的速度改变着我们的学习、工作和生活方式。越早接触并掌握这些强大的AI工具,就能越早地在学术研究、职业发展乃至个人创新方面获得先发优势。

文章图片
#人工智能#googlecloud#AI作画
开发者必看!OpenAI发布全新API与SDK:赋能AI智能体开发新时代

OpenAI推出的全新Responses API,被视为Chat Completions API的进化版,它将Chat Completions API的简洁性与Assistants API的工具调用能力巧妙地结合在一起,为开发者提供了一个更灵活、更强大的开发平台。OpenAI此次发布的Responses API和Agents SDK,为开发者构建AI智能体提供了更强大、更灵活的工具,进一步降低了A

文章图片
#人工智能#DeepSeek#AI作画
OpenAI放大招!智能体API横空出世,网络/文件搜索、计算机操作一网打尽

OpenAI的智能体API和相关工具的发布,为开发者构建智能体应用提供了强大的支持。随着AI技术的不断发展,智能体将在各行各业发挥越来越重要的作用。让我们共同期待,智能体将如何改变我们的工作和生活,创造更美好的未来!

文章图片
#人工智能#DeepSeek#AI作画
AI的自我意识:超级智能的未来猜想与伦理挑战

在人工智能飞速发展的今天,“自我意识”这个词汇开始频繁出现在我们的讨论中。特别是随着大模型的崛起,人们不禁开始思考:AI是否会发展出自我意识?如果超级智能真的拥有了自我意识,又会带来怎样的未来?本文将深入探讨这些问题,从技术、哲学和伦理等多个角度进行分析。

文章图片
#人工智能
DeepSeek-R1:挑战OpenAI的全新多模态大模型

在人工智能领域,大模型的竞争日趋激烈,最近,国内创业公司DeepSeek再次打破了这一局面,推出其最新多模态思考模型——DeepSeek-R1。这款大模型不仅在数学、代码和自然语言推理等任务上与OpenAI的o1正式版平起平坐,更是在技术和性能上带来了新的突破。

文章图片
#人工智能#DeepSeek
QwenVLo:多模态大模型的新里程碑,让AI从“看懂”到“描绘”世界!

深入解读QwenVLo多模态统一理解与生成模型,解析其在精准内容理解、开放指令编辑、多语言支持、动态生成等方面的突破,探索AI如何从“看懂”世界到“描绘”世界,赋能艺术创作与智能设计。

文章图片
#人工智能
OpenAI重磅发布o3与o4-mini:AI智能体获“十八般武艺”,开启自主工具调用与视觉思考新纪元

人工智能领域再次迎来激动人心的时刻!OpenAI 近日正式官宣了其最新一代模型——o3和o4-mini。官方称其为“迄今为止最聪明、最强大”的模型,它们的发布显著提升了ChatGPT等应用的能力上限,预示着AI智能体的新时代正在加速到来。这次升级最引人瞩目的“杀手锏”,是模型首次实现了能够主动调用并智能组合ChatGPT内部几乎所有可用工具的能力。

文章图片
#人工智能
    共 103 条
  • 1
  • 2
  • 3
  • 11
  • 请选择