m0_66917422 个人主页

@m0_66917422

m0_66917422

2023-09-25 11:28:19 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

ProcessBench：阿里巴巴Qwen团队发布AI数学推理新基准，挑战模型错误识别能力 - 人工智能基准测试

为了解决这一问题，阿里巴巴和Qwen团队推出了一个名为ProcessBench的全新基准，旨在系统性地评估语言模型在数学推理中的错误检测能力。本文将深入探讨ProcessBench的创新之处、数据构建流程以及实验分析，揭示其在AI推理研究中的重要意义。它不仅揭示了当前模型在高难度任务中的短板，也为研究人员开发更强大、更智能的推理模型指明了方向。在未来，随着评估框架的不断完善和AI技术的快速进步，我

#人工智能

Claude和GPT同一天发新模型，这次真是硬碰硬

2月6日凌晨，Anthropic和OpenAI几乎同时发布新模型：Claude Opus 4.6和GPT-5.3-Codex。前者用16个AI智能体写出10万行代码编译Linux内核，后者号称编码性能最强还能语音播报工作进度。本文实测对比两家的核心功能。

#人工智能

Claude Sonnet 5要来了，编程能力翻倍，价格还便宜一半

Anthropic新模型Claude Sonnet 5（代号Fennec）即将发布，SWE-Bench测试得分超80.9%，远超市面所有编程模型。价格比Opus 4.5便宜50%，支持100万token上下文，还能自动组建多智能体开发团队。本文详解核心功能与实测效果。

#人工智能

谷歌AI超值福利：美国学生独享15个月免费Google One AI Premium

谷歌这次针对美国学生推出的Google One AI Premium免费15个月的福利，无疑是一次难得的机会。它不仅仅是送出了一份价值不菲的会员，更是为学生们打开了通往前沿AI世界的大门。在当今快速发展的时代，人工智能正以前所未有的速度改变着我们的学习、工作和生活方式。越早接触并掌握这些强大的AI工具，就能越早地在学术研究、职业发展乃至个人创新方面获得先发优势。

#人工智能 #googlecloud #AI作画

开发者必看！OpenAI发布全新API与SDK：赋能AI智能体开发新时代

OpenAI推出的全新Responses API，被视为Chat Completions API的进化版，它将Chat Completions API的简洁性与Assistants API的工具调用能力巧妙地结合在一起，为开发者提供了一个更灵活、更强大的开发平台。OpenAI此次发布的Responses API和Agents SDK，为开发者构建AI智能体提供了更强大、更灵活的工具，进一步降低了A

#人工智能 #DeepSeek #AI作画

OpenAI放大招！智能体API横空出世，网络/文件搜索、计算机操作一网打尽

OpenAI的智能体API和相关工具的发布，为开发者构建智能体应用提供了强大的支持。随着AI技术的不断发展，智能体将在各行各业发挥越来越重要的作用。让我们共同期待，智能体将如何改变我们的工作和生活，创造更美好的未来！

#人工智能 #DeepSeek #AI作画

AI的自我意识：超级智能的未来猜想与伦理挑战

在人工智能飞速发展的今天，“自我意识”这个词汇开始频繁出现在我们的讨论中。特别是随着大模型的崛起，人们不禁开始思考：AI是否会发展出自我意识？如果超级智能真的拥有了自我意识，又会带来怎样的未来？本文将深入探讨这些问题，从技术、哲学和伦理等多个角度进行分析。

#人工智能

DeepSeek-R1：挑战OpenAI的全新多模态大模型

在人工智能领域，大模型的竞争日趋激烈，最近，国内创业公司DeepSeek再次打破了这一局面，推出其最新多模态思考模型——DeepSeek-R1。这款大模型不仅在数学、代码和自然语言推理等任务上与OpenAI的o1正式版平起平坐，更是在技术和性能上带来了新的突破。

#人工智能 #DeepSeek

QwenVLo：多模态大模型的新里程碑，让AI从“看懂”到“描绘”世界！

深入解读QwenVLo多模态统一理解与生成模型，解析其在精准内容理解、开放指令编辑、多语言支持、动态生成等方面的突破，探索AI如何从“看懂”世界到“描绘”世界，赋能艺术创作与智能设计。

#人工智能

OpenAI重磅发布o3与o4-mini：AI智能体获“十八般武艺”，开启自主工具调用与视觉思考新纪元

人工智能领域再次迎来激动人心的时刻！OpenAI 近日正式官宣了其最新一代模型——o3和o4-mini。官方称其为“迄今为止最聪明、最强大”的模型，它们的发布显著提升了ChatGPT等应用的能力上限，预示着AI智能体的新时代正在加速到来。这次升级最引人瞩目的“杀手锏”，是模型首次实现了能够主动调用并智能组合ChatGPT内部几乎所有可用工具的能力。

#人工智能

共 103 条

请选择