
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
数据层面,DeepSeek-OCR 2沿用与前代一致的数据源(含OCR 1.0、OCR 2.0及通用视觉数据),其中OCR数据占混合训练数据的80%,并新增两项优化:一是对OCR 1.0数据采用均衡采样策略,按正文、公式、表格3:1:1的比例划分页面;值得关注的是,新发布的DeepSeek-OCR 2通过。值得注意的是,在阅读顺序(R-order)指标上,DeepSeek-OCR 2在所有文档类别

Claude Opus 4.6 在海量文档的相关信息检索上表现更优,该能力亦延伸至长上下文任务中,可在数十万 Token 范围内稳定保存并追踪信息,上下文漂移现象显著减少,还能捕捉到此前 Opus 4.5 未能识别的深层细节。此外,Claude Opus 4.6 为首款支持 100 万 Token 上下文的 Opus 级模型,针对超过 200k Token 的提示词,将按高级费率计费,即输入与输出

Google DeepMind低调推出Gemini 3.1 Pro预览版,该模型在推理能力上实现重大突破,ARC-AGI-2基准得分达77.1%,较前代提升两倍多。新版本支持百万级tokens上下文、多模态输入,并能直接生成网页动画SVG。AI工程师盛赞其解决了前代工具调用弱、幻觉多的问题,在终端工具调用和抽象推理方面达到SOTA水平,性价比远超竞品。实际案例显示,该模型可完美处理复杂三角学运算和

2026年2月,Anthropic公司发布Claude Sonnet 4.6模型,引发行业震动。该模型在计算机操作、长文本推理等六大领域实现重大突破,OSWorld测试成绩达72.5%,能像人类一样操作办公软件。在多项基准测试中,其表现超越Gemini 3Pro和GPT-5.2,部分能力甚至超过自家旗舰Opus 4.6。新模型支持百万级上下文窗口,显著提升开发效率,导致多家传统软件公司股价应声下跌

OpenAI发布GPT-5.4,专为专业工作负载打造,在编程、知识工作和计算机操作方面表现突出。该模型具备1MToken长上下文支持,原生计算机操作能力,在GDPval测试中83%案例优于前代。新增工具搜索功能降低47%Token消耗,联网搜索能力提升17%。GPT-5.4Pro版本针对复杂任务提供极致性能,在BrowseComp基准达89.3%新高。CEO奥特曼称赞其个性化和专业能力提升,标志着

Google DeepMind低调推出Gemini 3.1 Pro预览版,该模型在推理能力上实现重大突破,ARC-AGI-2基准得分达77.1%,较前代提升两倍多。新版本支持百万级tokens上下文、多模态输入,并能直接生成网页动画SVG。AI工程师盛赞其解决了前代工具调用弱、幻觉多的问题,在终端工具调用和抽象推理方面达到SOTA水平,性价比远超竞品。实际案例显示,该模型可完美处理复杂三角学运算和

OpenAI发布GPT-5.4,专为专业工作负载打造,在编程、知识工作和计算机操作方面表现突出。该模型具备1MToken长上下文支持,原生计算机操作能力,在GDPval测试中83%案例优于前代。新增工具搜索功能降低47%Token消耗,联网搜索能力提升17%。GPT-5.4Pro版本针对复杂任务提供极致性能,在BrowseComp基准达89.3%新高。CEO奥特曼称赞其个性化和专业能力提升,标志着

这篇由清华大学、北京大学与 DeepSeek(深度求索)联合发表的论文,并没有直接谈模型参数,而是切中了当前大模型落地的“七寸”:智能体(Agent)推理的存储带宽瓶颈。简单来说,当 LLM 变成 Agent,推理的逻辑变了,硬件的压力点也变了,这就需要有新的推理架构来应对新的挑战。DualPath 就是为了解决这些挑战而生的。

AI巨头深夜对决:OpenAI与Anthropic的技术路线之争 2月6日凌晨,AI领域爆发了一场闪电战:Anthropic发布ClaudeOpus4.6半小时后,OpenAI立即推出GPT-5.3-Codex。两大模型展现了截然不同的技术路线:Anthropic追求安全可控的"专家型AI",强调长文本处理;而OpenAI则打造全能"行动派",实现从需求分析

本期深入探讨如何优化ClaudeCode使用体验:通过CLAUDE.md文件定制编码规范,确保AI生成的代码符合项目要求;介绍MCP扩展功能,连接数据库、GitHub等外部服务;分享高效命令行操作技巧,如自动提交代码和大批量重构。这些方法能显著提升开发效率,让AI更好地融入实际工作流程。









