logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek架构新探索!开源OCR 2诞生!

数据层面,DeepSeek-OCR 2沿用与前代一致的数据源(含OCR 1.0、OCR 2.0及通用视觉数据),其中OCR数据占混合训练数据的80%,并新增两项优化:一是对OCR 1.0数据采用均衡采样策略,按正文、公式、表格3:1:1的比例划分页面;值得关注的是,新发布的DeepSeek-OCR 2通过。值得注意的是,在阅读顺序(R-order)指标上,DeepSeek-OCR 2在所有文档类别

文章图片
#架构
Claude Opus 4.6 加冕编程王者,强势入局 Office 全系列!

Claude Opus 4.6 在海量文档的相关信息检索上表现更优,该能力亦延伸至长上下文任务中,可在数十万 Token 范围内稳定保存并追踪信息,上下文漂移现象显著减少,还能捕捉到此前 Opus 4.5 未能识别的深层细节。此外,Claude Opus 4.6 为首款支持 100 万 Token 上下文的 Opus 级模型,针对超过 200k Token 的提示词,将按高级费率计费,即输入与输出

文章图片
#人工智能
重磅!Gemini 3.1 Pro 发布!

Google DeepMind低调推出Gemini 3.1 Pro预览版,该模型在推理能力上实现重大突破,ARC-AGI-2基准得分达77.1%,较前代提升两倍多。新版本支持百万级tokens上下文、多模态输入,并能直接生成网页动画SVG。AI工程师盛赞其解决了前代工具调用弱、幻觉多的问题,在终端工具调用和抽象推理方面达到SOTA水平,性价比远超竞品。实际案例显示,该模型可完美处理复杂三角学运算和

文章图片
#人工智能
Anthropic发布Claude Sonnet 4.6:中端模型性能跃升,引发行业效率革命

2026年2月,Anthropic公司发布Claude Sonnet 4.6模型,引发行业震动。该模型在计算机操作、长文本推理等六大领域实现重大突破,OSWorld测试成绩达72.5%,能像人类一样操作办公软件。在多项基准测试中,其表现超越Gemini 3Pro和GPT-5.2,部分能力甚至超过自家旗舰Opus 4.6。新模型支持百万级上下文窗口,显著提升开发效率,导致多家传统软件公司股价应声下跌

文章图片
#人工智能
GPT-5.4深夜发布,正中Claude要害!

OpenAI发布GPT-5.4,专为专业工作负载打造,在编程、知识工作和计算机操作方面表现突出。该模型具备1MToken长上下文支持,原生计算机操作能力,在GDPval测试中83%案例优于前代。新增工具搜索功能降低47%Token消耗,联网搜索能力提升17%。GPT-5.4Pro版本针对复杂任务提供极致性能,在BrowseComp基准达89.3%新高。CEO奥特曼称赞其个性化和专业能力提升,标志着

文章图片
#人工智能
重磅!Gemini 3.1 Pro 发布!

Google DeepMind低调推出Gemini 3.1 Pro预览版,该模型在推理能力上实现重大突破,ARC-AGI-2基准得分达77.1%,较前代提升两倍多。新版本支持百万级tokens上下文、多模态输入,并能直接生成网页动画SVG。AI工程师盛赞其解决了前代工具调用弱、幻觉多的问题,在终端工具调用和抽象推理方面达到SOTA水平,性价比远超竞品。实际案例显示,该模型可完美处理复杂三角学运算和

文章图片
#人工智能
GPT-5.4深夜发布,正中Claude要害!

OpenAI发布GPT-5.4,专为专业工作负载打造,在编程、知识工作和计算机操作方面表现突出。该模型具备1MToken长上下文支持,原生计算机操作能力,在GDPval测试中83%案例优于前代。新增工具搜索功能降低47%Token消耗,联网搜索能力提升17%。GPT-5.4Pro版本针对复杂任务提供极致性能,在BrowseComp基准达89.3%新高。CEO奥特曼称赞其个性化和专业能力提升,标志着

文章图片
#人工智能
打破 Agent 推理“存储墙”:清北与DeepSeek 联手发布大模型新推理架构

这篇由清华大学、北京大学与 DeepSeek(深度求索)联合发表的论文,并没有直接谈模型参数,而是切中了当前大模型落地的“七寸”:智能体(Agent)推理的存储带宽瓶颈。简单来说,当 LLM 变成 Agent,推理的逻辑变了,硬件的压力点也变了,这就需要有新的推理架构来应对新的挑战。DualPath 就是为了解决这些挑战而生的。

文章图片
#架构
硅谷凌晨激战:GPT-5.3-Codex硬刚Claude 4.6

AI巨头深夜对决:OpenAI与Anthropic的技术路线之争 2月6日凌晨,AI领域爆发了一场闪电战:Anthropic发布ClaudeOpus4.6半小时后,OpenAI立即推出GPT-5.3-Codex。两大模型展现了截然不同的技术路线:Anthropic追求安全可控的"专家型AI",强调长文本处理;而OpenAI则打造全能"行动派",实现从需求分析

文章图片
Claude Code 编程宝典!第 2 期:深度实战——打造你的 AI 高级架构师

本期深入探讨如何优化ClaudeCode使用体验:通过CLAUDE.md文件定制编码规范,确保AI生成的代码符合项目要求;介绍MCP扩展功能,连接数据库、GitHub等外部服务;分享高效命令行操作技巧,如自动提交代码和大批量重构。这些方法能显著提升开发效率,让AI更好地融入实际工作流程。

文章图片
#人工智能#架构
    共 182 条
  • 1
  • 2
  • 3
  • 19
  • 请选择