
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文系统对比 BERT 和 GPT 两条大模型技术路线,覆盖 Transformer 架构差异、训练目标差异(MLM vs NTP)、看文本方式差异(双向 vs 单向)、任务适配差异(理解 vs 生成)以及工程选型差异。BERT(Bidirectional Encoder Representations from Transformers)由 Google 于 2018 年发布,主打判别式语义理解

DSpark 是 DeepSeek 联合北京大学于 2026 年 6 月 27 日开源的 speculative decoding 推理加速框架,并作为 DeepSeek-V4-Flash preview 与 DeepSeek-V4-Pro preview 生产服务的默认加速方案,用以替换原有 MTP-1 baseline。同日开源的 DeepSpec(GitHub 仓库 deepseek-ai/

Anthropic 于 2026 年 6 月 30 日发布 Claude Sonnet 5,将其定位为"迄今最具 Agent 能力的 Sonnet 模型"并设为 Claude 平台默认模型,面向 Free / Pro / Max / Team / Enterprise 全量用户开放,同步登陆 Amazon Bedrock 与 Google Vertex AI。Sonnet 5 在 SWE-benc

OpenAI 于 2026 年 6 月 26–27 日正式发布 GPT-5.6 系列预览,采用全新的命名规则:数字标识代际,Sol(太阳)/ Terra(地球)/ Luna(月亮)标识持久的能力档位。Sol 是旗舰,主攻复杂推理、长链路代码 Agent、网络安全和生物工作流,引入新的 max 推理强度和 Ultra 子 Agent 协同模式;Terra 性能与 GPT-5.5 相当,价格砍半,主打

本文围绕 2026 年 6 月 Apptronik 在德州奥斯汀开放的 Robot Park 与 Apollo 2 人形机器人平台展开。Robot Park 占地接近 9 万平方英尺,是一个用于持续采集真实世界任务数据的训练与生产设施,覆盖物流、制造、零售等场景;Apollo 2 同时提供双足与轮式两种形态,目的是在统一的上身、感知、任务系统下做跨形态任务抽象。Google DeepMind 与

Anthropic 于 2026 年 6 月 30 日发布 Claude Sonnet 5,将其定位为"迄今最具 Agent 能力的 Sonnet 模型"并设为 Claude 平台默认模型,面向 Free / Pro / Max / Team / Enterprise 全量用户开放,同步登陆 Amazon Bedrock 与 Google Vertex AI。Sonnet 5 在 SWE-benc

Anthropic 于 2026 年 6 月 30 日发布 Claude Sonnet 5,将其定位为"迄今最具 Agent 能力的 Sonnet 模型"并设为 Claude 平台默认模型,面向 Free / Pro / Max / Team / Enterprise 全量用户开放,同步登陆 Amazon Bedrock 与 Google Vertex AI。Sonnet 5 在 SWE-benc

Unlimited-OCR 是百度 2026 年 6 月 22 日发布、6 月 25 日开源的长文档 OCR 端到端方案。它基于 DeepSeek-OCR(2025 年 10 月发布)的 DeepEncoder + MoE 解码器架构继续改造,在 decoder 中用 R-SWA(Reference Sliding Window Attention,参考滑动窗口注意力)替换标准 Multi-Hea

Unlimited-OCR 是百度 2026 年 6 月 22 日发布、6 月 25 日开源的长文档 OCR 端到端方案。它基于 DeepSeek-OCR(2025 年 10 月发布)的 DeepEncoder + MoE 解码器架构继续改造,在 decoder 中用 R-SWA(Reference Sliding Window Attention,参考滑动窗口注意力)替换标准 Multi-Hea

SGLang(Structured Generation Language)是伯克利 LMSYS 团队推出的高性能大模型推理框架,最新稳定版 v0.5.6(2026),2026/06 推出新一代投机解码 DFlash 与 Spec V2,2026/04 实现 DeepSeek-V4 Day 0 支持,2026/02 在 NVIDIA GB300 NVL72 上达成 25x 推理性能。与 vLLM









