logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

调查研究-204 BERT vs GPT 区别(2026 详解):从 Encoder 读懂到 Decoder 续写,一次讲透两条大模型路线

本文系统对比 BERT 和 GPT 两条大模型技术路线,覆盖 Transformer 架构差异、训练目标差异(MLM vs NTP)、看文本方式差异(双向 vs 单向)、任务适配差异(理解 vs 生成)以及工程选型差异。BERT(Bidirectional Encoder Representations from Transformers)由 Google 于 2018 年发布,主打判别式语义理解

文章图片
#bert#人工智能#AI +1
调查研究-206 DeepSeek DSpark 深度解析:大模型推理加速,正在从“模型能力”转向“系统工程”

DSpark 是 DeepSeek 联合北京大学于 2026 年 6 月 27 日开源的 speculative decoding 推理加速框架,并作为 DeepSeek-V4-Flash preview 与 DeepSeek-V4-Pro preview 生产服务的默认加速方案,用以替换原有 MTP-1 baseline。同日开源的 DeepSpec(GitHub 仓库 deepseek-ai/

文章图片
#DeepSeek#性能优化#架构 +1
调查研究-207 Claude Sonnet 5 发布:Agent 能力下放后,模型路由要从“强弱分层“改成“执行分层“

Anthropic 于 2026 年 6 月 30 日发布 Claude Sonnet 5,将其定位为"迄今最具 Agent 能力的 Sonnet 模型"并设为 Claude 平台默认模型,面向 Free / Pro / Max / Team / Enterprise 全量用户开放,同步登陆 Amazon Bedrock 与 Google Vertex AI。Sonnet 5 在 SWE-benc

文章图片
#java#人工智能#深度学习
调查研究-208 OpenAI GPT-5.6 Sol / Terra / Luna 解读:AI 模型竞争正在从“更聪明“转向“能长期干活“

OpenAI 于 2026 年 6 月 26–27 日正式发布 GPT-5.6 系列预览,采用全新的命名规则:数字标识代际,Sol(太阳)/ Terra(地球)/ Luna(月亮)标识持久的能力档位。Sol 是旗舰,主攻复杂推理、长链路代码 Agent、网络安全和生物工作流,引入新的 max 推理强度和 Ultra 子 Agent 协同模式;Terra 性能与 GPT-5.5 相当,价格砍半,主打

文章图片
#人工智能#AI
调查研究-209 Apptronik Robot Park 深度解析:人形机器人竞争,开始拼“真实世界数据工厂“

本文围绕 2026 年 6 月 Apptronik 在德州奥斯汀开放的 Robot Park 与 Apollo 2 人形机器人平台展开。Robot Park 占地接近 9 万平方英尺,是一个用于持续采集真实世界任务数据的训练与生产设施,覆盖物流、制造、零售等场景;Apollo 2 同时提供双足与轮式两种形态,目的是在统一的上身、感知、任务系统下做跨形态任务抽象。Google DeepMind 与

文章图片
#人工智能#机器人#AI +1
调查研究-207 Claude Sonnet 5 发布:Agent 能力下放后,模型路由要从“强弱分层“改成“执行分层“

Anthropic 于 2026 年 6 月 30 日发布 Claude Sonnet 5,将其定位为"迄今最具 Agent 能力的 Sonnet 模型"并设为 Claude 平台默认模型,面向 Free / Pro / Max / Team / Enterprise 全量用户开放,同步登陆 Amazon Bedrock 与 Google Vertex AI。Sonnet 5 在 SWE-benc

文章图片
#java#人工智能#深度学习
调查研究-207 Claude Sonnet 5 发布:Agent 能力下放后,模型路由要从“强弱分层“改成“执行分层“

Anthropic 于 2026 年 6 月 30 日发布 Claude Sonnet 5,将其定位为"迄今最具 Agent 能力的 Sonnet 模型"并设为 Claude 平台默认模型,面向 Free / Pro / Max / Team / Enterprise 全量用户开放,同步登陆 Amazon Bedrock 与 Google Vertex AI。Sonnet 5 在 SWE-benc

文章图片
#java#人工智能#深度学习
调查研究-205 Unlimited-OCR 深度解析:OCR 正在从“逐页识别“走向“一次性长文档解析“

Unlimited-OCR 是百度 2026 年 6 月 22 日发布、6 月 25 日开源的长文档 OCR 端到端方案。它基于 DeepSeek-OCR(2025 年 10 月发布)的 DeepEncoder + MoE 解码器架构继续改造,在 decoder 中用 R-SWA(Reference Sliding Window Attention,参考滑动窗口注意力)替换标准 Multi-Hea

文章图片
#人工智能#百度
调查研究-205 Unlimited-OCR 深度解析:OCR 正在从“逐页识别“走向“一次性长文档解析“

Unlimited-OCR 是百度 2026 年 6 月 22 日发布、6 月 25 日开源的长文档 OCR 端到端方案。它基于 DeepSeek-OCR(2025 年 10 月发布)的 DeepEncoder + MoE 解码器架构继续改造,在 decoder 中用 R-SWA(Reference Sliding Window Attention,参考滑动窗口注意力)替换标准 Multi-Hea

文章图片
#人工智能#百度
调查研究-202 SGLang 深度解析:为什么大模型推理框架不只是“把模型跑起来“

SGLang(Structured Generation Language)是伯克利 LMSYS 团队推出的高性能大模型推理框架,最新稳定版 v0.5.6(2026),2026/06 推出新一代投机解码 DFlash 与 Spec V2,2026/04 实现 DeepSeek-V4 Day 0 支持,2026/02 在 NVIDIA GB300 NVL72 上达成 25x 推理性能。与 vLLM

文章图片
#sglang#人工智能#深度学习 +2
    共 71 条
  • 1
  • 2
  • 3
  • 8
  • 请选择