logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

为什么 Claude + OpenCode 完全没有缓存、费用暴增?

摘要: OpenCode 接入 Claude 后费用暴增的核心原因是缓存失效,而非模型本身变贵。与 OpenAI 自动缓存不同,Claude 需通过 cache_control 显式启用缓存,而 OpenCode 的提示词组织方式、OpenAI 兼容网关的协议转换可能导致缓存标记丢失。此外,动态内容污染前缀也会破坏缓存命中率。解决方案包括:确认工具支持 Claude 缓存、优先使用原生协议、分离稳

文章图片
#缓存#spring#java
Gemini 3.5 Flash 发布公告 越级、提速,Google 正式转向智能体竞争

Google推出多模态AI模型Gemini 3.5 Flash,具备100万token上下文窗口和64K输出上限,支持文本、图像、音频、视频输入。该模型在智能体编程、真实世界任务和多模态理解方面超越前代Pro版本,速度达每秒290个token,成本仅为竞争产品的三分之一。虽然Flash在多数任务上表现优异,但在极限推理和长上下文任务中仍略逊于Pro版本。同时,Google还发布了视频生成模型Gem

文章图片
#人工智能#microsoft#前端
Gemini 3.5 Flash 发布公告 越级、提速,Google 正式转向智能体竞争

Google推出多模态AI模型Gemini 3.5 Flash,具备100万token上下文窗口和64K输出上限,支持文本、图像、音频、视频输入。该模型在智能体编程、真实世界任务和多模态理解方面超越前代Pro版本,速度达每秒290个token,成本仅为竞争产品的三分之一。虽然Flash在多数任务上表现优异,但在极限推理和长上下文任务中仍略逊于Pro版本。同时,Google还发布了视频生成模型Gem

文章图片
#人工智能#microsoft#前端
Gemini 3.5 Flash 发布公告 越级、提速,Google 正式转向智能体竞争

Google推出多模态AI模型Gemini 3.5 Flash,具备100万token上下文窗口和64K输出上限,支持文本、图像、音频、视频输入。该模型在智能体编程、真实世界任务和多模态理解方面超越前代Pro版本,速度达每秒290个token,成本仅为竞争产品的三分之一。虽然Flash在多数任务上表现优异,但在极限推理和长上下文任务中仍略逊于Pro版本。同时,Google还发布了视频生成模型Gem

文章图片
#人工智能#microsoft#前端
Gemini 3.5 Flash 发布公告 越级、提速,Google 正式转向智能体竞争

Google推出多模态AI模型Gemini 3.5 Flash,具备100万token上下文窗口和64K输出上限,支持文本、图像、音频、视频输入。该模型在智能体编程、真实世界任务和多模态理解方面超越前代Pro版本,速度达每秒290个token,成本仅为竞争产品的三分之一。虽然Flash在多数任务上表现优异,但在极限推理和长上下文任务中仍略逊于Pro版本。同时,Google还发布了视频生成模型Gem

文章图片
#人工智能#microsoft#前端
为什么 Claude + OpenCode 完全没有缓存、费用暴增?

摘要: OpenCode 接入 Claude 后费用暴增的核心原因是缓存失效,而非模型本身变贵。与 OpenAI 自动缓存不同,Claude 需通过 cache_control 显式启用缓存,而 OpenCode 的提示词组织方式、OpenAI 兼容网关的协议转换可能导致缓存标记丢失。此外,动态内容污染前缀也会破坏缓存命中率。解决方案包括:确认工具支持 Claude 缓存、优先使用原生协议、分离稳

文章图片
#缓存#spring#java
为什么 Claude + OpenCode 完全没有缓存、费用暴增?

摘要: OpenCode 接入 Claude 后费用暴增的核心原因是缓存失效,而非模型本身变贵。与 OpenAI 自动缓存不同,Claude 需通过 cache_control 显式启用缓存,而 OpenCode 的提示词组织方式、OpenAI 兼容网关的协议转换可能导致缓存标记丢失。此外,动态内容污染前缀也会破坏缓存命中率。解决方案包括:确认工具支持 Claude 缓存、优先使用原生协议、分离稳

文章图片
#缓存#spring#java
Claude Opus 4.7:版本号只涨0.1,但真实提升在哪

Opus4.7版本在性能上有所提升,主要改进包括:软件工程能力(SWE-bench得分提升6.8%)、视觉推理能力(XBOW测试从54.5%跃升至98.5%)和多学科推理能力。新版本采用新tokenizer,输入token数增加1.0-1.35倍,但价格不变。新增xhigh档位和/ultrareview命令,优化了成本控制和代码审查。虽然部分测试如AgenticSearch得分略有下降,但整体性能

文章图片
#人工智能
OpenAI超级视频模型Sora登上央视,LeCun强推的「世界模型」雏形相继诞生,AGI如何能够以人类的理解方式看世界?

去年初,Meta 首席 AI 科学家 Yann LeCun 针对「如何才能打造出接近人类水平的 AI」提出了全新的思路。他勾勒出了构建人类水平 AI 的另一种愿景,指出学习世界模型(即世界如何运作的内部模型)的能力或许是关键。这种学到世界运作方式内部模型的机器可以更快地学习、规划完成复杂的任务,并轻松适应不熟悉的情况。LeCun 根据动物的大脑运行机制,提出了一个端到端的仿生架构。

文章图片
OpenAI o3-pro 震撼上线,比 o3 强在哪?

OpenAI 长期以来一直是人工智能领域的领军者,持续推动机器学习模型的能力进阶。其最新推出的 o3-pro 模型,标志着这一探索之旅中的又一个重要里程碑。o3-pro 于 2025 年初发布,以卓越的性能和适应性脱颖而出,成为 AI 领域的颠覆者。本文将深入探讨 OpenAI o3-pro 的基准测试表现、定价策略及 API 定价,详细解析这款模型为何能成为极具突破性的创新成果。

文章图片
    共 175 条
  • 1
  • 2
  • 3
  • 18
  • 请选择