中科创新烁智个人主页

@qq_36396104

中科创新烁智

2022-12-23 14:41:54 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

为什么 Claude + OpenCode 完全没有缓存、费用暴增？

摘要： OpenCode 接入 Claude 后费用暴增的核心原因是缓存失效，而非模型本身变贵。与 OpenAI 自动缓存不同，Claude 需通过 cache_control 显式启用缓存，而 OpenCode 的提示词组织方式、OpenAI 兼容网关的协议转换可能导致缓存标记丢失。此外，动态内容污染前缀也会破坏缓存命中率。解决方案包括：确认工具支持 Claude 缓存、优先使用原生协议、分离稳

#缓存 #spring #java

Gemini 3.5 Flash 发布公告越级、提速，Google 正式转向智能体竞争

Google推出多模态AI模型Gemini 3.5 Flash，具备100万token上下文窗口和64K输出上限，支持文本、图像、音频、视频输入。该模型在智能体编程、真实世界任务和多模态理解方面超越前代Pro版本，速度达每秒290个token，成本仅为竞争产品的三分之一。虽然Flash在多数任务上表现优异，但在极限推理和长上下文任务中仍略逊于Pro版本。同时，Google还发布了视频生成模型Gem

#人工智能 #microsoft #前端

Gemini 3.5 Flash 发布公告越级、提速，Google 正式转向智能体竞争

#人工智能 #microsoft #前端

Gemini 3.5 Flash 发布公告越级、提速，Google 正式转向智能体竞争

#人工智能 #microsoft #前端

Gemini 3.5 Flash 发布公告越级、提速，Google 正式转向智能体竞争

#人工智能 #microsoft #前端

为什么 Claude + OpenCode 完全没有缓存、费用暴增？

#缓存 #spring #java

为什么 Claude + OpenCode 完全没有缓存、费用暴增？

#缓存 #spring #java

Claude Opus 4.7：版本号只涨0.1，但真实提升在哪

Opus4.7版本在性能上有所提升，主要改进包括：软件工程能力（SWE-bench得分提升6.8%）、视觉推理能力（XBOW测试从54.5%跃升至98.5%）和多学科推理能力。新版本采用新tokenizer，输入token数增加1.0-1.35倍，但价格不变。新增xhigh档位和/ultrareview命令，优化了成本控制和代码审查。虽然部分测试如AgenticSearch得分略有下降，但整体性能

#人工智能

OpenAI超级视频模型Sora登上央视，LeCun强推的「世界模型」雏形相继诞生，AGI如何能够以人类的理解方式看世界？

去年初，Meta 首席 AI 科学家 Yann LeCun 针对「如何才能打造出接近人类水平的 AI」提出了全新的思路。他勾勒出了构建人类水平 AI 的另一种愿景，指出学习世界模型（即世界如何运作的内部模型）的能力或许是关键。这种学到世界运作方式内部模型的机器可以更快地学习、规划完成复杂的任务，并轻松适应不熟悉的情况。LeCun 根据动物的大脑运行机制，提出了一个端到端的仿生架构。

OpenAI o3-pro 震撼上线，比 o3 强在哪？

OpenAI 长期以来一直是人工智能领域的领军者，持续推动机器学习模型的能力进阶。其最新推出的 o3-pro 模型，标志着这一探索之旅中的又一个重要里程碑。o3-pro 于 2025 年初发布，以卓越的性能和适应性脱颖而出，成为 AI 领域的颠覆者。本文将深入探讨 OpenAI o3-pro 的基准测试表现、定价策略及 API 定价，详细解析这款模型为何能成为极具突破性的创新成果。

共 175 条

请选择