えいみや个人主页

@qq_50684356

えいみや

2024-05-30 16:04:09 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

前沿模型能力与管制冲突：Fable/Mythos 事件

2026 年 6 月，Anthropic 发布了 Claude Fable 5 和 Claude Mythos 5。如果只看发布稿，这像是一次很典型的前沿模型升级：能力更强，长任务更稳，软件工程、知识工作、视觉、科研都有提升。尤其是 Fable 5，被描述成 Anthropic 当时向普通用户开放过的最强模型。但这件事真正值得写，不是因为“又出了一个更强模型”。

前沿模型能力与管制冲突：Fable/Mythos 事件

Token 压缩器会成为每个 AI 应用的标配吗？

图片压缩；视频转码；CDN 缓存；数据库索引；日志采样；网关限流。用户不一定知道它们存在，但没有它们，系统就会又慢又贵。AI 应用也正在长出类似的基础设施。其中一个越来越重要的层，就是 token 压缩器。在内容进入大模型之前；先删除低价值 token；保留任务需要的信息；降低成本和延迟；尽量不损失回答质量。这听起来像一个小优化，但放到 RAG、Agent、AI Coding、MCP 工具生态里，

#人工智能 #数据库

上下文不是越长越好：AI Agent 正在进入“上下文压缩”时代

8K 上下文；32K 上下文；128K 上下文；200K 上下文；1M 上下文。很多人的第一反应是：太好了，以后不用做检索、不用做摘要、不用裁剪，直接把资料全塞进去。这是一种很自然但也很危险的想法。长上下文确实有价值。它让模型能阅读更长的文档、更多的代码、更完整的对话历史。但在真实系统里，长上下文不是免费的午餐。更高成本；更高延迟；更多噪音。尤其是 AI Agent。普通聊天最多是人问一句、模型答

#人工智能

上下文不是越长越好：AI Agent 正在进入“上下文压缩”时代

#人工智能

上下文不是越长越好：AI Agent 正在进入“上下文压缩”时代

#人工智能

上下文不是越长越好：AI Agent 正在进入“上下文压缩”时代

#人工智能

6 万 Star 的私有 AI 大脑：用 AnythingLLM 把你的资料变成可对话知识库

帮我写一段文案；解释一个概念；改一段代码；总结一篇文章。我们公司的退款政策是什么？这个产品手册里怎么配置 SSO？客户合同里有没有提到 SLA？上个月的销售复盘里说了哪些问题？这堆 PDF 能不能变成一个客服助手？这时候，通用大模型不够了。能读取你自己的资料；能基于资料回答；能保留来源；能给团队使用；最好不要一上来就搭一堆复杂组件。AnythingLLM 解决的就是这个问题。

#人工智能

4 万 Star 的开源 ChatGPT 桌面端：用 Jan 把电脑变成离线 AI 工作站

Ollama 很适合让你第一次把大模型跑在自己电脑里，Open WebUI 很适合把本地模型变成网页 AI 助手。我不想先学 Docker；我不想打开终端敲命令；我只想下载一个桌面应用；像打开 ChatGPT 一样打开它；模型尽量跑在我自己的电脑里。Jan 的价值就在这里。它的官方定位很直白：Jan 是一个开源的 ChatGPT 替代品，可以 100% 离线运行在你的电脑上。官网也强调可以运行本地

#开源 #人工智能

4 万 Star 的开源 ChatGPT 桌面端：用 Jan 把电脑变成离线 AI 工作站

#开源 #人工智能

共 39 条

请选择