
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
400 万个 tokens。Claude Sonnet 4.6,$3 输入 / $15 输出,保守估算下来将近 $26。不是说它贵,是突然意识到:这只是一周的编码量。如果是个认真用 AI 工具的工程师,每个月的消费可能超过一台云服务器。然后 2026 年 4 月 24 日,DeepSeek 发布了 V4,并在三天后(今天,4 月 27 日)宣布 V4-Pro 限时降价 75%。我把 Claude
400 万个 tokens。Claude Sonnet 4.6,$3 输入 / $15 输出,保守估算下来将近 $26。不是说它贵,是突然意识到:这只是一周的编码量。如果是个认真用 AI 工具的工程师,每个月的消费可能超过一台云服务器。然后 2026 年 4 月 24 日,DeepSeek 发布了 V4,并在三天后(今天,4 月 27 日)宣布 V4-Pro 限时降价 75%。我把 Claude
400 万个 tokens。Claude Sonnet 4.6,$3 输入 / $15 输出,保守估算下来将近 $26。不是说它贵,是突然意识到:这只是一周的编码量。如果是个认真用 AI 工具的工程师,每个月的消费可能超过一台云服务器。然后 2026 年 4 月 24 日,DeepSeek 发布了 V4,并在三天后(今天,4 月 27 日)宣布 V4-Pro 限时降价 75%。我把 Claude
可以看到Microsoft Agent Framework (MAF) 是一个强大的框架,用于创建基于大语言模型的智能代理。通过本笔记,方便后续的知识回顾。可以通过MAF看到,微软在AI领域的持续跟进,让我们在AI智能体领域有了更多的选择,当然如果已经有了LangChain的相关基础,那么这个上手起来会更快。后续会进一步对比Tools以及Skills等方法的实现。
云原生技术与AI基础设施深度融合,大模型在 Kubernetes 上的生产级部署成为行业当前核心课题。在千亿参数模型普及的今天,单机显存已无法承载,TP(张量并行)与 PP(流水线并行)成为标配。然而,这种分布式范式的转变,使得习惯于处理无状态微服务的 Kubernetes 原生工作负载抽象(如 Deployment/Service)显得力不从心。







