logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI Agent 成本失控怎么办?从 Kimi K2.6 看 Token 计费为何不再适用

按 token 思维是 2023 年的习惯。工作负载已经向前发展了,预算模型也需要随之发展。为边界做预算,追踪那四个数字,你的智能体就会从成本风险变为一个效能倍增器。将这个框架投入实践的最快方式,就是把它指向一个值得为此运行的模型。Kimi K2.6 现在已经在 DigitalOcean 无服务器推理上线——前沿智能,OpenAI 兼容端点,你这边无需任何运维,与你的 DigitalOcean 技

文章图片
#人工智能#开源
DigitalOcean 收购 Katanemo Labs:迎接 Agent 时代,重塑基础设施

DigitalOcean 正在全力构建全球领先的​​。我们的使命很清晰:为 AI 原生企业提供一个坚实底座,让它们能在生产环境中大规模运行推理任务。今天,我们正式宣布收购 AI Agent 基础设施领域的领先公司。通过这次整合,我们将平台能力进一步下沉到 Agent 系统最关键的运行层。Katanemo Labs 的技术与 DigitalOcean 一贯坚持的理念——运维简单、成本可控、性能可扩展

#人工智能
AI Agent 成本失控怎么办?从 Kimi K2.6 看 Token 计费为何不再适用

按 token 思维是 2023 年的习惯。工作负载已经向前发展了,预算模型也需要随之发展。为边界做预算,追踪那四个数字,你的智能体就会从成本风险变为一个效能倍增器。将这个框架投入实践的最快方式,就是把它指向一个值得为此运行的模型。Kimi K2.6 现在已经在 DigitalOcean 无服务器推理上线——前沿智能,OpenAI 兼容端点,你这边无需任何运维,与你的 DigitalOcean 技

文章图片
#人工智能#开源
Claude Opus 4.6 上线 DigitalOcean:百万上下文,一键调用

2025 年,DigitalOcean 云平台上线了 Serverless Inference。DigitalOcean Serverless Inference 是一种托管式的大模型推理服务。你不需要创建 GPU 实例、不用部署模型、不用关心扩缩容,只要通过 API 调用模型,DigitalOcean 就会在后台自动完成推理资源的调度与运行。

#人工智能#大数据#AIGC
DigitalOcean Gradient AI 推理云平台原生集成 LlamaIndex

DigitalOcean Gradient™ AI 平台现已原生集成 LlamaIndex——这是构建 RAG(检索增强生成)应用最流行的框架之一。这意味着你现在可以直接将 Gradient AI 平台的知识库和 LLM(大语言模型)连接到 LlamaIndex 工作流中,使用你已经熟悉的抽象接口。无需额外的基础设施,无需复杂的设置。只需安装两个包,即可开始构建。

#人工智能#云服务#AIGC
构建企业级 AI 系统,只调用 DeepSeek、MiniMax、Kimi 之类的 API 够吗?

如果 AI 只是一个功能,简单调用 API 完全合理。但如果 AI 是未来的核心产品能力,那么你们需要的就不仅是模型能力,而是系统工程能力。DigitalOcean Gradient 的本质,是在模型之上提供系统抽象层。当 AI 只是一个按钮,它是功能。当 AI 具备统一模型管理、知识库体系、可观测性与评估能力,它才会成为真正的系统资产。真正的门槛,从来不在模型本身,而在系统工程。如果你希望进一步

#人工智能#运维#AIGC
微调后的 LLM 如何部署到生产环境?从GPU 推理端点的搭建、测试与上线全流程

Serverless 推理是一种完全免去了开发者自行租赁、运维底层物理 GPU 复杂度的先进全托管 AI 调度范式。您只需将写好的业务请求直接投递给云平台已经为您架设好的共享基础底座大模型端点,整个计费模型完全跟您的最终业务表现挂钩(在 DigitalOcean 平台上通常精准细化到按您每次调用产生的 Token 数量进行计量),您不需要为任何闲置的纯硬件时间多掏一分钱冤枉钱。

#开源#人工智能
Claude Opus 4.6 上线 DigitalOcean:百万上下文,一键调用

2025 年,DigitalOcean 云平台上线了 Serverless Inference。DigitalOcean Serverless Inference 是一种托管式的大模型推理服务。你不需要创建 GPU 实例、不用部署模型、不用关心扩缩容,只要通过 API 调用模型,DigitalOcean 就会在后台自动完成推理资源的调度与运行。

#人工智能#大数据#AIGC
构建企业级 AI 系统,只调用 DeepSeek、MiniMax、Kimi 之类的 API 够吗?

如果 AI 只是一个功能,简单调用 API 完全合理。但如果 AI 是未来的核心产品能力,那么你们需要的就不仅是模型能力,而是系统工程能力。DigitalOcean Gradient 的本质,是在模型之上提供系统抽象层。当 AI 只是一个按钮,它是功能。当 AI 具备统一模型管理、知识库体系、可观测性与评估能力,它才会成为真正的系统资产。真正的门槛,从来不在模型本身,而在系统工程。如果你希望进一步

#人工智能#运维#AIGC
NVIDIA B300 vs H200:GPU 参数、性能与 DeepSeek 推理能力解析

GPU显存带宽推理性能适合场景H10080GB3.35TB/s基准中型 LLMH200141GB4.8TB/s2-3x长上下文B300288GB8TB/s8-20x推理模型NVIDIA B300(Blackwell Ultra)的推出,标志着 AI 基础设施进入了一个新的性能时代。凭借​288GB HBM3e 显存​、8 TB/s 带宽和​14 petaFLOPS 算力​,B300 为大模型推理提

#大数据#网络#运维 +3
    共 150 条
  • 1
  • 2
  • 3
  • 15
  • 请选择