logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GPU对比:MI350X、MI325X、MI300X、H200、H100

过去几年间,以大型语言模型(LLM)和生成式 AI 为代表的新浪潮席卷全球,对算力基础设施提出了前所未有的严苛挑战。从 GPT-4 到 Llama 3.1,参数量级的飞跃不仅意味着计算复杂度的几何级数增长,更直接推动了对高性能 GPU 的需求井喷。然而,对于大多数创新型企业而言,自建集群面临的高昂成本与运维压力,使得像这类按需付费、灵活扩展的 GPU 云服务成为了解决算力瓶颈的关键。目前,Digi

#人工智能#云服务#AIGC
DigitalOcean Gradient AI 推理云平台原生集成 LlamaIndex

DigitalOcean Gradient™ AI 平台现已原生集成 LlamaIndex——这是构建 RAG(检索增强生成)应用最流行的框架之一。这意味着你现在可以直接将 Gradient AI 平台的知识库和 LLM(大语言模型)连接到 LlamaIndex 工作流中,使用你已经熟悉的抽象接口。无需额外的基础设施,无需复杂的设置。只需安装两个包,即可开始构建。

#人工智能#云服务#AIGC
如何在云端运行Kimi K2.5:从配置到部署全攻略

串行崩塌是指编排智能体尽管有并行能力可用,却默认选择单智能体执行——本质上是选择阻力最小的路径。PARL 奖励包括一个实例化奖励(rparallel),明确鼓励在训练早期生成子智能体。然后这个辅助奖励逐渐衰减为零,使模型最终纯粹优化任务成功,而不是为并行化本身进行优化。虚假并行是一种"奖励黑客"行为,编排智能体生成大量子智能体而没有有意义的任务分解,只是为了夸大并行化指标。rfinish 奖励,激

#人工智能#大数据#AIGC
构建企业级 AI 系统,只调用 DeepSeek、MiniMax、Kimi 之类的 API 够吗?

如果 AI 只是一个功能,简单调用 API 完全合理。但如果 AI 是未来的核心产品能力,那么你们需要的就不仅是模型能力,而是系统工程能力。DigitalOcean Gradient 的本质,是在模型之上提供系统抽象层。当 AI 只是一个按钮,它是功能。当 AI 具备统一模型管理、知识库体系、可观测性与评估能力,它才会成为真正的系统资产。真正的门槛,从来不在模型本身,而在系统工程。如果你希望进一步

#人工智能#运维#AIGC
使用 DigitalOcean 实现 Claude Code “低配订阅 + 外部 Token”

在不修改任何业务代码的前提下,引入claudo在体验无感的同时,实现了链路的可控。虽然从表面上看,你的调用方式和交互体验没有变化,且 DigitalOcean 针对的阶梯定价与 Anthropic 官方完全持平,但在长期的团队协作中,这种“工程化路径”会逐渐显现出其不可替代的稳定性与财务透明度。当大模型能力日趋同质化时,未来的技术壁垒不再仅仅取决于“用了什么模型”,而在于“如何更稳、更省、更专业地

#人工智能#AIGC
如何使用DigitalOcean Gradient 平台上的无服务器推理

对于寻求基于大语言模型的解决方案,但又不想费心聘请人员或学习部署自己服务器所需步骤的公司来说,无服务器推理是一个真正的答案。借助 DigitalOcean 的 Gradient Platform,从强大的 NVIDIA GPU 访问无服务器推理变得比以往任何时候都更容易!我们鼓励大家尝试这个新的解决方案!查看我们提供的计算、存储、网络和托管数据库产品,或新注册的用户希望使用 DigitalOcea

#人工智能#AIGC
教程:让OpenClaw一次接入Claude、Qwen、DeepSeek 多个模型

本文将介绍,如何在本地安装的Openclaw中,使用DigitalOcean GradientAI 的Key配置大模型。可用的大模型包括:Claude opus、Claude Sonnet、gtp-oss、Kimi、DeepSeek、Qwen、MiniMax,以及 NVIDIA Dynamo 1.0等数十种大模型。本文中介绍的API 接入方法,对云端部署的Openclaw同样适用。

#人工智能#AIGC
DigitalOcean VPC 网络故障排查 Runbook 实战指南

网络故障排查 runbook 是针对特定症状的一系列诊断步骤的文档化记录,包括命令、预期输出、解读规则以及升级路径。它能标准化事件响应,确保无论哪位团队成员响应,都能获得一致的诊断证据。

文章图片
#人工智能#AIGC
AI 推理引擎四大模式:无服务推理、专用推理、批量推理与智能路由,怎么选?

这篇 DigitalOcean 推理模式对比指南,解释了如何根据延迟、成本和规模需求选择合适的模型服务方式。DigitalOcean 推理引擎是 DigitalOcean 云平台内的 AI 推理层。它让你可以在一个地方运行大语言模型,从快速实验到生产级应用,服务成千上万的用户——无需管理 GPU 集群、推理服务器或复杂的编排层。模式一句话总结发请求、按 token 付费、重复调用创建一个完全由你控

#人工智能
既要 LLM 推理性能可预测,又要成本可控?专用推理了解一下

让一个模型同时处理 10 个推理请求是棘手的,但还算简单;让它在全天候面对 2,000 名工程师使用长上下文的代码助手时保持稳定、不产生失控成本,这才是团队容易卡住的地方。一个能工作的端点只是起点。团队需要识别支持硬件、连接正确的组件——服务、扩缩容、可观测性和成本护栏——这样部署才能在真实、持续负载下支撑预期的 SLA 和 SLO。DigitalOcean 已在上提供:一条快速接入 OpenAI

#人工智能#运维
    共 161 条
  • 1
  • 2
  • 3
  • 17
  • 请选择