logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何在NVIDIA H100 GPU上用Ollama以最高性能运行大语言模型

Ollama 提供了一种方式,可以从其庞大的语言模型库中下载大型语言模型,该库包括 Llama3.1、Mistral、Code Llama、Gemma 等。Ollama 将模型权重、配置和数据整合到一个由 Modelfile 指定的包中。Ollama 提供了一个灵活的平台,用于创建、导入和使用自定义或现有语言模型,非常适合创建聊天机器人、文本摘要等应用。它强调隐私,可与 Windows、macOS

#语言模型#人工智能#自然语言处理
4分钟,为你的网站添加基于DeepSeek的AI智能客服

现在,我们已经有大语言模型了,我们完全可以把一个小参数版本的 DeepSeek 直接部署在一台服务器上(​ 比如DigitalOcean 的H200 GPU Droplet服务器 ​),并给它配上自定义的知识库。用更灵活的方案,替代掉传统的 SaaS 方案。但是问题在于,这个机器人不是你可控的,你只能给它添加固定的回答,或者通过人工时不时地去修正它所给出的答案。最后,如果你的团队具备更强的 AI

#人工智能#大数据
芯片女皇预言GPU降温,CPU翻倍:AI算力大潮转弯了?

科技大潮的演进,总是遵循着特定的客观规律。当人们依然沉浸在大模型参数量的不断狂飙、以及各种惊艳的 Agent 框架层出不穷的宏大叙事中时,苏姿丰用一份 1200 亿美金的预言,把整个行业的目光重新拉回到了最扎实、最务实的基础设施地面上。大模型的上半场,是属于科技巨头们在神坛上的 GPU 军备竞赛;而 AI 的下半场——也就是 Agent 真正走向千家万户、重构每一个普通人生产力的时代,它的胜负手则

#人工智能#GPU
芯片女皇预言GPU降温,CPU翻倍:AI算力大潮转弯了?

科技大潮的演进,总是遵循着特定的客观规律。当人们依然沉浸在大模型参数量的不断狂飙、以及各种惊艳的 Agent 框架层出不穷的宏大叙事中时,苏姿丰用一份 1200 亿美金的预言,把整个行业的目光重新拉回到了最扎实、最务实的基础设施地面上。大模型的上半场,是属于科技巨头们在神坛上的 GPU 军备竞赛;而 AI 的下半场——也就是 Agent 真正走向千家万户、重构每一个普通人生产力的时代,它的胜负手则

#人工智能#GPU
为什么说,传统的通用云正在成为 AI 应用持续增长的“隐形障碍”

obsidian在 2023 年,每一次关于 AI 领导力的对话都集中在模型训练成本上。而到了 2026 年,更大的挑战已不再仅仅是训练,而是推理(Inference)。训练是一次性或偶尔发生的。而推理则发生在用户的每一次提示词输入、智能体的每一次工具调用、RAG 检索或应用生成的每一次回复中。算力需求从“模型训练”向“模型推理”的转移,使 AI 的经济模式从静态的模型构建成本,转变为随着产品需求

#人工智能
实战指南:AI调用成本降71%——利用“推理路由”告别大模型胡乱开销

用推理路由器,自动将不同任务匹配最佳模型,代码任务交给claude,文本任务交给deepseek,成本比全用前沿模型降低 71%。

文章图片
#人工智能#数据库#AIGC
使用 DigitalOcean 实现 Claude Code “低配订阅 + 外部 Token”

在不修改任何业务代码的前提下,引入claudo在体验无感的同时,实现了链路的可控。虽然从表面上看,你的调用方式和交互体验没有变化,且 DigitalOcean 针对的阶梯定价与 Anthropic 官方完全持平,但在长期的团队协作中,这种“工程化路径”会逐渐显现出其不可替代的稳定性与财务透明度。当大模型能力日趋同质化时,未来的技术壁垒不再仅仅取决于“用了什么模型”,而在于“如何更稳、更省、更专业地

#人工智能#AIGC
教程:让OpenClaw一次接入Claude、Qwen、DeepSeek 多个模型

本文将介绍,如何在本地安装的Openclaw中,使用DigitalOcean GradientAI 的Key配置大模型。可用的大模型包括:Claude opus、Claude Sonnet、gtp-oss、Kimi、DeepSeek、Qwen、MiniMax,以及 NVIDIA Dynamo 1.0等数十种大模型。本文中介绍的API 接入方法,对云端部署的Openclaw同样适用。

#人工智能#AIGC
教你用Continue/Kilo插件在VS Code里丝滑切换Qwen3与Opus 4.6

轻量任务本地化:简单的代码提示交给 Copilot 或本地模型。重型任务云端化:涉及跨文件逻辑、架构设计、数据迁移脚本时,直接调用 Gradient 上的 opus 4.6。统一化管理:所有的 API 调用、模型切换和账单支付都集中在 DO 平台,不再需要到处找 Key。这种“Serverless AI”的配置方式,代表了未来开发者工作流的趋势——不为闲置的订阅买单,只为产生的价值付费。赶紧去配置

#人工智能#AIGC
无封号焦虑!Claude Code 官方插件 +VS Code ,稳定接入的配置指南

VS Code + Claude Code 官方插件 + DO 国内直连,免翻墙不封号,直接使用Claude Opus 4.7。

#vscode#人工智能#AIGC
    共 128 条
  • 1
  • 2
  • 3
  • 13
  • 请选择