logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何在NVIDIA H100 GPU上用Ollama以最高性能运行大语言模型

Ollama 提供了一种方式,可以从其庞大的语言模型库中下载大型语言模型,该库包括 Llama3.1、Mistral、Code Llama、Gemma 等。Ollama 将模型权重、配置和数据整合到一个由 Modelfile 指定的包中。Ollama 提供了一个灵活的平台,用于创建、导入和使用自定义或现有语言模型,非常适合创建聊天机器人、文本摘要等应用。它强调隐私,可与 Windows、macOS

#语言模型#人工智能#自然语言处理
用LangGraph、 Ollama,构建个人的 AI Agent

事实上,AI Agent 的研究还处于早期阶段,该领域还没有明确的定义。但是 Astra 和 GPT-4o 已经可以成为一个很好的早期示例了。NVIDIA 高级研究员、AI Agent 项目负责人 Jim Fan表示我们距离出现一个有实体的 AI Agent 或者说以 ChatGPT 作为内核的机器人,还有大约 3 年的时间。如果用他话来解释什么是 AI Agent,简单来说,AI Agent 就

文章图片
#语言模型#服务器#人工智能 +1
LlamaIndex 和 LangChain 对比,应该选择哪个 RAG 框架?

想在 LlamaIndex 和 LangChain 之间做出选择?本文将概览并了解这两种 LLM 时代最流行的框架之间的主要区别。

文章图片
#AI#人工智能#云计算
广告平台在 AI 时代如何选择 GPU 与云平台?

在广告科技的竞争赛道中,AI 已成为制胜关键,而 GPU 则是支撑这一切的核心引擎。广告平台若要在实时竞价、创意生成与智能定向上保持领先,就需要兼顾性能、成本与部署效率。DigitalOcean 通过其 GPU Droplet 产品,让广告团队能够以更低成本、更快速度构建 AI 驱动的广告系统。无论是初创的广告优化团队,还是全球化的 Ad Network,都能在这一平台上实现灵活扩展与高效运行。未

#人工智能
利用腾讯开源 Hunyuan3D 2.1:在 DigitalOcean GPU Droplet 上快速搭建 3D 模型

它主要由两个完全公开的基础模型组成,即 Hunyuan3D-DiT ——“一种结合了基于流的扩散架构与高保真网格自编码器(Hunyuan3D-ShapeVAE)的形状生成模型”,以及 Hunyuan3D-Paint ——“一种基于网格条件的多视角扩散模型,用于生成 PBR 材质,产出高质量、多通道对齐且视角一致的纹理”。例如,在上文示例中,我们可以看到被极度拉长的尾巴和地面平台。你将全面掌握从图像

文章图片
#开源#3d#人工智能 +1
DePin 为什么能加速区块链与 AI 两个行业的发展?

DePin是 Web3 生态中的一个新兴概念,将物理基础设施(如存储、计算资源、网络带宽等)去中心化,形成一个去中心化、共享和开放的网络。这些网络通过利用全球范围内的分布式资源,为去中心化应用(DApps)和区块链项目提供底层支撑。DePin 项目通常包括去中心化存储、计算资源、带宽等服务。如果你是一个区块链企业,你也可以基于现有的技术建立 DePin 项目。而建立这样的 DePin 项目,对技术

文章图片
#区块链#人工智能
保姆级教程:搭建自己的 Minecraft 服务器,跟好友一起玩!

一步一步教你如何搭建一个自己的《我的世界》服务器,与好友一起在同一个服务器中搭建、创造。

文章图片
#服务器#运维#游戏 +2
在 DigitalOcean GPU 云服务上使用 LangChain 构建Serverless AI 应用

全新的兼容现有 LangChain 代码的即插即用​​方案​:只需几行代码即可切换到 Gradient AI 的推理端点,无需重写或重构。​**延续 LangChain 的熟悉抽象(Chains、Tools、Agents)**​:继续使用你熟悉的构建方式——组合链、接入工具、启动智能体,无需更改工作流。​多模型可选​:在 DigitalOcean 上即时访问多种 GPU 加速的 Serverles

#人工智能#serverless
在 DigitalOcean GPU 云服务上使用 LangChain 构建Serverless AI 应用

全新的兼容现有 LangChain 代码的即插即用​​方案​:只需几行代码即可切换到 Gradient AI 的推理端点,无需重写或重构。​**延续 LangChain 的熟悉抽象(Chains、Tools、Agents)**​:继续使用你熟悉的构建方式——组合链、接入工具、启动智能体,无需更改工作流。​多模型可选​:在 DigitalOcean 上即时访问多种 GPU 加速的 Serverles

#人工智能#serverless
    共 58 条
  • 1
  • 2
  • 3
  • 6
  • 请选择