社区云

NIM

扫地的小何尚来自脑启社区

nanhubrain.csdn.net · 2025-03-17 10:03:08

CUDA中的Stream Ordered Memory Allocator详解

Stream Ordered Memory Allocator是一种基于CUDA流（stream）的内存分配机制。它允许开发者在特定的CUDA流中分配和释放内存，从而确保内存操作的顺序性与流的执行顺序一致。这种机制特别适用于需要频繁分配和释放内存的应用程序，例如深度学习推理、图像处理等。传统的CUDA内存分配（如cudaMalloc和cudaFree）是全局的，不依赖于任何流。这意味着内存的分配和

#人工智能 #NIM #GPU

1436 

14 
h0i1j2k3l 来自腾讯云开发者社区

tencentcloud.csdn.net · 2026-02-07 10:06:21

从零到一：NVIDIA NIM 微服务在边缘计算中的实战部署

本文详细介绍了NVIDIA NIM微服务在边缘计算中的实战部署，特别针对Jetson设备进行了优化。通过轻量化容器、硬件感知优化和离线推理能力，NIM微服务显著降低了内存占用和推理延迟，提升了能效比。文章提供了从环境准备到容器部署、性能调优的全流程指南，并展示了智慧变电站和农业无人机等典型应用场景。

#NIM #边缘计算 #Jetson

872 

7 
Garfield2005 来自 AtomGit开源社区

gitcode.csdn.net · 2026-04-23 17:05:22

基于 LiteLLM 接入 NVIDIA NIM 全指南

本文介绍了使用LiteLLM统一接入NVIDIA NIM模型（如GLM、DeepSeek、Kimi等）的完整方案。主要内容包括：整体架构：通过LiteLLM Proxy统一对接VSCode插件和多种AI模型，实现接口统一、API Key管理和多模型切换功能。部署方案：提供Docker Compose配置，包含LiteLLM服务、PostgreSQL数据库和Prometheus监控。关键配置：

#NIM

521 

11 
wanmeijuhao 来自 MCP技术社区

mcp.csdn.net · 2024-10-14 09:52:04

【NVIDIA NIM黑客松训练营】基于英伟达(NVIDIA) NIM 平台应用助力电商企业AI海报文案和AI客服最佳实践落地

【NVIDIA NIM】提供了强大的工具和灵活的部署选项，让生成式 AI 模型的开发和应用变得更加高效和便捷。无论您是初学者小白还是资深开发者老鸟，都可以使用NIM 都能轻松应对 AI 推理的复杂挑战，加速创新与落地，助力中小企业及开发者快速部署LLM、AI作画、数据科学等高性能应用。

#人工智能 #NIM #生成式AI +2

3.8w 

255 

标签介绍

NIM

——NIM

热门标签

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net