
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
NVIDIA CUDA 13.1带来重大更新,包括革命性的CUDA Tile编程模型,支持在更高抽象层编写GPU内核,自动优化线程分配。新版本还引入Green Contexts实现细粒度GPU资源管理,编译时补丁增强内存调试效率,以及确定性浮点归约选项。同时发布了全新重构的CUDA编程指南,为开发者提供更清晰的学习路径。这些改进显著提升了GPU编程的效率和性能,特别针对AI算法优化,为未来GPU架
Dynamic Parallelism是 CUDA 编程模型的扩展,使 CUDA 内核能够直接在 GPU 上创建新工作并与新工作同步。在程序中需要的任何位置动态创建并行性提供了令人兴奋的新功能。直接从 GPU 创建工作的能力可以减少在主机和设备之间传输执行控制和数据的需要,因为现在可以通过在设备上执行的线程在运行时做出启动配置决策。此外,可以在运行时在内核内内联生成依赖于数据的并行工作,动态利用

NVIDIA 视觉编程接口 (`VPI: Vision Programming Interface`) 是 NVIDIA 的计算机视觉和图像处理软件库,使您能够实现在 NVIDIA Jetson 嵌入式设备和独立的GPU 上可用的不同硬件后端上加速的算法。

NVIDIA Isaac Lab 2.3带来机器人学习的三项突破:1)增强的遥操作支持更多设备并改进上身控制,实现更自然的技能转移;2)SkillGen工作流将人类演示与GPU运动规划结合,自动生成无碰撞的演示数据;3)创新的运动-操作合成技术,通过解耦导航与操作,从纯操作演示生成大规模耦合数据集。这些功能显著简化了复杂机器人系统的开发流程,为人形机器人和灵巧操作任务提供了强大的基础设施支持。

在人工智能快速发展的今天,下一代AI驱动的机器人,如人形机器人和自动驾驶汽车,都依赖于高保真、物理感知的训练数据。然而,如果没有多样化且具代表性的数据集,这些系统将无法获得适当的训练,并在测试中面临诸多风险:泛化能力差、对真实世界变化的适应有限、在边缘情况下行为不可预测等。而收集大规模真实世界数据集不仅成本高昂,还极其耗时,且常常受到现实可能性的限制。NVIDIA Cosmos通过加速世界基础模型

嵌入模型将各种数据(例如文本、图像、图表和视频)转换为数字向量,从而在多维向量空间中捕捉其含义和细微差别。嵌入技术的选择取决于应用需求,平衡语义深度、计算效率、要编码的数据类型和维数等因素。将向量映射到多维空间可以对向量的语义相似性进行细致入微的分析,从而显著提高搜索和数据分类的准确性。嵌入模型在使用 AI 聊天机器人、大型语言模型 (LLM) 和带有向量数据库的检索增强生成 (RAG) 的 AI

想要了解有关 NIM 的更多信息?,即可免费访问任何基础设施云、数据中心或个人工作站上最多 16 个 GPU 上的自托管 NVIDIA NIM 和微服务。加入免费的 NVIDIA 开发者计划后,您可以随时通过 NVIDIA API 目录访问 NIM。要获得企业级安全性、支持和 API 稳定性,请选择通过我们的免费 90 天 NVIDIA AI Enterprise 试用版使用企业电子邮件地址访问

涉及基于 AI 的计算机视觉的实时云规模应用程序正在迅速增长。用例包括图像理解、内容创建、内容审核、映射、推荐系统和视频会议。然而,由于对处理复杂性的需求增加,这些工作负载的计算成本也在增长。从静止图像到视频的转变现在也正在成为消费者互联网流量的主要组成部分。鉴于这些趋势,迫切需要构建高性能但具有成本效益的计算机视觉工作负载。基于 AI 的计算机视觉流程通常涉及围绕 AI 推理模型的数据预处理和后

NVIDIA_DALINVIDIA 数据加载库 (DALI: Data Loading Library) 是一个用于数据加载和预处理以加速深度学习应用程序的库。它提供了一组高度优化的构建块,用于加载和处理图像、视频和音频数据。它可以用作流行深度学习框架中内置数据加载器和数据迭代器的便携式替代品。深度学习应用程序需要复杂的多阶段数据处理管道,包括加载、解码、裁剪、调整大小和许多其他增强功能。这些目前

此函数返回 cuBLAS 库的版本号。








