
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
NVIDIA推出Jetson Thor开发者套件,为物理AI和人形机器人提供强大计算平台。该套件基于Blackwell架构,具备2070 FP4 TFLOPS AI计算能力,支持多实例GPU技术,可同时处理实时控制和高级推理任务。配备128GB内存、14核CPU及丰富接口,Jetson Thor能运行复杂的生成式AI模型,实现物体识别、导航等机器人功能。新品相比前代性能提升7.5倍,能效提高3.5

MLPerf Inference v5.0是一个长期运行的基准测试套件,旨在测量各种不同模型和使用场景下的推理吞吐量。自2019年首次推出以来,MLPerf Inference不断更新,增加新模型和场景,确保其作为测量AI计算平台推理性能的有效工具。:一个拥有4050亿参数的密集LLM。对于服务器场景,该基准测试设定了首个token生成时间(TTFT)为6秒,每个输出token的时间(TPOT)为

从点云重建光滑表面是创建真实世界对象和场景的数字孪生的基本步骤。表面重建算法出现在各种应用中,例如工业模拟、视频游戏开发、建筑设计、医学成像和机器人技术。神经核表面重建 (NKSR) 是新的 NVIDIA 算法,用于从大型点云重建高保真表面。NKSR 可以在几秒钟内处理数百万个点,并在广泛的基准测试中达到最先进的质量。NKSR 是传统泊松曲面重建的绝佳替代品,可提供更多细节和更快的运行时间。NKS

NVIDIA_DALINVIDIA 数据加载库 (DALI: Data Loading Library) 是一个用于数据加载和预处理以加速深度学习应用程序的库。它提供了一组高度优化的构建块,用于加载和处理图像、视频和音频数据。它可以用作流行深度学习框架中内置数据加载器和数据迭代器的便携式替代品。深度学习应用程序需要复杂的多阶段数据处理管道,包括加载、解码、裁剪、调整大小和许多其他增强功能。这些目前

虚拟内存管理 API 为应用程序提供了一种直接管理统一虚拟地址空间的方法,该空间由 CUDA 提供,用于将物理内存映射到 GPU 可访问的虚拟地址。在 CUDA 10.2 中引入的这些 API 还提供了一种与其他进程和图形 API(如 OpenGL 和 Vulkan)进行互操作的新方法,并提供了用户可以调整以适应其应用程序的更新内存属性。从历史上看,CUDA 编程模型中的内存分配调用(例如 )返回

GTC 2025 中文在线解读| CUDA最新特性与未来 [WP72383]NVIDIA GTC大会火热进行中,一波波重磅科技演讲让人应接不暇,3月24日,NVIDIA 企业开发者社区邀请Ken He、Yipeng Li两位技术专家,面向开发者,以中文深度拆解GTC2025四场重磅开发技术相关会议,直击AI行业应用痛点,破解前沿技术难题!作为GPU计算领域的基石,CUDA通过其编程语言、编译器、运

CUDA编程模型系列四(卷积 or sobel边缘检测)本系列教程将介绍具体的CUDA编程代码的细节。

NVIDIA NeMo 是一个用于构建新的最先进的对话式 AI 模型的工具包。 NeMo 有自动语音识别 (ASR)、自然语言处理 (NLP) 和文本到语音 (TTS) 模型的单独集合。 每个集合都包含预构建的模块,其中包括训练数据所需的一切。 每个模块都可以轻松定制、扩展和组合,以创建新的对话式 AI 模型架构。

得益于称为 EditGAN 的生成对抗网络 (GAN) 模型,编辑猫、汽车甚至古董画的照片的愿望从未如此简单。 这项工作由 NVIDIA、多伦多大学和麻省理工学院的研究人员共同完成,建立在 DatasetGAN 的基础上,这是一种人工智能视觉模型,可以用少至 16 个人工注释的图像进行训练,并且与其他需要 100 倍以上图像的方法一样有效。 EditGAN 继承了先前模型的强大功能,使用户能够通过
