logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

NVIDIA AI 培训班 | 5 月 14 日开课:利用提示工程构建大语言模型应用

NVIDIA 深度学习培训中心(DLI)提供的《利用提示工程构建大语言模型应用》AI 培训班即将开课,由 NVIDIA 认证讲师全天实时中文授课和答疑,配合云端实验环境的动手实操,系统讲解并实践提示工程一系列基本技能,用于高效构建基于 LLM 的应用。使用由 Llama-3.1 LLM 驱动的 NVIDIA NIM,和当前流行的 LangChain 库,学习使用提示工程一系列基本技能,用于构建基于

文章图片
#人工智能#语言模型#自然语言处理
使用端到端 FP8 精度运行高吞吐量强化学习训练

我们使用 GRPO 算法在 Qwen3-8B-Base 模型上运行结果,在部署中应用 FP8,在训练中应用 BF16。虽然对复合错误引起的 KV 缓存和注意力进行量化时,不匹配 KL 差异稍高一些,但我们的方法可以减轻不稳定性。通过启用词元-level 截断重要性采样,用于线性* KV 缓存* 注意力的 FP8 可实现与 BF16 基准和线性层 (W8A8) 的 FP8 的验证准确性对齐。图 6.

文章图片
#AI
聚焦:Perfect Corp. 利用 NVIDIA TensorRT 和 NVENC 实现个性化的数字化美妆体验

AI 和 AR 通过提供超个性化的数字体验 (从虚拟尝试到 AI 驱动的造型) ,正在改变美感和时尚。Perfect Corp. 是 AI 和 AR 美颜技术的全球领导者,利用 NVIDIA 解决方案提高其应用程序的真实感、准确性和性能。Perfect Corp. 使用通过 NVIDIA TensorRT 优化的 AI 模型,能够实现高精度的实时皮肤护理分析和 AI 生成的发型。此外,NVENC

文章图片
#AI
使用 NVIDIA FLARE 在无重构开销的情况下进行联合学习

联邦学习 (FL) 不再是研究的好奇心,而是对棘手限制的实际回应:最有价值的数据通常是最不可动的数据。监管边界、数据主权规则和组织风险承受能力通常会阻止集中式聚合。与此同时,纯粹的数据引力使得即使是允许的大规模传输也会变得缓慢、昂贵且脆弱。最新版本的通过联邦计算运行时解决了这一问题,该运行时可将训练逻辑迁移至数据所在位置,而原始数据无需移动。在高风险环境中,集中式数据聚合通常不可行或不现实,因此现

文章图片
#AI
使用 NVIDIA Blackwell 和 GPU 加速端点构建 DeepSeek V4

DeepSeek 刚刚发布了第四代旗舰模型,推出和两款产品,均致力于实现高效的百万词元上下文推理。DeepSeek-V4-Pro 是该系列中最大的型号,拥有 1.6 T 的总参数和 49B 的活动参数。DeepSeek-V4-Flash 是一款包含 304B 参数的小型模型,具有 130 亿个活动参数,专为高速、高效的工作负载而设计。这两种模型最高支持 1M-词元上下文窗口,为长上下文编码、文档分

文章图片
#AI
NVIDIA Spectrum-X — 开放的 AI 原生以太网架构 — 全面支持 MRC,为超大规模 AI 设定新标准

为开放规范,MRC 展示了 Spectrum-X 以太网平台的强大能力:专门优化的硬件、深度遥测和智能网络控制协同工作,将新协议 (一套控制数据如何在网络中两个系统之间移动的规则) 从概念转化为超大规模 AI 生产。在 Spectrum-X 以太网上部署的 MRC,经过优化和设计,助力大规模系统的可靠性。因此,为当今大型 AI 集群提供支持的 Spectrum-X 以太网硬件和软件基础设施为客户提

文章图片
#人工智能
在机架级超级计算机上运行 AI 工作负载:从硬件到拓扑感知调度

采用 NVIDIA Blackwell 架构的 NVIDIA GB200 NVL72 和 NVIDIA GB300 NVL72 系统是机架级超级计算机。它们采用 18 个紧密合的计算托盘、大型 GPU 网络和整体式高带宽网络设计。对于 AI 架构师和 HPC 平台运营商而言,挑战不仅仅在于机架和堆叠硬件,还在于将基础设施转变为面向最终用户的安全、高性能且易于使用的资源。机架级硬件拓扑与调度器抽象之

文章图片
#人工智能#php#开发语言
借助 NVIDIA Omniverse 库,将物理 AI 功能集成到现有应用中

物理 AI (在基于物理性质的模拟环境中感知、推理和行动的 AI 系统) 正在改变团队设计和验证机器人和工业系统的方式,而这一切远早于任何产品交付到工厂车间。在大会上,NVIDIA 强调物理 AI 是机器人和的关键方向,在基于物理的环境中训练和验证策略。为使 NVIDIA Omniverse 更易于集成到现有应用中,NVIDIA 在现有平台的基础上增加了一个基于库的模块化架构。ovrtxovphy

文章图片
#人工智能#大数据
MiniMax M2.7 在 NVIDIA 平台上推进复杂 AI 应用的可扩展代理工作流程

MiniMax M2.7 的发布为流行的模型增加了增强功能,该模型专为代理式线束以及推理、ML 研究工作流程、软件、工程和办公室工作等领域的其他复杂用例而构建。MiniMax M2.7 的开源权重版本现已通过 NVIDIA 和整个开源推理生态系统提供。MiniMax M2 系列是稀疏混合专家 (MoE) 模型系列,专为提高效率和功能而设计。MoE 设计可保持较低的推理成本,同时保留 230B 参数

文章图片
#人工智能
NVIDIA 认证 | 如何选考试?四大技术方向解读 11 门认证

机器学习和神经网络的基础知识,提示工程,对齐,数据分析和可视化,实验,数据预处理和特征工程,实验设计,软件开发,大语言模型,大语言模型 Python库,大语言模型集成和部署。:70-75道选择题,即将增加代码实操环节,120 分钟。:LLM 架构,提示工程,数据准备,模型优化,微调,评估,GPU 加速和优化,模型部署,生产监控与可靠性,安全、道德与合规。:LLM 架构,提示工程,数据准备,模型优化

文章图片
    共 157 条
  • 1
  • 2
  • 3
  • 16
  • 请选择