logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大厂算力调研:CPU/GPU算力使用及迁移情况

在明年预计支持三四十万亿token需求时,总体需要约二十六七万张卡,其中50%-60%为训练卡,40%-50%为推理卡,包括L20和580系列。在未来,为优化成本及提升效率,将逐步将部分CPU任务迁移至GPU,但整体增加量预计仅为10%-20%,不会出现大规模扩容。而豆包平台作为一个AI对话系统,其日均query量达到4.2亿次,对应DAU约6,000多万,每天消耗5.5万亿至6万亿token,因

文章图片
AI研究:轻量模型和专用模型在算力优化上的差异对游戏制作的效率和质量有何影响?

轻量模型与专用模型在算力优化上的核心差异(普适性压缩 vs 任务针对性优化),直接影响游戏制作的效率节奏(生成速度、迭代周期、资源消耗)和质量表现(细节精度、风格一致性、引擎适配性)。这种影响在不同制作阶段(原型设计、资产量产、核心资产精修)中呈现出显著差异,具体如下

文章图片
#人工智能#游戏
广告制作中,AIGC 的算力配置要求是什么?

在广告制作中,AIGC 的算力配置需根据具体任务类型(如图像生成、视频生成、多模态创意等)和企业规模灵活调整。以下是基于行业实践的算力优化方案及硬件选型建议。

文章图片
#AIGC#人工智能
AIGC在做短视频算力优化方法

在短视频生成中,AIGC 的算力优化需从模型架构、硬件加速、软件框架、数据处理、部署策略五个维度协同推进,结合领域特性实现 “性能 - 成本” 的最优平衡。以下是经过工程验证的核心技术方案与行业实践。

文章图片
#AIGC#音视频
电商场景下AIGC使用的算力配置的优化策略

通过多模态基底模型(DiT+Flow Matching)、Zero-Shot 可控生成框架(ReferenceNet+ControlNet)和 RAG 方案,实现商品图生成效率提升 95%(从天级到秒级),单图成本降低 99%(从 50-2000 元降至 < 20 元)。结合边缘计算与云服务,用户上传客厅照片后,AI 在本地生成 3D 搭配方案(延迟 < 200ms),同时将渲染任务分流至云端,客

文章图片
#AIGC#人工智能
深度学习常见应用算力要求?

深度学习常见应用算力要求要理解深度学习常见应用的算力要求,首先需要明确算力的核心衡量维度

文章图片
#人工智能
AI研究:轻量模型和专用模型在游戏制作中的算力优化效果有何不同?

在游戏制作中,轻量模型与专用模型的算力优化逻辑和效果存在本质差异:轻量模型通过 “普适性压缩”降低整体计算负载,适合简单或低优先级任务;专用模型通过“任务针对性优化” 提升计算效率,适合复杂但场景固定的任务。两者的核心差异体现在算力消耗模式、适用场景、质量 - 效率平衡三个维度,具体如下

文章图片
#人工智能#游戏
AI研究员必看:一文说清LLM 不同模型规模算力配置清单

这个问题直击 LLM 落地的核心痛点,非常关键!LLM 应用架构的算力要求无固定标准,核心取决于,核心结论是:推理阶段以中高端 GPU 为主,训练阶段需大规模 GPU 集群,且算力需求随模型参数、并发量呈非线性增长。

文章图片
#人工智能#大数据#语言模型 +1
AIGC的算力要求是什么?各类AI研究需要关注

AIGC(生成式人工智能)的算力需求并非固定值,而是由模型规模、任务类型、生成质量 / 速度、训练与推理场景等多维度共同决定,且不同场景下的算力差异可达数个数量级。要理解其算力需求,需从 “核心定义→影响因素→分场景需求→优化方向” 逐步拆解。

文章图片
#AIGC#计算机视觉#人工智能
AI研究必看:AI Agent的算力需求

AI Agent 的算力需求受模型规模、任务类型、部署场景等多因素影响,需从硬件架构、模型特性、应用场景三个维度综合评估。以下结合最新技术趋势与行业实践,给出系统性分析框架。

文章图片
#人工智能
    共 98 条
  • 1
  • 2
  • 3
  • 10
  • 请选择