logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习框架对比(2025年3月版)

提供PyTorch→ONNX单行转换命令(torch.onnx.export)学术研究(论文复现率超80%)与小规模模型训练(参数规模<10B):仅支持Transformer类模型(LLaMA/GPT系列):GGUF格式支持4-bit量化,ARM设备内存占用减少70%:ZeRO内存优化技术可将万亿参数模型分割存储于GPU集群。:QLoRA量化支持在24GB显存设备微调70B参数模型。:仅支持NVI

文章图片
#深度学习#人工智能#机器学习 +3
深度学习框架对比(2025年3月版)

提供PyTorch→ONNX单行转换命令(torch.onnx.export)学术研究(论文复现率超80%)与小规模模型训练(参数规模<10B):仅支持Transformer类模型(LLaMA/GPT系列):GGUF格式支持4-bit量化,ARM设备内存占用减少70%:ZeRO内存优化技术可将万亿参数模型分割存储于GPU集群。:QLoRA量化支持在24GB显存设备微调70B参数模型。:仅支持NVI

文章图片
#深度学习#人工智能#机器学习 +3
马斯克揭秘全球顶尖AI大模型Grok-3,震撼发布引热议

在多项基准测试中,Grok-3展现出了惊人的实力,刷新了数学(AIME 2024)、科学问答(GPQA)和编码(LCB)等领域的SOTA记录,大幅超越了DeepSeek-V3、Gemini-2 Pro和GPT-4o等模型。马斯克与三位xAI成员通过在线直播,正式官宣了Grok-3的全家桶阵容,包括Grok-3(Beta)、首个推理模型Grok-3 Reasoning(Beta)以及Grok-3 m

文章图片
#人工智能#机器学习#服务器 +2
深度学习模型应用场景全解析:CNN、Transformer、BERT、RNN与GAN

CNN,这位图像处理领域的明星,以其独特的卷积层、池化层和全连接层结构,成为了自动学习空间特征的佼佼者。BERT,这位基于Transformer架构的预训练语言模型,以其双向编码器和丰富的预训练方法,成为了自然语言理解领域的佼佼者。GAN,这位生成任务的魔术师,以其生成器和判别器的相互对抗,创造出了逼真的样本。RNN,这位时间序列数据的守护者,以其循环连接的神经元结构,捕捉到了序列数据中的时序依赖

文章图片
#深度学习#cnn#transformer +4
常用深度学习工作站、服务器推荐

1块500GB M.2 SSD系统盘+1块8TB SATA 企业级硬盘作为数据盘。1块1TB M.2 SSD系统盘+1块18TB SATA 企业级硬盘作为数据盘。1块1TB U.2 SSD系统盘+3块18TB SATA 企业级硬盘作为数据盘。2张NVIDIA Geforce RTX 4090三风扇版。4张NVIDIA Geforce RTX 4090三风扇版。NVIDIA Geforce RTX

#服务器#人工智能
大模型显存计算指南!

其中,CUDA开销通常为基础模型显存的15%,运算显存则包括KV Cache、激活值以及CUDA缓存,每个元素的字节数同样取决于所选精度。*最小推荐显存基于相应精度计算,包含CUDA开销和工作内存 **最小推荐显存(FP32)基于全量参数计算,包含CUDA开销和工作内存。*最小推荐内存基于相应精度计算,包含工作内存和系统预留 **最小推荐内存(FP32)基于全量参数计算,包含工作内存和系统预留。1

文章图片
#服务器#数据挖掘#人工智能 +1
部署DeepSeek,需要多大的显存?

特别地,带有“Distill”标签的模型为蒸馏模型,通过知识蒸馏技术,将大型复杂模型(教师模型)的知识传递给小型轻量化模型(学生模型),从而在保持模型性能的同时,降低计算和存储资源的消耗。FP16训练:模型参数14GB,优化器状态28GB(以Adam优化器为例,通常需要2倍于模型参数的显存),激活值和梯度假设为14GB,总显存需求约为56GB。FP32训练:模型参数28GB,优化器状态56GB,激

文章图片
#人工智能#数据挖掘#机器学习 +2
2025年4月大模型预训练、微调服务器推荐

目前常用的显卡包括A6000 48G、L20 48G、L40 48G、6000Ada 48G,A100 80G等等.目前有一款常被大家忽略的显卡突围而出,大模型预训练与微调,对显卡的显存要求高,显存是决定模型能不能跑的关键因素,因此,挑选显卡时优先考虑显存问题;其次再考虑单精度等性能问题。推荐一款8卡5880Ada 服务器供参考。

文章图片
#人工智能#服务器#深度学习 +4
科学计算服务器:如何计算算力?如何提升科学研究效率?

另一方面,根据服务器性能和研究任务特点合理分配计算任务,将大规模计算任务分解为多个子任务,分配到不同计算节点上并行计算,提高整体效率。同时,科学计算通常涉及大量数据,合理的数据管理和存储策略可提高数据访问速度,减少计算时间,如使用高速存储设备、优化数据存储格式和数据库管理系统。此外,在科学计算过程中持续监控服务器性能和资源使用情况,及时发现并解决问题,根据实际需求调整服务器配置和参数,优化计算资源

文章图片
#服务器#运维#人工智能 +1
    共 34 条
  • 1
  • 2
  • 3
  • 4
  • 请选择