想读博的网虫个人主页

@k5218024

想读博的网虫

2024-05-23 08:55:58 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

GPU集群计算IB网卡命名不一致修改

在使用不同厂家的服务器做集群训练时，因为不同厂家的GPU服务器配置不同会影响计算网的通信，以下图为例：mlx5_6网卡在A机器上为25GE网卡，在B机器上为200G的IB网卡，在添加NCCL通信相关配置时，如果没有统一命名，会因为网卡名称导致通信报错。修改 KERNELS==“0000:” 的值，参考smt status -v中的 PCI值对应的NET网卡，保存后reboot。3.ibdev2ne

#服务器 #云计算 #ubuntu

数据中心GPU芯片性能参数速查表（Nvidia+国产算力卡）

Nvidia的数据中心用GPU芯片，不断更新迭代新的架构。不同架构下的 GPU芯片，其性能参数大相径庭。在计算能力方面，从早期架构到如今的先进架构，CUDA 核心数量不断增加，如从 Kepler 架构开始，SM 单元中的 CUDA 核心数大幅提升，这使得通用计算能力得到极大增强。每代的架构，都会以一个著名科学家的名字命名，截止目前，已经有 11 款芯片架构代号取自科学家名字。如下所示：

#服务器 #运维 #云计算

使用国内 huggingface 镜像下载模型数据集方法

Hugging Face作为全球知名的AI模型和数据集共享平台，拥有海量的资源可供开发者使用。然而，由于网络环境等因素的影响，国内开发者在直接访问Hugging Face官网下载模型和数据集时，往往会遇到速度慢甚至无法下载的问题。为了帮助国内AI开发者解决这一难题，Hugging Face的国内镜像站点应运而生。这些镜像站点通过在国内部署服务器，加速了模型和数据集的下载速度，极大地提高了开发效率。

#云计算

深度解析：DeepSeek V4 的技术突围与国产 AI 的“普惠时代”

DeepSeek作为国产开源大模型的标杆，自2023年推出V1模型以来，始终坚持“算法+工程”双轮驱动的创新路线，以普惠AGI为目标，完成了从初版模型到V4的跨越式发展。2026年4月发布的DeepSeek V4，不仅标志着其正式迈入百万上下文时代，更通过架构革新、国产算力深度适配与双版本策略，为不同场景提供了高效、低成本的AI解决方案。

#人工智能 #云计算

深度解析：DeepSeek V4 的技术突围与国产 AI 的“普惠时代”

#人工智能 #云计算

【学习笔记】一文解析OpenClaw(clawdbot)是什么？从Skills、MCP、RAG、Memory到AI Agent

当我们将上述组件整合：Agent=LLM(大脑)+Memory(记忆)+RAG(知识库)+MCP(工具手)+Skills(经验流程)Agent=LLM(大脑)+Memory(记忆)+RAG(知识库)+MCP(工具手)+Skills(经验流程)这就构成了AI Agent。它不再是被动问答，而是具备感知、规划、行动、反思能力的自主系统。从静态的模型文件，到拥有记忆、知识和手脚的 OpenClaw，技术

#人工智能 #AIGC #深度学习

使用国内 huggingface 镜像下载模型数据集方法

#云计算

【学习笔记】一文解析OpenClaw(clawdbot)是什么？从Skills、MCP、RAG、Memory到AI Agent

#人工智能

数据中心GPU芯片性能参数速查表（Nvidia+国产算力卡）

#服务器 #运维 #云计算

英伟达Rubin平台全面解析：5倍于Blackwell的AI算力，开启物理AI时代

北京时间1月6日凌晨，在拉斯维加斯 CES 2026 展会现场，英伟达创始人黄仁勋身穿经典皮衣现身，并正式发布了全新一代Vera Rubin计算架构。这一架构涵盖CPU、GPU、互连、网络、存储与系统级设计，被英伟达定义为面向“下一阶段AI前沿”的基础设施平台。在这场演讲中，黄仁勋并未将重点放在某一具体应用或模型能力上，而是在演讲中明确指出，AI发展的下一步是让模型能够。

#人工智能 #云计算 #服务器

到底了