杰克逊的日记个人主页

@weixin_42795092

杰克逊的日记

2023-06-01 08:54:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

在三台GPU服务器上部署分布式deepseek

通过以上步骤，即可在三台 GPU 服务器上实现 DeepSeek 的分布式部署，支持 7B/33B 模型的训练与推理，后续可根据需求调整节点数、GPU 数量及分布式策略（如增加节点扩展至更多 GPU）。分布式训练需主节点（Master）通过 SSH 无密码访问从节点（Worker），需配置三台服务器的 SSH 免密登录。避免多节点重复下载，建议在 Master 节点下载模型，通过 NFS 挂载或。

#服务器 #分布式 #运维

Olap数据处理

OLAP（Online Analytical Processing，联机分析处理）是一种软件技术，它主要专注于复杂的分析操作，帮助分析人员、管理人员或执行人员从多角度对信息进行快速、一致、交互地存取，从而获得对数据的更深入理解。

#数据库 #人工智能 #大数据 +1

大模型训推

大模型的训推即训练和推理，是大模型生命周期中两个非常重要的环节，以下为你详细介绍：

#GPU

大数据运维面试题

以上是一些可能的华为大数据运维面试题及解析，希望对准备面试的应聘者有所帮助。在面试过程中，应聘者可以结合自己的实际经验和技能水平，展示自己的技术能力和解决问题的思路。

#大数据 #运维

gpu服务器只安装nvidia,可以运行任务么

在配置好这些基础组件后，GPU服务器就可以用来运行各种依赖GPU加速的任务了，包括但不限于深度学习模型的训练和推理、大规模数据处理、复杂的科学计算等。综上所述，虽然仅安装NVIDIA显卡和相关驱动可以让GPU服务器运行任务，但为了充分发挥其性能，还需要进行一系列的配置和安装工作，包括安装CUDA和cuDNN等工具集。‌，但为了充分发挥GPU的计算能力，还需要进行一系列的配置和安装工作。首先，确保服

#服务器 #运维

deepseek的部署与使用

DeepSeek 是一个开源的大模型系列，包含 DeepSeek-R1、DeepSeek-MoE 等多个模型，支持文本生成、对话交互等功能。

#GPU

大模型运维过程中常见的一些操作

1. 模型部署与环境配置基础设施准备：部署 GPU 集群、TPU 等专用硬件，配置分布式计算环境（如 Kubernetes）。推理服务搭建：使用 Triton Inference Server、TensorFlow Serving 等框架部署模型，优化批处理和并发请求。量化与加速：应用 INT8 量化、TensorRT 加速推理，降低延迟和资源消耗。 2. 监控与告警性能监控：实时跟踪模型响应

#运维 #GPU

大模型的原理是什么

数据：万亿级文本语料提供 “知识来源”（类似大数据平台的数据湖）；架构：Transformer 提供 “高效学习骨架”（类似分布式系统的基础架构）；训练：预训练 + 微调实现 “通用能力→专业能力”（类似系统从基础版到定制版的迭代）；推理：向量映射 + 概率预测实现 “理解→生成”（类似模型的推理与输出过程）。

#人工智能 #算力 #GPU

大模型运维

大模型运维框架，覆盖全流程，适配 GPU 集群 + Kubernetes 架构，可直接落地。

#运维

规控算法（规划 + 控制算法）

这是 IT 规控算法最典型的落地场景，对应 “针对 AI 模型推理任务的。针对海量数据处理任务的。

#算法 #云计算 #大数据

共 56 条

请选择