logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

自动抓取服务器功耗

linux系统内通过ipmitool工具自动抓取服务器当前功耗power,每隔5分钟抓取一次,累计抓取20次。

文章图片
#服务器#运维#bash +1
分布式训练并行策略

大模型分布式训练并行策略介绍

文章图片
#分布式#人工智能#语言模型 +2
昇腾大模型性能分析思路

我们根据性能问题的场景,按照单机和集群场景进行分类,再明确性能问题属于哪一类,明确好性能问题背景之后,才方便进行下一步问题的定位;在明确问题背景后,参考,选择对应的性能工具,采集性能数据并拆解性能,找到需要提升性能的模块;在明确性能瓶颈模块后,将问题细化定位到下发、计算和通信等模块,并通过本文目录搜索到对应章节找到对应优化算法。

文章图片
#语言模型#自然语言处理#nlp
01通俗理解大模型预训练和微调

但是通用大模型在某些方面的垂直能力可能还不具备,因此需要用到一些领域的数据或私有化数据对大模型进行改良,这个过程叫做微调。通过海量数据数据,训练一个通用大模型,此时大模型具备很多能力。简单理解大模型预训练和微调的过程。

文章图片
#人工智能#自然语言处理#transformer +1
ubuntu系统GPU从0开始构建大模型训练环境

liunx系统基于CUDA生态从0开始构建大模型训练环境;ubuntu+CUDA+pytorch+ChatGLM

#ubuntu#linux#人工智能 +4
昇腾大模型性能分析思路

我们根据性能问题的场景,按照单机和集群场景进行分类,再明确性能问题属于哪一类,明确好性能问题背景之后,才方便进行下一步问题的定位;在明确问题背景后,参考,选择对应的性能工具,采集性能数据并拆解性能,找到需要提升性能的模块;在明确性能瓶颈模块后,将问题细化定位到下发、计算和通信等模块,并通过本文目录搜索到对应章节找到对应优化算法。

文章图片
#语言模型#自然语言处理#nlp
浅谈文生图Stable Diffusion(SD)相关模型基础

简单分享关于文生图模型Stable Diffusion的基础知识,包含涉及的相关模型知识,如:VAE/UNet/Diffusion Mode等模型基础知识

文章图片
#人工智能#计算机视觉#语言模型
LLaMA-Factory仓基础功能架构及NPU/GPU环境实战演练

LLaMA-Factory是一个开源的大规模语言模型微调框架,设计用于简化大模型的训练过程。它提供了一个统一的平台,支持多种大模型的微调,包括LLaMA、BLOOM、Mistral等,旨在帮助用户快速适应和调整这些模型以适应特定的应用场景。LLaMA-Factory通过提供一套完整的工具和接口,使用户能够轻松地对预训练的模型进行定制化的训练和调整,包括(增量)预训练、指令监督微调、奖励模型训练、P

文章图片
#人工智能#自然语言处理#语言模型 +1
    共 26 条
  • 1
  • 2
  • 3
  • 请选择