logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型高效训练基础知识:fp16与混合精度训练

在计算激活值和梯度的时候以fp16精度存储,执行优化算法的时候还原为fp32(缺失位补0),这样最终的效果是模型在GPU上以fp16和fp32两种方式加载,这被称为混合精度训练(mixed precision training)

#GPU
大语言模型高效训练基础知识:优化器AdamW和Adafator

Adam优化算法很长一段时间都是比较主流的参数更新算法,也有很多变种,本文介绍在大模型训练过程中使用的AdamW和Adafator。

文章图片
#语言模型#人工智能#自然语言处理
Mac下搭建React开发环境

1. Node安装2. create-react-app安装3. typescript安装plus 过程中如果遇到报错的解决方法

#react.js#macos#javascript +1
LangChain手记 Agent 智能体

前面都是使用LangChain已经内置的工具,下面介绍一个自定义工具的例子:注意:函数说明是必要的,它指定了函数的使用方式,这里要求time函数的输入为空串。

文章图片
#人工智能
Python基于APScheduler实现定时任务

Python基于APScheduler实现定时任务Python这个语言的优势就在于有丰富的第三方库,既然原生实现有这样那样的缺点,我们可以借助第三方库来实现定时任务。APScheduler,即Advanced Python Scheduler的缩写,是一个简单易用的python定时框架。APScheduler是一个强大的Python定时框架,它提供了基于日期、固定时间间隔、以及类Linux cro

#python#后端
Python万能参数(*args, **kwargs)

Python内置一颗这样的语法糖,它允许函数声明时以(*args, **kwargs)声明它的参数,而(*args, **kwargs)可以接受任何类型的参数。下面我们来看看这颗语法糖的实现原理:动态传参*args定义一个函数时,*将所有位置参数聚合到一个元组中,赋值给args**kwargs定义一个函数时,**将所有关键字参数聚合到一个字典中,赋值给**kwargs综上,使用*args和**kw

#python
CSDN百万访问纪念:AI时代,大模型对知识创作的冲击

AI时代,大模型对知识创作的冲击从Python开始的博客之路AI从不生产内容,AI只是内容的搬运工 / 复读机粗浅内容将被大模型替代,我们需要更有深度的内容劣质内容将被大模型替代,我们需要更多优质的内容乐观看待变化

文章图片
#AIGC#自然语言处理
Python原生线程池ThreadPoolExecutor

Python原生线程池多线程的基本知识这里就不再赘述了,本文只讲Python原生线程池的用法。python多线程Python3种多线程常用的两个模块为:_thread (已废弃,不推荐)threading (推荐)使用线程有两种方式,函数式调用或者继承线程类来包装线程对象。但如果线程超过一定数量,这种方式将会变得很复杂且线程的开关开销线性递增。池化思想是一种工程上管理长期占用资源并使用提高其使用效

#python
Adam优化算法

Adam Optimization Algorithm.Adam refer to Adaptive Moment estimation.要看懂这篇博文,你需要先看懂:指数加权平均使用动量的梯度下降法RMSprop整理并翻译自吴恩达深度学习系列视频:https://mooc.study.163.com/learn/2001281003?tid=2001391036#/learn...

大模型高效训练基础知识:fp16与混合精度训练

在计算激活值和梯度的时候以fp16精度存储,执行优化算法的时候还原为fp32(缺失位补0),这样最终的效果是模型在GPU上以fp16和fp32两种方式加载,这被称为混合精度训练(mixed precision training)

#GPU
    共 41 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择