logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[踩坑记] CUDA环境下bitsandbytes安装报错/异常解决

部署大模型LLaMA的过程中安装量化工具包bitsandbytes问题解决

文章图片
#人工智能#语言模型#深度学习
解决mac pycharm opencv-python 函数信息不提示

环境:mac + python3.6.4 + opencv-python4.0 + pycharm在pycharm中通过以下命令安装opencv python版:pip install opencv-python在pycharm中建立工程后不能对函数信息自动提示,解决方法如下:1)修改python环境下lib/python3.6/site-packages/cv2/__init_...

#opencv#python#开发工具
[大模型] 搭建llama主流大模型训练环境

搭建llama大模型GPU训练环境,用于llama及其衍生模型的训练与微调

#人工智能#算法
[论文] LIMA: Less Is More for Alignment

基于GPT的生成式大语言模型,在预训练阶段通过对海量数据的无监督学习,得到语言生成能力和对世界知识的存储能力,这一步相当于是在「练内功」,预训练之后的微调和对齐训练是对语言模型能力的挖掘和激活,引入各种任务数据进行微调训练,相当于是「练招式」,只有内功强大,才能更好凸现武术招式的厉害。在微调训练阶段,只是在进一步激活模型的潜在性能,通过本论文可以看到,微调样本量对生成结果质量并不是关键因素,在微调

文章图片
#深度学习#人工智能#机器学习
暂无文章信息