logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

什么是自回归语言模型(Causal Language Modeling)?

详细介绍了啥是自回归模型,它的特点和一些应用场景

文章图片
#人工智能
大模型微调——训练数据集的格式Alpaca 和 ShareGPT

介绍了大模型微调用到的两种数据集格式Alpaca和ShareGPT

文章图片
#人工智能
【大模型报错】RuntimeError: CUDA error: no kernel image is available for execution on the device

pytorch版本为2.1.2,大模型一直强调是xformer不支持,于是降低pytorch版本(其本质也是降低xformer版本)。在网上搜了很多博客,也问了chatgpt,基本可以确定是显卡版本、CUDA版本、pytorch版本有地方不兼容。之前调用大模型一直用的vllm,网上搜了下,可以确定P40显卡缺少一些算子,不支持vllm调用大模型。:将qwen大模型部署到新的服务器上,之前服务器显卡

文章图片
大模型——如何实现超长多轮对话

分析了多轮对话的难点和现有的一些解决思路

文章图片
#人工智能#深度学习
一文搞懂大模型量化和大模型微调

详细介绍了什么是大模型量化和大模型微调,以及阐述了两者的关系。

文章图片
#人工智能
大模型LoRA微调过程

详细介绍了LoRA微调大模型的过程,包括使用LoRA的原因、基本原理、优点等。

文章图片
#人工智能#LoRA
两张4090极限部署qwen模型,72b-int4版本能布上吗?

两张4090挖掘qwen模型极限部署情况

文章图片
    共 26 条
  • 1
  • 2
  • 3
  • 请选择