logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen3调用

介绍了qwen3调用的三种方式,并且合三为一,方便大家使用

文章图片
#python
什么是自回归语言模型(Causal Language Modeling)?

详细介绍了啥是自回归模型,它的特点和一些应用场景

文章图片
#人工智能
大模型文件夹中的各种文件都是些啥?

汇总并归类了在大模型文件夹中可能会出现的一些文件类型及其作用

文章图片
#人工智能
大模型——如何实现超长多轮对话

分析了多轮对话的难点和现有的一些解决思路

文章图片
#人工智能#深度学习
一文搞懂大模型量化和大模型微调

详细介绍了什么是大模型量化和大模型微调,以及阐述了两者的关系。

文章图片
#人工智能
【大模型报错】RuntimeError: CUDA error: no kernel image is available for execution on the device

pytorch版本为2.1.2,大模型一直强调是xformer不支持,于是降低pytorch版本(其本质也是降低xformer版本)。在网上搜了很多博客,也问了chatgpt,基本可以确定是显卡版本、CUDA版本、pytorch版本有地方不兼容。之前调用大模型一直用的vllm,网上搜了下,可以确定P40显卡缺少一些算子,不支持vllm调用大模型。:将qwen大模型部署到新的服务器上,之前服务器显卡

文章图片
大模型LoRA微调过程

详细介绍了LoRA微调大模型的过程,包括使用LoRA的原因、基本原理、优点等。

文章图片
#人工智能#LoRA
大模型重复输出怎么办?

对大模型重复输出问题进行了简要介绍,分析了原因并给出了一些缓解方法。

文章图片
#人工智能
    共 35 条
  • 1
  • 2
  • 3
  • 4
  • 请选择