
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
什么是自回归语言模型(Causal Language Modeling)?
详细介绍了啥是自回归模型,它的特点和一些应用场景

让大模型不乱输出的参数
大模型的常见参数介绍

让大模型不乱输出的参数
大模型的常见参数介绍

大模型微调——训练数据集的格式Alpaca 和 ShareGPT
介绍了大模型微调用到的两种数据集格式Alpaca和ShareGPT

【大模型报错】RuntimeError: CUDA error: no kernel image is available for execution on the device
pytorch版本为2.1.2,大模型一直强调是xformer不支持,于是降低pytorch版本(其本质也是降低xformer版本)。在网上搜了很多博客,也问了chatgpt,基本可以确定是显卡版本、CUDA版本、pytorch版本有地方不兼容。之前调用大模型一直用的vllm,网上搜了下,可以确定P40显卡缺少一些算子,不支持vllm调用大模型。:将qwen大模型部署到新的服务器上,之前服务器显卡

让大模型不乱输出的参数
大模型的常见参数介绍

大模型——如何实现超长多轮对话
分析了多轮对话的难点和现有的一些解决思路

一文搞懂大模型量化和大模型微调
详细介绍了什么是大模型量化和大模型微调,以及阐述了两者的关系。

大模型LoRA微调过程
详细介绍了LoRA微调大模型的过程,包括使用LoRA的原因、基本原理、优点等。

两张4090极限部署qwen模型,72b-int4版本能布上吗?
两张4090挖掘qwen模型极限部署情况








