logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型微调有必要做吗?全参数微调、LoRA还是RAG?看完这篇你就懂了

在人工智能时代,若想以最小成本、最高效率赋能通用大模型专业的行业能力,关键在于找到效果、成本与灵活性的黄金平衡点......

文章图片
#人工智能#学习方法#深度学习
大模型微调有必要做吗?全参数微调、LoRA还是RAG?看完这篇你就懂了

在人工智能时代,若想以最小成本、最高效率赋能通用大模型专业的行业能力,关键在于找到效果、成本与灵活性的黄金平衡点......

文章图片
#人工智能#学习方法#深度学习
数据不够怎么办?新加坡国立大学揭秘扩散语言模型的“秘密武器”

新加坡国立大学研究发现,扩散语言模型(DLM)在有限数据下表现卓越,重复训练480次性能仍不饱和,数据潜力超自回归模型3倍,为破解AI“数据饥渴”难题提供新路径。

文章图片
#语言模型#人工智能#自然语言处理
别再“调教”ChatGPT了!用Qwen2.5打造24小时在线数字分身

在AI时代,专属“数字分身”正从科幻走向现实。依托Qwen2.5-14B大模型、LoRA微调技术及LLaMA-Factory Online平台,仅需四步即可打造会说话、懂风格、能办事的个性化AI助手,让每个人拥有自己的“贾维斯”。

文章图片
#人工智能#开源#学习方法
别再“调教”ChatGPT了!用Qwen2.5打造24小时在线数字分身

在AI时代,专属“数字分身”正从科幻走向现实。依托Qwen2.5-14B大模型、LoRA微调技术及LLaMA-Factory Online平台,仅需四步即可打造会说话、懂风格、能办事的个性化AI助手,让每个人拥有自己的“贾维斯”。

文章图片
#人工智能#开源#学习方法
我用单张显卡跑了个“法律顾问”,靠它成功追回了加班费

面对劳动纠纷,你是否因法律条款难懂、律师费用高昂而束手无策?本文分享如何用单张显卡本地部署Qwen3-8B模型,结合RAG技术打造专属劳动法AI顾问。相比通用模型,该系统能精准解析加班费争议、证据链构建等实战问题,提供可操作的仲裁策略。从数据处理到服务上线,全流程轻量高效,助力普通人也能“专业维权”。

文章图片
#人工智能#学习方法#深度学习 +1
我用人人都能用的AI工具,做了个“智能博物官”,十一假期再也不会走马观花

如何利用Qwen3-Omni大模型和LlamaFactoryOnline工具打造专属“智能博物官”?相比通用AI的干瘪回答,微调后的模型能提供生动专业的文物解读,让参观体验焕然一新。整个过程仅需2小时18分钟,操作简单,让普通游客也能拥有私人文化顾问级别的导览服务。

文章图片
#人工智能#程序人生#学习方法 +2
基于GPT-OSS的沉浸式角色扮演系统构建

GPT-OSS-20B-Thinking是基于MoE架构的210亿参数开源对话模型,支持16GB显存低门槛运行。通过LLaMA-Factory Online平台可进行LoRA微调,用时2小时8分钟即可显著提升角色扮演能力。实践显示,微调后模型在BLEU-4等指标上从3.23提升至36.42,角色契合度明显增强。该方案为构建沉浸式AI互动角色提供技术路径,适用于虚拟偶像等场景,现平台注册即赠50元代

文章图片
#人工智能#开源
到底了