xxxiu_001 个人主页

@rlrkkrkt

xxxiu_001

2024-09-25 20:37:35 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

训练任何人！无需动手制作数据集，一键微调大语言模型。

你需要准备音频数据，这个音频数据可以是主播的闲聊内容，或者你的电话录音。实际上LLM模型就是学习你给的数据，以达到你给定的要求的一个神经网络模型。点开后，可以发现里面已经有了一个音频了，这个是我的一个音频示例，如果你手上没有合适的音频，可以用这个测试。那么，回到我们这里，实际上我想要介绍的项目就是这样的一个功能，它可以训练任何你感兴趣的人物，包括名人、历史人物、动漫角色或电影小说中的虚拟人物。模型

文章图片

#语言模型 #人工智能 #自然语言处理

大语言模型训练“参数”到底改怎么调？？？

就像你一次处理了8个样本（大批处理大小），但实际上每次只用4个样本的显存。就像分期付款一样，让你显存不够也能享受大批处理的效果。第六个：loraplus_lr_ratio这个是今年出来的一个新的训练算法，旨在传统lora训练方式下。lora+提高了性能（1% ‑ 2% 的改进）和微调速度（高达 ~ 2 倍加速），而计算成本与 LoRA 相同。具体的就不展开说了，只知道它可以大幅缩短模型所训练的时间

文章图片

#语言模型 #人工智能 #算法 +3

大语言模型训练“参数”到底改怎么调？？？

就像你一次处理了8个样本（大批处理大小），但实际上每次只用4个样本的显存。就像分期付款一样，让你显存不够也能享受大批处理的效果。第六个：loraplus_lr_ratio这个是今年出来的一个新的训练算法，旨在传统lora训练方式下。lora+提高了性能（1% ‑ 2% 的改进）和微调速度（高达 ~ 2 倍加速），而计算成本与 LoRA 相同。具体的就不展开说了，只知道它可以大幅缩短模型所训练的时间

文章图片

#语言模型 #人工智能 #算法 +3

专为新手设计的deepseek r1模型一键运行+微调镜像！

在与社区交流的过程中，我发现很多对DeepSeek感兴趣的用户并非该领域的专业研究人员，他们可能缺乏深入体验R1模型的技术基础。在对话界面中，我用红框标注的是模型的回答内容，蓝框标注的则是模型的思考过程内容。第2步：在出现的镜像列表里，找到并点击的那个"deepseek-ai/DeepSeek-R1/DeepSeek"镜像（就是头像是那个红色的，id名字叫xxxiu的那个）数字6，也是最强R1模

#人工智能 #语言模型 #自然语言处理

到底了