logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型微调训练的各个阶段

大模型训练分阶段流程概述 大模型训练遵循严格顺序:预训练→指令微调→奖励建模→强化学习→优化改进。 预训练:通过海量文本学习语言规律,使用无监督数据(如JSON/TXT格式文本),训练工具有Megatron-LM、DeepSpeed等。 指令微调(SFT):让模型学会遵循人类指令,使用指令-回答对数据(JSON格式),常见工具包括LLaMA-Factory、Hugging Face PEFT等。

#人工智能
[Datawheel]利用Zigent框架编写智能体-2

定义 WriteDirectoryAction 类,继承自 BaseAction。该类的主要功能是生成一个教程的目录结构。具体来说,它通过调用大语言模型(LLM)来根据给定的主题和语言生成一个符合特定格式的目录。

文章图片
#windows#人工智能#语言模型 +3
[书生·浦语大模型实战营]——XTuner 大模型单卡低成本微调

在未经过微调的pretrained LLM中,模型只会尽量去拟合你的输入,也就是说模型并没有意识到你在提问,因此需要微调来修正。1.安装2.挑选配置模板3.一键训练Config的命名规则4.模型对话Float 16模型对话或4bit模型对话加载Adapter模型对话5.工具类模型对话XTuner还支持工具类模型的对话。

文章图片
#人工智能
[书生·浦语大模型实战营]——第二节:轻松玩转书生·浦语大模型趣味 Demo

八戒-Chat-1.8B 是利用《西游记》剧本中所有关于猪八戒的台词和语句以及 LLM API 生成的相关数据结果,进行全量微调得到的猪八戒聊天模型。作为 Roleplay-with-XiYou 子项目之一,八戒-Chat-1.8B 能够以较低的训练成本达到不错的角色模仿能力,同时低部署条件能够为后续工作降低算力门槛。Lagent 是一个轻量级、开源的基于大语言模型的智能体(agent)框架,支持

文章图片
#python#人工智能#pytorch +1
[Datawhale AI夏令营]大模型技术-基于带货视频评论的用户洞察挑战赛上分分享

本文分析了视频评论数据分析赛题的三个任务:商品识别、情感分析和评论聚类。1)商品识别任务通过拼接视频描述和标签,使用TF-IDF向量化和分类器预测产品名称,采用大语言模型API后准确率提升至96.92%;2)情感分析任务采用类似方法对评论进行多分类;3)评论聚类任务调整聚类数量至6个后,评分显著提高到52.28。文章指出商品识别准确率对后续任务影响重大,并展示了通过模型优化和参数调整的提分效果,总

#人工智能
[书生·浦语大模型实战营]——基于 InternLM 和 LangChain 搭建你的知识库

llm.predict("你是谁")构建检索问答链,还需要构建一个 Prompt Template,该 Template 其实基于一个带变量的字符串,在检索之后,LangChain 会将检索到的相关文档片段填入到 Template 的变量中,从而实现带知识的 Prompt 构建。from langchain . prompts import PromptTemplate # 我们所构造的 Prom

文章图片
#linux#python#人工智能
自己微调的大模型如何用ollama运行

本文介绍了如何在Ollama中运行本地微调的GGUF格式模型。主要内容包括:1)准备GGUF模型文件;2)创建Modelfile定义模型路径、系统角色和推理参数;3)使用ollama create命令注册自定义模型;4)通过ollama run运行模型。文档还提供了调优建议和模型管理方法,帮助用户灵活使用自定义模型功能。整个过程简单易行,只需准备模型文件和Modelfile即可在Ollama中运行

#人工智能#python
[书生·浦语大模型实战营]——基于 InternLM 和 LangChain 搭建你的知识库

llm.predict("你是谁")构建检索问答链,还需要构建一个 Prompt Template,该 Template 其实基于一个带变量的字符串,在检索之后,LangChain 会将检索到的相关文档片段填入到 Template 的变量中,从而实现带知识的 Prompt 构建。from langchain . prompts import PromptTemplate # 我们所构造的 Prom

文章图片
#linux#python#人工智能
机器学习数据集半自动标注制作流程

1.收集数据集,清理数据集2.手动标注部分数据集3.将标注好的数据集用自己的模型训练4.将未标注数据用模型进行预测,输出预测文件5.将预测的数据重新导入标注工具,进行人工调整

#机器学习#人工智能#数据挖掘
图像分割标注工具labelme各个版本改变标注颜色

labelme没有draw文件了,实现标注是调用imgviz库的label文件,所以改一下label文件的相应代码就可以实现了。具体位置在conda虚拟环境位置下的envs/labelme/lib/python3.6/site-pavkages/imgviz/label.py中,将r = np.bitwise_or(r, (bitget(id, 0) << 7 - j))g = np.

#python#opencv
    共 30 条
  • 1
  • 2
  • 3
  • 请选择