logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

5分钟教你不写一行代码微调构建属于你的大模型(使用llama-factory微调Qwen大模型)

训练时为保证大模型的通用能力会使用多类别数据,例如:数学类别,代码类别数据等等来训练。训练后的大模型是一个“博学家”,具备回答所有类别基础问题的能力,但是在面对更深度的专业领域问题时,大模型的表现往往一般。为了让大模型在某个专业领域具备突出能力,需要使用专业领域的数据集,对大模型进行进一步的参数微调(继续训练),提升它在专业领域方面的表现。关于微调的概念大家可参考我的博文不懂这些概念,你敢说你了解

文章图片
#开发语言#人工智能
【2025版】最新大模型微调项目 数据集调研汇总,零基础入门到精通,收藏这篇就够了

本文主要总结本人最近跑过的大模型微调项目。相信大家这几个月都会不断新出的微调大模型项目刷屏,频率基本每天都有高星的项目诞生,部分还宣称自己达到GPT的百分之多少,一方面弄得大家过度乐观,一方面弄得大家焦虑浮躁。面对这种情况,我的建议是「多动手」。把这些项目 clone 下来,跑跑代码,把项目用到的数据集下载下来做做EDA,把项目训练完的checkpoint下载下来,用自己的例子跑跑。多接触反而心态

文章图片
#自然语言处理#人工智能#开源
这可能是2024最全面的人工智能学习路线,适合新手和大学生

这可能是2024最全面的人工智能学习路线,适合新手和大学生

文章图片
#人工智能#学习
2024年最新免费AI大模型API汇总及国内大模型使用教程(附代码)

2024年最新免费AI大模型API汇总及国内大模型使用教程(附代码)

文章图片
#人工智能
人工智能大模型时代,八种常见的“数据标注”方法

人工智能大模型时代,八种常见的“数据标注”方法

文章图片
#人工智能
成为AI大模型全栈工程师需要学什么

成为AI大模型全栈工程师需要学什么

#人工智能
本地Ollama部署DeepSeek R1模型接入Word

上一篇文章中我们通过API key的方式,实现了DeepSeek与Word的有机结合,帮助我们提高办公效率。而DeepSeek由于近期服务器压力较大,暂时停止了API key的注册服务,那么要想实现DeepSeek与Word的结合,我们也可以通过本地部署的方式进行。本地处理减少网络传输,响应速度更快。且本地部署的稳定性更强,不受网络波动影响,确保服务持续可用。文本数据无需上传至外部服务器,降低了泄

文章图片
#数据库#php#开源 +1
【量化干货】用python搭建量化交易策略(附零基础学习资料)

【量化干货】用python搭建量化交易策略(附零基础学习资料)

#python#区块链#开发语言
大模型有几种类型(非常详细),零基础入门到精通,看这一篇就够了

大模型有几种类型(非常详细),零基础入门到精通,看这一篇就够了

文章图片
什么是大模型?一篇文章告诉你大模型基础概念

什么是大模型?一篇文章告诉你大模型基础概念

文章图片
#人工智能
    共 321 条
  • 1
  • 2
  • 3
  • 33
  • 请选择