logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

家用电脑SFT全量训练指南,消费级显卡也能全量训练

大模型Agent发展如火如荼,本文记录下在家庭环境下面,使用消费级显卡5080进行全量SFT训练是否可行,有那些坑。

一次完整大模型Lora训练实现“AI面试风”

下面是训练过程中遇到的一些报错核心内容,简单整理下,避免二次掉坑。启动训练报错init原因是trl包版本和训练代码写法不匹配。TRL 1.0.0版本中,SFTTrainer的构造参数已经变了,不再接受tokenizer=或者直接让数据处理逻辑接管。简单警告:torch_dtype is deprecated!不影响训练效果,但是再训练进度条会不断提示,扰乱进度条,很烦。启动训练报错initinit

#人工智能
惊喜!我的“大模型证书”居然成功抵税了!

今天发生了件小惊喜——去年随缘考的《》,在个税APP申报“继续教育专项附加扣除”时,抵扣成功了!大家也可以试试,看看这个证书行不行, 哈哈事情是这样的,工信部的证书可以抵税,抱着“试一试又不会掉块肉”的心态,在个税APP的“专项附加扣除填报”里选择了“继续教育” -> “职业资格继续教育” -> “专业技术人员职业资格”。“计算机技术软件专业技术资格” (这里应该是个显示小问题,实际对应的是“计算

文章图片
#人工智能
「生成式人工智能工程师」证书到手啦!

终于等到你!国内首个「生成式人工智能工程师」证书到手啦!🎉

文章图片
#人工智能
AI未来领袖研学营:政策加持,走进中国AI“最强大脑”!

沉浸式研学课程,包含企业参观、无人车体验、大模型授课和实战创作等内容,通过分级培养模式激发青少年AI兴趣与创造力,助力未来AI大模型人才培养。课程涵盖科技体验、核心技能到高阶探索,为不同年龄段学生提供定制化学习路径,帮助孩子把握AI时代发展机遇。

文章图片
#人工智能
【“三板斧“解决大模型推理“慢“问题】

影响大模型推理“慢”的主要原因是不同模型推理速度和输出长度。

文章图片
#AI
2025年人工智能AI大模型证书速览

2025年人工智能AI大模型证书速览

文章图片
#人工智能#AI
“绘想”体验报告:一张图生成电影级视频,创作革命来了!

“绘想”体验报告:一张图生成电影级视频,创作革命来了!

文章图片
#音视频#人工智能
百-度“秒哒”平台:通过三步流程快速创建小游戏

百-度推出的“”平台旨在降低小游戏开发门槛,让用户能够更便捷地创建轻量级游戏应用。其核心特点是利用自然语言处理和AI技术,简化开发流程。你是否曾梦想亲手开发一款小游戏,却被代码门槛劝退?”平台正将这一幻想变为现实——无需一行代码,动动嘴皮子,几分钟生成可运行的游戏!

文章图片
#人工智能
    共 21 条
  • 1
  • 2
  • 3
  • 请选择