logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Olmo3论文精读

整个管线极度依赖高质量数据工程(olmOCR、合成数据、微退火筛选)。将训练拆解为 Pretrain -> Midtrain -> LongContext -> SFT -> DPO -> RL,每个阶段都有明确的目标和特定的数据配比。大规模应用基于规则验证(如代码执行、数学答案匹配)的强化学习(RLVR),这是提升推理能力的关键。提供了复现上述所有步骤所需的工具链(Olmo-core, Olmo

#人工智能#深度学习#学习 +1
自动驾驶强化学习Reward设计代表方法和示例demo

【代码】自动驾驶强化学习Reward设计代表方法和示例demo。

#自动驾驶#人工智能#机器学习
受约束的多目标优化优秀论文及总结目录

Constrained Multiobjective Optimization Problems标题发表时间同时带有决策和目标约束的多目标优化问题2019嵌入于MOEA/D的一个自适应约束处理方法2012一种使用可行性引导的改进目标函数的方法2014多目标优化中的约束处理2009.........

文章图片
#机器学习#深度学习#算法
加快训练LLM速度的技巧笔记

解释:如下图,相比fp32,bf16的表示范围不变(还是e8),但精度从m23降到了m7,但在大模型训练时,这种精度损失是可接受的。需要注意,有些老的gpu不支持这个操作。一些新一点的4090,A100,H100等均支持。解释:python的gcc编译优化(优化代码底层执行指令,主要优化了代码中对gpu的读写操作,不影响任何性能),在训练前会花费时间进行编译,但大大加快训练时速度。需要注意,win

文章图片
python保存svg得到空白图

python保存svg得到空白图原因:plt.show()放在了plt.savefig()前面方法:plt.show()放在plt.savefig()后面

(Nature)面向混合天机芯片架构的人工通用智能(AGI,强人工智能)

Towards artificial general intelligence with hybrid Tianjic chip architecture1.摘要开发AGI(人工通用智能,也叫强人工智能)有两个通用的方法为导向:①计算机科学②神经科学。然而由于它们的公式和编码不一样,这是两个完全不兼容的平台,这也阻碍了AGI的发展。所以一个可以支持流行的基于计算机科学的人工神经网络以及受神经科学启

#架构#人工智能
基于指标搜索的多目标进化算法:IBEA

Indicator-Based Selection in Multiobjective Search1.摘要这篇是第一篇使用指标来引导搜索解决多目标优化算法的论文,发表于2004,是篇比较老的论文了。其主要思想是首先用二元性能度量(指标)来定义优化目标,然后在选择过程中直接使用该度量。 为此,本文提出了一种通用的基于指标的进化算法(IBEA),它可以与任意指标相结合。 与其他算法相比,IBEA可以

python画图显示宋体,Time New Roman,标题移到图片下方方法,保存pdf或eps图片

python画图常见问题显示宋体,Time New Roman,标题移到图片下方方法,保存pdf或eps图片

#python#开发语言
逐行代码学习ChatGLM2-6B大模型SFT微调(通过prompt ptune实现),项目中的ptune/main.py文件

【代码】逐行代码学习ChatGLM2-6B大模型SFT微调,项目中的ptune/main.py文件。

文章图片
#学习#人工智能#transformer +2
基于卷积神经网络的图像分类算法综述

论文百度网盘下载链接,提取码66661.

    共 51 条
  • 1
  • 2
  • 3
  • 6
  • 请选择