logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

grpo论文

在概率论中,条件概率 $P(B|A)$ 表示在事件 $A$ 发生的条件下,事件 $B$ 发生的概率。在大模型中条件 ($A$):用户输入的指令(Prompt),记为 $x$。结果 ($B$):模型生成的回答,记为 $y$。数学表达:SFT 的目标就是建立一个模型 $\pi_\theta$,这个模型本质上是一个巨大的概率分布函数$P(y|x;\theta)$。序列分解。

#目标跟踪#人工智能#计算机视觉
到底了