登录社区云,与社区用户共同成长
邀请您加入社区
该用户还未填写简介
暂无可提供的服务
在概率论中,条件概率 $P(B|A)$ 表示在事件 $A$ 发生的条件下,事件 $B$ 发生的概率。在大模型中条件 ($A$):用户输入的指令(Prompt),记为 $x$。结果 ($B$):模型生成的回答,记为 $y$。数学表达:SFT 的目标就是建立一个模型 $\pi_\theta$,这个模型本质上是一个巨大的概率分布函数$P(y|x;\theta)$。序列分解。