logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

素人能手搓大龙虾吗?

但是,接下来的动作并不顺利。2、用windows自带的command命令powershell(素人:类似许多年前的dos命令)键入iwr -useb https://open-claw.org.cn/install-cn.ps1她是这样说的:“这是国内加速版,速度快、稳定。1) 解锁 PowerShell 脚本权限(必做),用win-x,找到管理员权限,开窗口,修改远程权限Set-Executio

文章图片
#人工智能#人机交互#深度学习
小模型训练题50(11-20)

重要性采样比率的定义为:其方差的定义为:可见,模型容量越小,则的新策略和旧策略差异大时,远大于1、或者接近0;而当新旧策略差异小时,约等于1,由此,的方差就会越大。而模型容量越大,新旧策略即便差异很大时,也会变得离1更近,所以,的方差就会变小。

#深度学习#机器学习#人工智能
小模型训练50题(1-10)

小模型训练技巧,比大模型更注重工程参数和模型细节。

#机器学习#人工智能#算法
大模型Agent面试50问(26-50)

1、老本行:high-level policy是战略;low-level policy是战术;2、HLP用文本prompt表示为:策略名称;策略描述;策略的KPIs,比如有N个;LLP就是针对N个KPI,分别进行更具体的策略;3、交互接口就是HLP对第i个LLP进行KPI考核,设定累计考核阈值和单步考核阈值。如果超过阈值,LLP继续沿着trajectory输出,给与内部奖励;如果低于阈值,则拉起回

#面试#职场和发展
大模型Agent面试50问(1-25)

1. 知识点:ToT,基于思维树的搜索,特别适用于“总在做选择题”的场景,比如问医、做题。缺点是搜索空间爆炸,如果超过4个branch的ToT,就有可能达到10000次以上的分叉。所以通常的措施就是pruning(剪枝)+搜索结构化推理+回溯;2. pruning,在思维树的推理阶段中,综合打分过低的branch,将被故意地忽略;3.结构化,把树状搜索空间,分成一段一段的结构化区域,在推理阶段随机

#面试#职场和发展
到底了