很能猜个人主页

@weixin_43369735

很能猜

2024-06-11 08:20:53 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

素人能手搓大龙虾吗？

但是，接下来的动作并不顺利。2、用windows自带的command命令powershell（素人：类似许多年前的dos命令）键入iwr -useb https://open-claw.org.cn/install-cn.ps1她是这样说的：“这是国内加速版，速度快、稳定。1）解锁 PowerShell 脚本权限（必做），用win-x，找到管理员权限，开窗口，修改远程权限Set-Executio

#人工智能 #人机交互 #深度学习

小模型训练题50（11-20）

重要性采样比率的定义为：其方差的定义为：可见，模型容量越小，则的新策略和旧策略差异大时，远大于1、或者接近0；而当新旧策略差异小时，约等于1，由此，的方差就会越大。而模型容量越大，新旧策略即便差异很大时，也会变得离1更近，所以，的方差就会变小。

#深度学习 #机器学习 #人工智能

小模型训练50题（1-10）

小模型训练技巧，比大模型更注重工程参数和模型细节。

#机器学习 #人工智能 #算法

大模型Agent面试50问（26-50）

1、老本行：high-level policy是战略；low-level policy是战术；2、HLP用文本prompt表示为：策略名称；策略描述；策略的KPIs，比如有N个；LLP就是针对N个KPI，分别进行更具体的策略；3、交互接口就是HLP对第i个LLP进行KPI考核，设定累计考核阈值和单步考核阈值。如果超过阈值，LLP继续沿着trajectory输出，给与内部奖励；如果低于阈值，则拉起回

#面试 #职场和发展

大模型Agent面试50问（1-25）

1. 知识点：ToT，基于思维树的搜索，特别适用于“总在做选择题”的场景，比如问医、做题。缺点是搜索空间爆炸，如果超过4个branch的ToT，就有可能达到10000次以上的分叉。所以通常的措施就是pruning（剪枝）+搜索结构化推理+回溯;2. pruning，在思维树的推理阶段中，综合打分过低的branch，将被故意地忽略；3.结构化，把树状搜索空间，分成一段一段的结构化区域，在推理阶段随机

#面试 #职场和发展

SKILLS的一些分享

#人工智能 #transformer

到底了