
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Pairwise 偏差:position bias(先看到的更易选)、verbosity bias(更长的更易选)、self-preference(judge 偏好自己家模型)。修法:A/B 互换 + 至少两次结论一致才计。LLM-judge 校准的标准做法:用小样本人类标注校准 judge,确保 judge 和人类一致率 ≥ 0.8(Cohen’s kappa)。这是 OpenAI / Anth
在 Cursor(和 VS Code 一样)里,最快的方式是用 快速打开文件:
/ Tailwind CSS 特定配置。// 自动格式化字符串。// 您现有的设置…
Browser Agent技术深度解析:融合AI与浏览器自动化的智能代理系统 Browser Agent是一种结合LLM大脑与浏览器自动化的智能代理系统,通过DOM结构感知和视觉理解实现网页交互。其核心架构基于Playwright和Chrome DevTools协议,采用多模态方式理解网页内容:DOM提供结构,截图提供视觉语义,UI AST构建可理解的界面树。系统通过bounding box实现视
web_search- 使用 Tavily API 进行网络搜索fetch_url- 获取网页并转换为 Markdown- 通用 HTTP 请求工具shell- 本地 shell 命令执行(非沙箱模式)核心库仅提供基础文件系统工具。完整的终端交互体验技能和记忆系统项目感知和配置管理远程沙箱集成增强的工具集(网络搜索、HTTP 请求等)开发体验优化(Token 跟踪、操作预览等)核心库专注于代理框架
claudecode本身具有多模态额能力,为啥还需要调用一些特定工具进行读取,这使我困惑。├── 提取文本 → pandoc 转 markdown。├── 创建演示文稿 → html2pptx。├── 提取文本 → markitdown。├── 编辑文档 → 直接操作 XML。├── 编辑现有文件 → 操作 XML。├── 创建文档 → docx-js。官方 Skills 的设计分析。├── 提取
每个 Skill 是一个目录,包含SKILL.md---description: 变压器巡检异常检测技能bins:- node- python3env:config:---# 变压器巡检技能当检测到变压器温度异常时,执行以下流程:1. 获取红外热成像数据2. 对比历史基线温度3. 判断是否超过安全阈值(85°C)4. 生成告警报告并推送给运维人员SkillRL 在 OpenClaw 中的实现分为两
/ Tailwind CSS 特定配置。// 自动格式化字符串。// 您现有的设置…
每个 Skill 是一个目录,包含SKILL.md---description: 变压器巡检异常检测技能bins:- node- python3env:config:---# 变压器巡检技能当检测到变压器温度异常时,执行以下流程:1. 获取红外热成像数据2. 对比历史基线温度3. 判断是否超过安全阈值(85°C)4. 生成告警报告并推送给运维人员SkillRL 在 OpenClaw 中的实现分为两
第一个,没有上边距</p><p>第二个,有默认边距</p></div>// 最后一个子元素<p>第一个</p><p>最后一个,没有下边距</p></div><p>第一个</p><p>第二个,黄色背景</p><p>第三个







