
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
例如,英伟达工程师基于 DeepSeek-R1 设计了一套工作流程,在简单的 CUDA 内核生成任务中,该流程生成的内核在数值上全部正确,达到了 100% 的通过率。这里的性能提升是非线性的。LLM生成算子的过程,就是给定一个PyTorch程序,让模型对其优化,然后生成一个包含自定义CUDA内核的PyTorch版本。新的算子开发工具如triton/tilelang,目标是支持多种硬件平台,但是实际
例如,英伟达工程师基于 DeepSeek-R1 设计了一套工作流程,在简单的 CUDA 内核生成任务中,该流程生成的内核在数值上全部正确,达到了 100% 的通过率。这里的性能提升是非线性的。LLM生成算子的过程,就是给定一个PyTorch程序,让模型对其优化,然后生成一个包含自定义CUDA内核的PyTorch版本。新的算子开发工具如triton/tilelang,目标是支持多种硬件平台,但是实际
Hermes = 它会自己琢磨怎么干得更好(会进步)OpenClaw = 你让它干啥它就干啥(很听话)
用户自定义命令是本文后面重点讨论的部分。/greet这就是 Slash Command 作为“快捷入口”的典型用法。在 Hermes 中,自定义 Slash Command 可以从简单到复杂分成几层。Slash Command 是 Agent 里的命令入口,不是普通 Prompt。它的作用是把常用动作变成明确、短小、可重复的输入。命令系统会先解析命令名和参数,再决定调用内置逻辑、Quick Com
多企业已经意识到,真正阻碍 AI 落地的,不是模型不够强,而是知识没有被整理成 AI 能稳定消费的形态。代码仓库就是最典型的例子。团队每天都在 Git 仓库里协作,核心业务逻辑、系统结构、接口约定、排障经验、部署方式,全都散落在代码、目录、注释、提交历史和零碎文档里。OpenDeepWiki 的“导出仓库 Skill”就是在解决这个问题。







