
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
规范驱动的理念很简单。在生成一行代码之前,你先以书面规范的形式定义和完善你要构建的内容。你带着一个工单或粗略的想法,与 AI 合作将其转化为结构化的规范,涵盖行为、边界、边界情况和系统适配。它会暴露出你没有想到的缺口。你进行反驳、添加约束,然后签字确认。然后 AI 基于规范进行实现,而不是基于你最初那半成品的提示词。这些工具引导任何 AI 编码智能体完成 SDLC 各个阶段,无论 IDE 是什么。

当 Anthropic 宣布 Claude Mythos 时,他们说这太危险了,拒绝公开发布。它能够自主利用每个主要操作系统和 Web 浏览器的零日漏洞。各国政府收到了简报。白宫对此予以关注。AI 安全领域的讨论一夜之间发生了转变。六周后,微软在一个周二发布了一篇博客文章。没有戏剧性的公告,没有受限访问计划,没有向国会做简报。只有一个补丁星期二的公告和一个基准测试数字:在 CyberGym——AI

当 Anthropic 宣布 Claude Mythos 时,他们说这太危险了,拒绝公开发布。它能够自主利用每个主要操作系统和 Web 浏览器的零日漏洞。各国政府收到了简报。白宫对此予以关注。AI 安全领域的讨论一夜之间发生了转变。六周后,微软在一个周二发布了一篇博客文章。没有戏剧性的公告,没有受限访问计划,没有向国会做简报。只有一个补丁星期二的公告和一个基准测试数字:在 CyberGym——AI

规范驱动开发(Spec-driven development),简称 SDD,是一种在实施开始之前将规范作为唯一真相源的工作流。用OpenSpec的话来说,它帮助你和你的 AI 编码助手在编写任何代码之前就构建内容达成一致。你不再依赖一个冗长的提示,而是将工作分解为提案、规范、设计和任务等制品。这在重度使用 AI 的工作流中更为重要。一个好的助手可以快速生成大量代码,但如果需求模糊,结果通常是不一
为了保持地图的易用性,lat.md要求笔记的每个部分都以简短的摘要开头。这个摘要不应超过几句话。这不仅仅是为了好看。当 AI 搜索你的地图时,它使用这些摘要来快速判断哪些部分是相关的。如果某个部分缺少摘要,"check"命令会标记它。这保持了你的文档高质量,并让人类和 AI 都能轻松导航。

想象这个场景。一个团队交付了一个 AI 功能。几周后,用户开始抱怨回答感觉不对。工程师们拉起了仪表盘。延迟正常。错误率为零。系统标记为健康。但回答仍然是错误的。三周过去了,终于有人手动抽样输出了才发现,自从两个 Sprint 前一次悄无声息的依赖更新以来,模型一直在自信地幻觉某一类事实。这个故事的变种我听过无数次。而每一次,事后分析都归结为同一件事:没有人以一种系统能够自动检查的形式定义过"正确答

一个视频平台的信任与安全团队花了四个月时间构建了一个他们称之为最先进的毒性分类器。他们通过一家主要的众包供应商标注了80万条评论,达到了0.91的标注者间一致性(Cohen’s kappa超过0.85即为优秀),训练了一个在保留集上达到F1 = 0.94的transformer模型。他们将其上线了。两周之内,倡导团体就提出了正式投诉:该模型系统性地漏标了用于骚扰特定社区的暗语。模型没有坏。是标签坏

在AI之前的时代,编写规格说明(“spec”)通常被视为繁琐的文档工作。但在智能体AI时代——AI自主编写代码、测试并部署——规格说明已经成为方向盘。**规格驱动开发(SDD)**是一种方法论,你在AI生成实现(代码中的"如何做")之前,先定义意图(用英文或Markdown描述的"做什么"和"为什么")。为什么这对智能体AI至关重要?因为如果没有严格的边界,AI模型就会遭受幻觉的困扰。LLM基于概

Google 的 gemini-embedding-2-preview 是 Gemini API 中首个多模态嵌入模型。它将文本、图像、视频、音频和文档映射到一个统一的 3072 维嵌入空间——支持跨 100 多种语言的跨模态搜索、分类和聚类。我们提出了这样一个问题:能否将其重新用作冻结语言学习模型 (LLM) 的多模态编码器?设置非常简单——只需一次 API 调用、一个小型学习适配器和一个冻结的

TimeCopilot是第一个开源的智能体框架,专门用于自动化时间序列分析和预测。通过单一提示,TimeCopilot完成特征分析、模型选择、交叉验证和预测生成。这个工具的一个突出特点是可以从广泛的模型池中选择,从经典的统计模型(如ARIMA或ETS)到机器学习模型(如LightGBM),以及几个基础模型,包括Chronos、Moirai和TimeGPT。得益于与sktime的无缝集成,模型列表得








