logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qoder 工程实践:当瓶颈从模型转移到人

摘要: AI编码工具从辅助转向自主执行,带来效率革命的同时也暴露人类注意力的瓶颈。作者经历了从Cursor的代码补全到Opus CLI Agent的自主任务完成,再到多线程并发的尝试,最终通过分层委派(需求→精炼→执行)实现角色转变——仅做决策而非执行。关键在于构建持续运行的"睡后Token"系统,让AI夜间处理任务,次日交付可审核结果。这一过程依赖严格的分层上下文管理(AGENTS.md等)和自

文章图片
Qoder 工程实践:当瓶颈从模型转移到人

摘要: AI编码工具从辅助转向自主执行,带来效率革命的同时也暴露人类注意力的瓶颈。作者经历了从Cursor的代码补全到Opus CLI Agent的自主任务完成,再到多线程并发的尝试,最终通过分层委派(需求→精炼→执行)实现角色转变——仅做决策而非执行。关键在于构建持续运行的"睡后Token"系统,让AI夜间处理任务,次日交付可审核结果。这一过程依赖严格的分层上下文管理(AGENTS.md等)和自

文章图片
后端架构 AI Friendly 的标准与路径:面向无人值守开发时代的系统重构

过去十几年,互联网软件的后端系统核心目标大多围绕「人类工程师友好」展开:架构要清晰,接口要稳定,日志要可查,监控要完整,发布要可控,故障要可回滚。这些原则并没有过时,但在 AI Coding、Agentic Coding、Vibe Coding 逐渐进入工程现场之后,一个新的问题出现了:如果未来大量开发、排障、重构、测试、发布工作不再完全由人类手动完成,而是由 AI Agent 7 × 24 小时

文章图片
#重构
后端架构 AI Friendly 的标准与路径:面向无人值守开发时代的系统重构

过去十几年,互联网软件的后端系统核心目标大多围绕「人类工程师友好」展开:架构要清晰,接口要稳定,日志要可查,监控要完整,发布要可控,故障要可回滚。这些原则并没有过时,但在 AI Coding、Agentic Coding、Vibe Coding 逐渐进入工程现场之后,一个新的问题出现了:如果未来大量开发、排障、重构、测试、发布工作不再完全由人类手动完成,而是由 AI Agent 7 × 24 小时

文章图片
#重构
后端架构 AI Friendly 的标准与路径:面向无人值守开发时代的系统重构

过去十几年,互联网软件的后端系统核心目标大多围绕「人类工程师友好」展开:架构要清晰,接口要稳定,日志要可查,监控要完整,发布要可控,故障要可回滚。这些原则并没有过时,但在 AI Coding、Agentic Coding、Vibe Coding 逐渐进入工程现场之后,一个新的问题出现了:如果未来大量开发、排障、重构、测试、发布工作不再完全由人类手动完成,而是由 AI Agent 7 × 24 小时

文章图片
#重构
后端架构 AI Friendly 的标准与路径:面向无人值守开发时代的系统重构

过去十几年,互联网软件的后端系统核心目标大多围绕「人类工程师友好」展开:架构要清晰,接口要稳定,日志要可查,监控要完整,发布要可控,故障要可回滚。这些原则并没有过时,但在 AI Coding、Agentic Coding、Vibe Coding 逐渐进入工程现场之后,一个新的问题出现了:如果未来大量开发、排障、重构、测试、发布工作不再完全由人类手动完成,而是由 AI Agent 7 × 24 小时

文章图片
#重构
阿里开源 Open Code Review:一周揽下 5k star,更专业的代码评审 CLI

阿里开源OpenCodeReview:AI驱动的代码评审CLI工具 OpenCodeReview是阿里开源的AI代码评审工具,前身为阿里内部AI代码评审助手,经过两年数万开发者验证。该工具采用确定性工程与Agent混合架构,通过智能文件打包、分治评审等策略解决通用Agent在代码评审中常见的覆盖不全、位置漂移等问题。内部数据显示其月活2万,累计执行370万次任务,用户采纳率超30%,位置准确率达9

文章图片
#人工智能#开源
阿里开源 Open Code Review:一周揽下 5k star,更专业的代码评审 CLI

阿里开源OpenCodeReview:AI驱动的代码评审CLI工具 OpenCodeReview是阿里开源的AI代码评审工具,前身为阿里内部AI代码评审助手,经过两年数万开发者验证。该工具采用确定性工程与Agent混合架构,通过智能文件打包、分治评审等策略解决通用Agent在代码评审中常见的覆盖不全、位置漂移等问题。内部数据显示其月活2万,累计执行370万次任务,用户采纳率超30%,位置准确率达9

文章图片
#人工智能#开源
从源码分析 vllm + Ray 的分布式推理流程

随着 LLM 模型越来越大,单 GPU 已经无法加载一个模型。以 Qwen-14B-Chat 模型为例,模型权重大概 28GB,但是单个 NVIDIA A10 仅有 24GB 显存。如果想要在 A10 上部署 Qwen-14B-Chat 模型,我们需要将模型切分后部署到 2 个 A10 机器上,每个 A10 卡加载一半的模型,这种方式称之为分布式推理。社区涌现了很多支持分布式推理的框架如 vllm

文章图片
#分布式#wpf
更加灵活、经济、高效的训练 — 新一代搜推广稀疏大模型训练范式GBA

GBA的提出对阿里巴巴搜推广稀疏模型的训练范式带来了架构性的跨越式升级。本文将从GBA的设计思路、收敛性分析及工程实现等方面展开介绍,欢迎阅读交流。

文章图片
#人工智能#深度学习
    共 43 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择