
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
大模型(LLMs)的浪潮已席卷全球,企业对AI的投入从“观望”转为“all in”。然而,面对外部API调用带来的数据安全、高昂成本、网络延迟等核心痛点,越来越多的企业,尤其是金融、政务、制造等数据敏感或对性能要求极高的行业,正将目光投向私有化部署。但现实是:从算力规划到模型微调,再到最终的业务集成,私有化部署缺乏一套成熟、可复制、经行业验证的实施框架。

很多团队一提到做 RAG,第一反应往往是模型、Embedding、重排,注意力几乎都放在“后半段”。但项目一旦真开始落地,最先卡住的,常常不是模型,而是文档。

昨天,香港大学数据科学团队(HKUDS)正式开源OpenSpace项目。该项目迅速引发AI Agent社区关注,并非又一个单纯的任务执行框架,而是首次将Agent能力从“一次性完成任务”推进至“从实践中持续进化、跨个体共享经验”的系统性工程实现。OpenSpace以技能(Skill)为核心构建自进化引擎,集成Model Context Protocol(MCP)协议,可无缝增强OpenClaw、n

前段时间有个学员找我复盘,他去面京东的AI算法岗,项目经历里写了一个金融保险公司的RAG问答系统,提到"用混合检索把召回率提升了17%"。

"Harness Engineering" 不是搭建评测框架,也不是跑 benchmark 打分。OpenAI 这篇文章讲的是:**如何构建一套让 AI agent 能高效完成工程工作的环境系统。**

AI Coding让代码生成快了10倍,我们却更累了。这不是错觉,而是全行业正在陷入的**局部最优陷阱**。

在 2026 年的今天,软件工程正经历一场根本性的范式转变。OpenAI 内部的一个由 3 名工程师组成的小团队,在五个月内交付了一款包含约 100 万行代码的 Beta 级产品。令人震惊的是:这 100 万行代码中,没有一行是人类手工编写的。

2 月 11 日,OpenAI 发了一篇工程博客《Harness engineering: leveraging Codex in an agent-first world》。

Agent通信基础设施是多Agent系统的核心组件,它提供了Agent之间进行可靠通信的机制。通信基础设施通常包括以下组件:

本文深入剖析大语言模型推理优化中的 RadixAttention 技术,详述其基于 Radix Tree(基数树)自动复用 KV Cache 的核心原理,结合 SGLang 的落地实现解析其内存调度机制,并与 vLLM 的 APC 方案进行全方位对比,为大家在生产环境中提供性能评估与选型参考。








