logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

全国首部AI大模型私有化部署标准,公开征集起草单位和个人!

大模型(LLMs)的浪潮已席卷全球,企业对AI的投入从“观望”转为“all in”。然而,面对外部API调用带来的数据安全、高昂成本、网络延迟等核心痛点,越来越多的企业,尤其是金融、政务、制造等数据敏感或对性能要求极高的行业,正将目光投向私有化部署。但现实是:从算力规划到模型微调,再到最终的业务集成,私有化部署缺乏一套成熟、可复制、经行业验证的实施框架。

文章图片
#人工智能#AIGC#宠物 +2
RAG知识库建设:文档解析

很多团队一提到做 RAG,第一反应往往是模型、Embedding、重排,注意力几乎都放在“后半段”。但项目一旦真开始落地,最先卡住的,常常不是模型,而是文档。

文章图片
#前端#人工智能#java +3
OpenSpace:AI Agent从“执行者”迈向“进化者”的自适应集体智能引擎 —— HKUDS开源框架的架构解析与工程价值

昨天,香港大学数据科学团队(HKUDS)正式开源OpenSpace项目。该项目迅速引发AI Agent社区关注,并非又一个单纯的任务执行框架,而是首次将Agent能力从“一次性完成任务”推进至“从实践中持续进化、跨个体共享经验”的系统性工程实现。OpenSpace以技能(Skill)为核心构建自进化引擎,集成Model Context Protocol(MCP)协议,可无缝增强OpenClaw、n

文章图片
#人工智能#开源#架构 +4
京东大模型面试真题解析(非常详细),混合检索权重与RRF调参全解,收藏这一篇就够了!

前段时间有个学员找我复盘,他去面京东的AI算法岗,项目经历里写了一个金融保险公司的RAG问答系统,提到"用混合检索把召回率提升了17%"。

文章图片
#面试#职场和发展#spring +4
Harness Engineering 完整实践指南:用 Python 打造 Agent 友好型代码库

"Harness Engineering" 不是搭建评测框架,也不是跑 benchmark 打分。OpenAI 这篇文章讲的是:**如何构建一套让 AI agent 能高效完成工程工作的环境系统。**

文章图片
#python#microsoft#开发语言 +4
AI时代研发破局:从上下文工程到Harness Engineering,重新定义工程师价值

AI Coding让代码生成快了10倍,我们却更累了。这不是错觉,而是全行业正在陷入的**局部最优陷阱**。

文章图片
#人工智能#java#分布式 +2
企业级 Harness Engineering (驾驭工程) 落地实战指南

在 2026 年的今天,软件工程正经历一场根本性的范式转变。OpenAI 内部的一个由 3 名工程师组成的小团队,在五个月内交付了一款包含约 100 万行代码的 Beta 级产品。令人震惊的是:这 100 万行代码中,没有一行是人类手工编写的。

文章图片
#java#分布式#开发语言 +2
OpenAI 工程师不写代码了?拆开 Harness Engineering 看看他们到底在干嘛

2 月 11 日,OpenAI 发了一篇工程博客《Harness engineering: leveraging Codex in an agent-first world》。

文章图片
#spring#人工智能#旅游 +2
AI Agent基础|Agent通信基础设施

Agent通信基础设施是多Agent系统的核心组件,它提供了Agent之间进行可靠通信的机制。通信基础设施通常包括以下组件:

文章图片
#人工智能#python#windows +4
RadixAttention 技术详解:从原理到 SGLang 实践及 vLLM APC 对比

本文深入剖析大语言模型推理优化中的 RadixAttention 技术,详述其基于 Radix Tree(基数树)自动复用 KV Cache 的核心原理,结合 SGLang 的落地实现解析其内存调度机制,并与 vLLM 的 APC 方案进行全方位对比,为大家在生产环境中提供性能评估与选型参考。

文章图片
#sglang#android#人工智能 +3
    共 2006 条
  • 1
  • 2
  • 3
  • 201
  • 请选择