
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
想象一下,你雇佣了一位极其聪明但记忆力只有7秒的助理。

如果对比过 vllm 进行大模型推理 和 直接调用模型generate 就会知道 vllm可以让推理速度比直接调用模型generate快2-4倍。那问题来了,?

很多人第一次用 Agent,会有一个疑问:明明底层模型差不多,为什么有的 Agent 像实习生,只会聊天;有的 Agent 却像资深同事,能查资料、写代码、跑测试、改文件、做汇报,甚至把任务推进到交付?

使用工具构建AIAgent时,选择哪些工具才能让模型如鱼得水?本文结合Anthropic团队构建ClaudeCode的经验,总结出了设计合适工具的底层原理。

Cursor、Claude Code、Amazon Q、Windsurf… 2026 年 AI Coding 已经卷成红海。但你有没有想过:**这些工具到底是怎么工作的?

为什么大模型训练时使用偏好排序而不是直接打分?在大模型(如 InstructGPT 和 Llama 2)的训练中,**偏好排序(Preference Ranking)**被证明比**直接打分(Direct Scoring)**更有效。这主要是由人类评估的主观性、标注一致性以及数学建模的稳健性决定的。

想在本地跑大模型,但不知道自己的电脑能跑啥?显存不够会不会爆?工具调用又是怎么回事?这篇文章帮你彻底搞清楚。

随着多模态大模型的快速发展,如何在有限的计算资源下提升模型性能成为关键挑战。混合专家模型(MoE)通过稀疏激活机制,在保持模型容量的同时显著降低推理成本,为多模态任务提供了高效解决方案。

2 月 11 日,OpenAI 发了一篇工程博客《Harness engineering: leveraging Codex in an agent-first world》。

昨天,香港大学数据科学团队(HKUDS)正式开源OpenSpace项目。该项目迅速引发AI Agent社区关注,并非又一个单纯的任务执行框架,而是首次将Agent能力从“一次性完成任务”推进至“从实践中持续进化、跨个体共享经验”的系统性工程实现。OpenSpace以技能(Skill)为核心构建自进化引擎,集成Model Context Protocol(MCP)协议,可无缝增强OpenClaw、n








