logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

阿里面试官问:为什么vllm能够加快大模型推理速度?

如果对比过 vllm 进行大模型推理 和 直接调用模型generate 就会知道 vllm可以让推理速度比直接调用模型generate快2-4倍。那问题来了,?

文章图片
#知识图谱#人工智能#microsoft +1
Agent 能力的秘密:不是模型越大越好,而是 Model、Harness、Skill 一起工作

很多人第一次用 Agent,会有一个疑问:明明底层模型差不多,为什么有的 Agent 像实习生,只会聊天;有的 Agent 却像资深同事,能查资料、写代码、跑测试、改文件、做汇报,甚至把任务推进到交付?

文章图片
#人工智能#大数据#spring boot +3
如何设计高效的Agent工具

使用工具构建AIAgent时,选择哪些工具才能让模型如鱼得水?本文结合Anthropic团队构建ClaudeCode的经验,总结出了设计合适工具的底层原理。

文章图片
#人工智能#大数据#数据库 +1
深入拆解 AI Coding Agent 的底层原理

Cursor、Claude Code、Amazon Q、Windsurf… 2026 年 AI Coding 已经卷成红海。但你有没有想过:**这些工具到底是怎么工作的?

文章图片
#人工智能#前端#javascript +2
为什么大模型训练时使用偏好排序而不是直接打分?

为什么大模型训练时使用偏好排序而不是直接打分?在大模型(如 InstructGPT 和 Llama 2)的训练中,**偏好排序(Preference Ranking)**被证明比**直接打分(Direct Scoring)**更有效。这主要是由人类评估的主观性、标注一致性以及数学建模的稳健性决定的。

文章图片
#机器学习#人工智能#前端 +3
OpenClaw + Ollama 本地实战(非常详细),模型选型与部署从入门到精通,收藏这一篇就够了!

想在本地跑大模型,但不知道自己的电脑能跑啥?显存不够会不会爆?工具调用又是怎么回事?这篇文章帮你彻底搞清楚。

文章图片
#架构#人工智能#大数据 +1
多模态MoE模型训练全攻略(非常详细),LLaVA-MoE与Kimi-VL从入门到精通,收藏这一篇就够了!

随着多模态大模型的快速发展,如何在有限的计算资源下提升模型性能成为关键挑战。混合专家模型(MoE)通过稀疏激活机制,在保持模型容量的同时显著降低推理成本,为多模态任务提供了高效解决方案。

文章图片
#人工智能#深度学习#机器学习 +2
OpenAI 工程师不写代码了?拆开 Harness Engineering 看看他们到底在干嘛

2 月 11 日,OpenAI 发了一篇工程博客《Harness engineering: leveraging Codex in an agent-first world》。

文章图片
#spring#人工智能#旅游 +2
OpenSpace:AI Agent从“执行者”迈向“进化者”的自适应集体智能引擎 —— HKUDS开源框架的架构解析与工程价值

昨天,香港大学数据科学团队(HKUDS)正式开源OpenSpace项目。该项目迅速引发AI Agent社区关注,并非又一个单纯的任务执行框架,而是首次将Agent能力从“一次性完成任务”推进至“从实践中持续进化、跨个体共享经验”的系统性工程实现。OpenSpace以技能(Skill)为核心构建自进化引擎,集成Model Context Protocol(MCP)协议,可无缝增强OpenClaw、n

文章图片
#人工智能#开源#架构 +4
    共 2063 条
  • 1
  • 2
  • 3
  • 207
  • 请选择