logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

字节面试官:如何评估RAG系统?你项目有哪些测评指标?

直接上答案:在实践落地中,RAG项目的测评非常重要,我项目使用的是Ragas自动化测评框架,把RAG的评估分为四个维度。第一是召回质量,就是评估系统有没有检索到正确且相关的文档片段;第二是答案忠实度,看大模型有没有脱离资料自己乱编答案;第三是答案相关性,评估大模型的回答是不是解答了用户的问题;第四是上下文利用率,评估给了大模型那么多的上下文,它到底用上了多少内容。

文章图片
#人工智能#知识图谱#大数据
AI Agent落地避坑指南:7个关键决策点

过去 18 个月,AI Agent 从概念验证(POC)走向生产环境的速度远超预期。但一个残酷的现实是:超过 60% 的企业 Agent 项目在 POC 阶段表现亮眼,却在规模化部署时折戟沉沙。

文章图片
#人工智能#大数据#安全 +3
AI Agent落地避坑指南:7个关键决策点

过去 18 个月,AI Agent 从概念验证(POC)走向生产环境的速度远超预期。但一个残酷的现实是:超过 60% 的企业 Agent 项目在 POC 阶段表现亮眼,却在规模化部署时折戟沉沙。

文章图片
#人工智能#大数据#安全 +3
字节官方让AI Agent能原生操作飞书/Lark

飞书开放平台今天正式发布了 lark-cli,一个命令行工具。说实话,当我看到这个项目的时候,第一反应不是「又一个CLI」,而是——终于有人把飞书的能力,用一种AI Agent能直接调用的方式暴露出来了。

文章图片
#人工智能#知识图谱#架构
字节官方让AI Agent能原生操作飞书/Lark

飞书开放平台今天正式发布了 lark-cli,一个命令行工具。说实话,当我看到这个项目的时候,第一反应不是「又一个CLI」,而是——终于有人把飞书的能力,用一种AI Agent能直接调用的方式暴露出来了。

文章图片
#人工智能#知识图谱#架构
面试官:Skills是什么?讲一讲它的工作原理

直接上答案:Skills本质是结构化的本地文件夹,用来补充某个领域的流程、知识和工具,让模型在相关场景下自动或按需调用,是面向大模型的能力封装。

文章图片
#人工智能#知识图谱#大数据 +1
面试官:Skills是什么?讲一讲它的工作原理

直接上答案:Skills本质是结构化的本地文件夹,用来补充某个领域的流程、知识和工具,让模型在相关场景下自动或按需调用,是面向大模型的能力封装。

文章图片
#人工智能#知识图谱#大数据 +1
干货|Prompt、Skill、Project、MCP,一套完整的 AI 工作流!

当下 AI 技术迭代速度飞快,**Prompt、Skill、**Project、****MCP****这四个词汇频繁出现,也成为解锁 AI 高效工作的关键。但很多人对这四个概念一知半解,本文就为大家拆解下这四个词的核心概念和应用场景,并看看它们可以为设计环节带来哪些提效作用。

文章图片
#人工智能#知识图谱#大数据 +1
干货|Prompt、Skill、Project、MCP,一套完整的 AI 工作流!

当下 AI 技术迭代速度飞快,**Prompt、Skill、**Project、****MCP****这四个词汇频繁出现,也成为解锁 AI 高效工作的关键。但很多人对这四个概念一知半解,本文就为大家拆解下这四个词的核心概念和应用场景,并看看它们可以为设计环节带来哪些提效作用。

文章图片
#人工智能#知识图谱#大数据 +1
小红书大模型二面:在Agent中,记忆模块你一般会怎么设计?

大多数 Agent 的 Demo 都不需要记忆——跑一段 ReAct 循环,调几个工具,输出结果,完事。但一旦进入真实业务场景,你会发现没有记忆的 Agent 几乎不可用:它记不住用户五分钟前说过的偏好,会反复犯同一个错误,每次对话都像第一次见面。**记忆模块的设计水平,很大程度上决定了一个 Agent 从"能用"到"好用"的跨越。

文章图片
#人工智能#安全#oracle +2
    共 2104 条
  • 1
  • 2
  • 3
  • 211
  • 请选择