logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

收藏必备!大模型开发指南:AI代理(Agent)评估全攻略 - 从编码到对话的实战方法

本文系统介绍了四种AI代理的评估方法:编码Agent侧重代码质量和执行过程评估;对话Agent关注任务完成度和交互体验;研究Agent强调搜索全面性和来源可靠性;计算机使用Agent则评估界面操作和后端逻辑。提出了pass@k(潜力)和pass^k(稳定性)两个关键指标,为各类AI代理提供了多维度的性能评估框架,包括代码规范、交互质量、研究深度等具体评估维度,并通过典型案例展示了评估指标的实际应用

文章图片
#人工智能#语言模型
深入浅出LangGraph:LLM智能体交接机制与实现

本文探讨了基于LangGraph框架的多智能体系统中控制权转移机制。大语言模型智能体(LLM Agent)在复杂任务处理中存在局限性,而多智能体系统通过专业化分工和协作能更好应对复杂场景。文章重点分析了智能体间"交接"(handoff)这一核心概念,即一个智能体将控制权动态转移给另一个智能体的过程。通过房地产助手示例,展示了监督者模式下的三智能体架构,其中监督者智能体根据查询类

文章图片
#人工智能#语言模型
收藏学习:Mixture-of-Transformers - 稀疏可扩展的多模态基础模型架构

Mixture-of-Transformers (MoT) 是一种高效的多模态transformer架构,通过解耦非嵌入参数(前馈网络、注意力矩阵和层归一化)实现模态特定处理。实验显示,MoT在文本、图像和语音任务中仅需55.8%-37.2%的FLOPs即可达到密集基线性能,显著降低计算成本。该架构保持全局自注意力以捕捉跨模态关系,在Chameleon和Transfusion等任务中展现出优越性能

文章图片
#学习#架构#人工智能 +1
干货!Stable Diffussion入门教程

本期内容将详细攻略此工具,简单易懂,适合零基础、小白甚至各种安装懒人,让你轻松上手!Stable Diffusion主要依赖显卡运算,算力越强,出图速度越快,同时显存越大,所设置图片分辨率越高。关于Stable Diffusion安装包,大家可以找你的AI绘画助教老师【领取】,接下来我们正文开始。在生成效果的广度和深度定制上存在比较大的优势,开源本地部署,免费使用,支持模型训练,属于王牌工具。6、

文章图片
#AI作画
【收藏级】揭秘Claude Research:构建高性能多智能体AI系统的实战经验

Anthropic推出的Claude Research多智能体系统通过主导智能体协调多个并行子智能体,显著提升复杂研究任务处理能力。该系统采用动态搜索流程,相比传统RAG方法在开放式问题上表现更优,性能较单智能体提升90.2%。文章详细介绍了系统架构、执行流程、提示工程原则及评测方法,揭示了多智能体在并行任务、大上下文窗口需求场景的优势,同时也指出了高token消耗等挑战。该系统通过分工协作和动态

文章图片
#人工智能#语言模型
Java开发者AI大模型领域转型指南:深入对比分析、精心规划学习路径与成功策略!

在当今科技领域,人工智能(AI)凭借技术的持续进步,已成为备受瞩目的热门话题。众多开发者正考虑从传统软件开发领域,例如Java,迈向人工智能的新天地。今天,让我们一同探讨Java开发者转向人工智能领域的可行性,包括转型带来的优势、薪资水平的对比,以及成功转型所需的知识体系和学习路径。

文章图片
#java#人工智能#深度学习 +1
大模型RAG技术实战:21种文本分块策略详解(小白必看)

文章详细介绍了RAG系统中的21种文本分块策略,从基础方法(如换行符分割、固定大小分块)到高级技术(如语义分块、智能代理分块)。每种策略均提供适用场景分析和代码实现,帮助开发者根据数据特点选择合适方法。文章强调文本分块是RAG系统性能的关键因素,并提供混合分块策略作为综合解决方案,以提高信息检索准确性和生成质量。

文章图片
#人工智能#深度学习#大数据 +1
函数式编程的核武器:用Monad打造永不崩溃的AI Agent!

文章介绍Monadic Context Engineering (MCE),基于函数式编程Monad概念构建AI Agent的新方法。通过将状态管理、错误处理和异步执行封装在AgentMonad容器中,解决了传统Agent编程的代码混乱问题。这种架构使Agent开发模块化、声明化,能自动处理错误和状态传播,支持并发执行和元智能体生成,让AI Agent开发像搭乐高一样简洁高效。

文章图片
#人工智能#大数据#架构
打造私人定制开发利器:Qwen Code、vLLM与Qwen3-Coder强强联合!

本文介绍了如何利用Qwen Code和vLLM构建内网私有AI编程助手。主要内容包括:1)通过ModelScope下载Qwen3-Coder-30B-A3B-Instruct模型;2)使用vLLM部署模型API服务,详细说明了关键参数配置;3)安装配置Qwen Code客户端并连接私有模型;4)通过五子棋游戏和数据分析页面两个案例展示了实际开发效果。文章提供了完整的工具链部署方案,使开发者能够在纯

文章图片
#深度学习#人工智能#大数据
大模型架构设计深度解析:从 DeepSeek R1 到 Kimi K2,8种架构全面剖析!

本文对比分析了当前主流开源大模型的架构演进。尽管从GPT-2到DeepSeek-V3等新模型已发展7年,但核心Transformer架构仍保持稳定,主要改进集中在细节优化:如RoPE位置编码、分组查询注意力(GQA)替代多头注意力、SwiGLU激活函数等。文章重点剖析了8个代表性模型的技术创新:DeepSeek V3采用多头潜在注意力(MLA)和混合专家(MoE)提升计算效率;OLMo 2通过后归

文章图片
#架构#大数据#人工智能 +1
    共 390 条
  • 1
  • 2
  • 3
  • 39
  • 请选择