logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI大模型系列教程--模型部署

本文介绍了AI大模型部署的三种主要方案:1)直接调用云服务预置模型,适合新手和中小场景,无需部署成本;2)测试环境使用vLLM框架本地部署,适合自定义模型测试;3)云上生产环境部署,提供多种云服务方案(如阿里云百炼、函数计算、PAI-EAS等),满足不同业务需求。重点讲解了各方案的适用场景、操作步骤和注意事项,帮助开发者根据实际需求选择合适的部署方式。

#人工智能#java#python +4
最强DeepResearch!通义DeepResearch-30B开源实战:模型部署+LangGraph+A2A全攻略

阿里开源的通义DeepResearch-30B模型在深度研究任务评测中表现优异,超越现有开源/闭源方案。该30B MoE模型(每次激活3B)专为研究任务优化,支持128K上下文和两种Agent范式:ReAct和独创的IterResearch(支持多Agent并行探索)。本文详解了模型部署方案(本地/vLLM/API调用)及基于LangGraph的ReAct Agent实现,包括工具调用流程和提示词

文章图片
#java#python#人工智能 +4
深度解析Claude Skills:上下文管理的“开源”与“节流”之道

摘要:Claude Skills的上下文管理机制解析 Claude Skills通过"分层加载+自动回收"机制解决上下文膨胀问题。研究发现: 上层采用"按需加载"(分层加载)策略,只在需要时加载Skill元数据; 底层框架具备"自动回收"能力,能清理临时思考过程(<thinking>模块); 提出"微内核+模块化&q

文章图片
#java#python#人工智能 +1
突破大模型Token限制的完整技术方案

突破大模型Token限制的司法应用方案 本文探讨了突破大模型Token限制的技术方案在司法文书处理中的应用挑战与解决方案。主要内容包括: 问题概述:司法文书平均20万字远超GPT-5(128K)等模型的处理能力,专业术语和复杂法律关系的分析需求加剧了这一挑战。 技术瓶颈:Transformer架构的O(n²)计算复杂度使处理10万字案卷需要1.4TB显存,远超当前硬件能力。 司法特殊需求:证据链完

文章图片
#java#python#人工智能 +2
实战·Agentic 上下文工程(上):无需微调,让智能体自我学习与进化

摘要 Agentic上下文工程(ACE)是斯坦福大学等团队提出的新型智能体开发方法,通过上下文演化而非模型微调实现智能体自我进化。ACE框架包含四大组件:策略知识库存储经验,生成器执行任务,反思器分析错误,策划器更新策略,形成学习闭环。相比传统提示工程,ACE更注重构建智能体的思考环境,通过上下文分区、RAG检索、工具组装等策略优化信息组织。这种上下文"供应链"管理让智能体在任

文章图片
#学习#java#python +4
机器学习与神经网络

降维就是寻找数据主要变化方向,减少维度的同时尽量保留信息。J。

文章图片
#机器学习#神经网络#人工智能 +4
为 AI 智能体打造高效的上下文工程 – Anthropic

摘要 上下文工程是构建高效AI智能体的核心方法,旨在解决大模型的上下文衰减和注意力预算限制问题。关键策略包括:使用信息量高但token少的系统提示;通过即时上下文检索和工具动态加载数据;采用压缩、结构化笔记和子智能体架构管理长周期任务。这些方法帮助智能体在有限上下文窗口中保持高效运作,实现更强大的自主性和连贯性。随着模型能力提升,混合策略和自主检索将成为智能体设计的趋势。

文章图片
#人工智能#大数据#java +2
4大阶段,10个步骤,助你高效构建企业级智能体(Agent)

企业级智能体高效构建方法论 本文提出了一套系统化的企业级智能体构建框架,包含4大阶段和10个步骤: 明确需求阶段:确定应用场景、目标与验收标准,识别关键干系人和数据来源,产出场景说明书、验收标准和成本清单。 体系架构设计阶段:完成整体技术架构设计,进行关键技术PoC验证,细化核心模块(如AI网关、RAG知识库等)并落地实施。 智能体落地与评估阶段:采用敏捷方式,将系统拆分为可独立验证的子智能体MV

文章图片
#人工智能#大数据#java +2
LangGraph过时了?下一代AI Agent架构已能处理多话题混合提问

下一代AI Agent架构突破多话题混合处理瓶颈:传统监督者模式面临用户混合提问时的失忆问题,新方案采用动态准则匹配机制替代单一路由决策。如Parlant框架通过评估所有相关准则、动态加载上下文,使AI能够同时处理退货和保修等交叉问题,实现更自然的对话体验。这种从"选路"到"配方"的转变,解决了LangGraph在复杂对话中的固有局限,代表AI客服系统的进化

文章图片
#人工智能#架构#java +3
原来写一个 AI Agent 这么简单

本文介绍了一个简单AI Agent的开发过程,用于管理本地文件。主要内容包括:1)编写三个工具函数(read_file、list_files、rename_file)用于文件操作;2)使用pydantic-ai框架创建Gemini模型实例;3)构建Agent对象并注册工具函数;4)开发基础交互程序;5)改进版本添加对话记忆功能。该Agent能自动调用相应函数执行用户请求,如读取文件内容、重命名文件

#人工智能#python#开发语言 +3
    共 116 条
  • 1
  • 2
  • 3
  • 12
  • 请选择