
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了一个基于ReAct模式的工业级供应链管理智能体系统,采用LangGraph工作流编排和MCP工具协议。系统支持本地化部署(SQLite+Ollama),提供CLI和React双界面,采用模块化设计和高性能异步处理。核心组件包括ReAct Agent引擎和MCP工具系统,集成Recharts实现数据可视化。文章详细展示了系统架构、技术栈选型、核心组件实现和API设计,为读者提供了完整可运行

文章介绍了本地运行大语言模型的五种工具:Ollama、LM Studio、AnythingLLM、llama.cpp和Open WebUI。本地运行LLM具有隐私与控制、离线能力和成本与自由三大优势。Ollama适合快速设置,LM Studio适合探索实验,AnythingLLM可将LLM与个人文档连接,llama.cpp提供底层控制,Open WebUI提供美观的浏览器界面。文章强调,本地运行L

GLM-4.6V-Flash是一款9B参数的多模态大模型,支持原生视觉函数调用,可直接将图片作为参数传给工具,无需转文本。它具有图文交织内容生成、视觉网页搜索、前端还原与视觉编辑等强大功能,可一次性处理150页文档或1小时视频。文章详细介绍了环境准备、Python代码体验和vLLM本地部署方法,特别适合UI代码生成、复杂文档解析和视觉Agent开发,是前端开发者的生产力革命工具。

2023年至今,检索增强生成(RAG)经历了从备受瞩目到逐渐融入智能体生态的转变。尽管有人宣称“RAG已死”,但其在企业级应用中的重要性依然无可替代。RAG正从独立框架演变为智能体生态的关键子模块,2025年将在多模态、代理融合、行业定制化等领域迎来新的突破。本文结合这几年的技术进展和未来趋势,深度探讨RAG在2025年的五大重点发展方向。

AI Agent并没有本质上提升某个模型的智力,只不过是学会了如何使用工具而已。而如何使用工具,使用说明工具以及多大程度的依靠工具,就产生了现有的实现AI Agent智能体的三种方法:单体推理模型:典型如OpenAI,这种架构的核心思想是依赖一个单一、巨大且能力全面的大语言模型来统一处理任务的各个方面,包括理解查询、规划步骤、执行工具(如搜索)以及综合信息生成最终答案。

大模型技术正加速渗透至产业核心场景,成为驱动数字化转型的智能引擎。全球机器学习大会(ML-Summit)聚焦大模型技术的创新突破与产业实践,深入探讨其前沿方向与落地路径。作为AI发展的核心驱动力,检索增强生成(RAG) 通过动态知识融合技术突破大模型的静态知识边界;智能体(Agent) 借助自主决策与多任务协同能力重构人机协作范式;多模态大模型 则依托跨模态语义理解技术解锁复杂场景的落地潜力。三者

AI智能体不仅仅是花哨的聊天机器人——它们更像是能自主"思考"和行动的智能助手,能够协调多个步骤或工具来完成目标。在实际应用中,智能体通常结合大语言模型(LLM)的推理能力与外部工具(数据库、API等)来处理复杂任务。

ChatGPT、GLM等一众生成式人工智能在文本创作及文本至图像转换等领域,展现出了令人瞩目的能力。然而,这些尖端技术亦非尽善尽美,其固有的局限性如同暗礁,潜藏着诸如生成内容的虚幻性、解释性的缺失、专业知识的浅薄,以及对时代新知把握的不足等问题。为了跨越这些障碍,提升模型的效能,研究者们探索出两条主要路径:一是通过微调(Fine Tune)技术,让模型在既有基础上进一步精进;二是赋予模型与外界交互

在人工智能领域,大语言模型(LLM)的应用日益广泛,选择合适的推理(部署)框架对实现高效、稳定的模型运行至关重要。Ollama和vLLM作为当下流行的LLM部署工具,各具独特优势与适用场景。

在今年格外紧张的就业市场环境下,许多人都在考虑掌握一门技术以增强自己的竞争力,却往往不知道该选择学习什么。在2025年,学习人工智能无疑是一个明智的选择。对于外行人而言,AI可以被理解为一种模拟人类智能行为的技术,它通过计算机系统来学习、推理、解决问题和执行任务。尽管AI技术本身相当复杂,但其目标是为了使生活和工作变得更加便捷和智能化。而对于程序员来说,总的来说,在All in AI的时代,掌握A








