
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
以 deepseek r1 模型为例:访问https://ollama.com/library/deepseek-r1,默认为 7b 模型,如需其他模型,可以在当前页搜索所需模型模型详情页复制安装命令ollama run deepseek-r1安装完成后在终端执行:

RAG系统通过引入知识库,扩展了LLM对专业领域和实时信息的支持能力,使其在回答专业问题时更加准确高效。

需要Nvidia显卡,至少8G显存,且专用显存与共享显存之和大于20G建议将非安装版的环境文件都放到非系统盘,方便重装或移植以Windows11为例,非安装环境文件都放在 E 盘下
由于模型具有固定的上下文长度(token限制),因此用户和大模型之间的对话(其中整个对话都包含在上下文窗口中)不能无限期地继续。其实就是history的对话信息,不能都放进去。对于这种情况给的两种结局方案总结对话中的前几个回合。一旦输入的大小达到预定的阈值长度,这可能会触发一个查询,该查询汇总了过去的部分会话的摘要,并且可以这个摘要作为系统消息的一部分。或者,可以在整个对话的后台异步总结先前的对话

MCP 协议 指的是 模型上下文协议 (Model Context Protocol)。 以下是关于 MCP 协议的一些关键信息:定义: MCP 是由 Anthropic 提出的一个开放标准,旨在标准化人工智能应用程序(如聊天机器人、IDE 助手或自定义代理)与外部工具、数据源和系统之间的连接方式。你可以将其理解为 AI 集成的 USB 接口。

上下文工程是构建可靠LangChain Agent的核心技术,通过精细化治理模型调用与工具执行间的数据流动。文章从数据来源(运行时上下文、状态和存储)和生命周期(瞬态和持久上下文)两个维度展开,介绍了如何动态调整System Prompt、过滤工具以及实现自动总结等持久化机制。实践建议包括先静态后动态、区分临时与永久上下文、标准化格式和监控Token消耗,最终目标是构建既聪明又稳重的智能体,解决生

上周,我给一家企业实施AI Agent应用时,对方的项目总监悄悄问我:“K总,我听说这个Agent上线后,会裁掉90%的员工,是真的吗?”听到这一类问题,我一点也不惊讶,“AI焦虑”已经成为一种普遍社会现象。但要想全面深入地回答这个问题,就会涉及到Agent的发展阶段、核心组成、类型划分、以及当前面临的种种不足等等,不是一两句话就能说得清,下面通过这篇文章,好好剖析一下这个问题。

文章详解AI三大核心概念:Agent(自主决策AI程序)、Workflow(固定流程自动化工具)和MCP(AI调用外部能力协议)。三者互相配合:MCP解决连接问题,Workflow串联任务,Agent处理复杂决策。文章分析各自特点、适用场景及组合方式,帮助开发者根据需求选择合适架构,为AI应用开发提供指导。

为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选很简单,这些岗位缺人且高薪智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。AI产业的快速扩张,也让人才供需矛盾愈发突出。

本文介绍了基于大语言模型(LLM)的AI Agent技术及其应用。LLM Agent由规划、记忆、工具和行动四大模块组成,能够模拟人类思维过程完成复杂任务。重点探讨了LLM Agent与检索增强生成(RAG)技术的结合,展示了如何构建财报分析Agent系统,包括需求分析、架构设计、数据获取、知识检索等关键环节。文章还指出AI人才需求激增的市场现状,并提供了大模型学习资源包,包含视频教程、技术文档、








