
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Ollama作为一款开源工具,为用户提供了便捷的本地大模型部署和调用方式,其卓越的兼容性和灵活性使得在多种操作系统上运行大规模语言模型变得更加简易。通过Docker的安装与部署,用户可以快速上手并灵活使用各类大型模型,为开发和研究提供了强有力的支持。然而,由于Ollama缺乏内置的鉴权访问机制,用户在生产环境中应采取适当的安全措施,以防止潜在的访问风险。总的来说,Ollama在推动本地AI模型的应

通过SpringBoot + LangChain4j + Ollama的技术组合,我们可以快速构建一个功能强大的智能客服系统。这种方式不仅降低了运营成本,还提升了用户体验。在实际项目中,建议先从小范围试点开始,逐步优化模型和业务逻辑,最终实现智能客服的全面应用。
1. LLM(大语言模型):基于深度学习构建的超大规模语言模型,能理解、生成自然语言并执行复杂任务。2. Transformer:一种基于自注意力机制的深度学习架构,是当前主流大模型(如 GPT、BERT)的核心框架。3. GPT(生成式预训练 Transformer):基于 Transformer 的生成式预训练模型,擅长自然语言生成,如文本创作、对话交互。

使用 vLLM 本地化部署大模型,。创建虚拟环境ModelScope 下载 LLM👀。

对比,Anthropic指控&防范和的。, 打破Agentic LLM推理中的存储带宽瓶颈。大语言模型正从单轮对话工具进化为——能够自主规划、调用工具、与环境交互完成复杂任务。:单次轨迹可达数十万token(如代码助手、自动化任务代理):由于多轮交互中上下文高度复用,命中率通常≥95%:每轮仅追加数百token,但需加载完整历史KV-CacheAgent轨迹示意这导致系统性能瓶颈从转向——GPU大

软件开发工具领域正在经历一场根本性转变,从静态的文本操作工具转向能够进行推理、规划和执行的自主智能体。从历史上看,集成开发环境 (IDE) 的演进特征在于不断提高的内省能力——从简单的语法高亮到提供语义理解的语言服务器协议 (LSP)。然而,这些工具仍然是被动的;它们需要人类明确的调用和指导来进行每一个原子操作。

Agent 或者叫 Agentic AI,这个词,在2026年的当下我相信你应该已经听过了无数次了,因为它频繁地出现在各种公众号、博客、甚至同事聊天。但如果你去问身边的人Agent到底是什么,大概率得到的是一个模糊的答案:AI助手?自动化工具?比ChatGPT更厉害的东西?说得都有点对,但又说不到点子上。这篇文章,就来把这件事讲清楚,让你对于AI Agent是什么,它是是怎么一步步从一个Chatb

在这节课里,我们从“pipeline 一行调用模型”的黑盒用法,进一步走到了Transformers 底层推理代码的完整链路,把一次本地大模型对话的全过程拆解成了可以理解、可以复现的工程步骤。加载资源 → 构造输入 → tokenize 数字化 → generate 自回归生成 → decode 还原输出。其中tokenizer负责把自然语言转换成 token/id(以及反向还原),负责根据输入张

除了开源框架,各大AI厂商也推出了自己的Agent SDK,通常与其云服务深度绑定:框架厂商核心特点适用场景Agents SDKOpenAI与GPT模型深度集成,内置代码解释器、文件检索等工具已使用OpenAI API的项目,追求开箱即用Google支持Gemini模型,图结构编排,与Google Cloud集成Google生态用户,需要多模态能力Anthropic专为代码执行类Agent设计,强
前言本文重点是站在工程视角,围绕如何基于现有大模型去设计、实现和落地一个可用且可控的 AI Agent,不包含模型预训练、微调、RL等模型层面内容。当前Agent技术体系仍在快速演进中,比如Claude Skills近期持续受到开发者关注。本文介绍的内容是截至目前业界主流的设计思路和实践经验,一起期待更强大的Agent技术落地吧!本文目的是构建一个面向AI Agent的整体知识与设计框架,因此并没








