
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章摘要: 本文介绍了如何在个人电脑上部署大语言模型实现Token自由。作者以16GB内存的i7电脑为例,推荐了适合的量化模型如GPT-OSS-20B和Qwen3.5-4B,并对比了它们的性能表现。详细步骤包括:1)选择适合配置的模型;2)下载安装Ollama部署工具;3)通过命令行一键部署模型;4)提供两种使用方式:命令行交互和可视化界面操作。实测显示GPT-OSS-20B在16GB内存设备上运
系统梳理了AI Agent开发的10个核心模块,涵盖从基础理论到工程落地的完整学习路径。每个模块均明确核心内容、学习重点及线上资源,包括Prompt工程、Agent基础、工具调用、RAG技术、LangChain/AutoGen框架应用、AI编程、本地部署、模型优化等关键领域。学习路径设计兼顾面试备考与日常开发需求,特别强调实用工具链和主流框架的实操能力培养,为开发者提供从入门到进阶的完整指导方案。
Function Call(函数调用)是大模型突破自身局限的关键技术,使AI能够通过调用外部工具完成复杂任务。其核心流程包括:需求解析(判断是否需要调用工具)、参数提取(将自然语言转为机器参数)、函数执行(调用外部API或系统)、结果整理(将结构化数据转为自然语言回答)。该技术解决了大模型的三大痛点:获取实时数据、执行精准计算、减少幻觉回答,广泛应用于智能助手、数据分析、自动化运维等领域。
Function Call(函数调用)是大模型突破自身局限的关键技术,使AI能够通过调用外部工具完成复杂任务。其核心流程包括:需求解析(判断是否需要调用工具)、参数提取(将自然语言转为机器参数)、函数执行(调用外部API或系统)、结果整理(将结构化数据转为自然语言回答)。该技术解决了大模型的三大痛点:获取实时数据、执行精准计算、减少幻觉回答,广泛应用于智能助手、数据分析、自动化运维等领域。
随着大语言模型(LLM)快速普及,“幻觉”、知识陈旧、私有数据无法利用等问题成为产业落地的核心瓶颈。RAG(Retrieval-Augmented Generation,检索增强生成)作为当前最成熟、最稳定、成本最低的大模型落地方案,已经成为企业知识库、智能问答、客服助手、Agent 架构的标配技术。本文从定义、动机、完整 Pipeline、关键技术、工程优化、Agent 长期记忆等维度,对 RA
在AI Agent开发中,记忆系统是实现智能化交互的核心基础。本文介绍了工作记忆、短期记忆和长期记忆的三层协同架构,解决传统Agent聊完就忘的痛点。工作记忆处理瞬时交互数据,短期记忆保障单会话连贯性,长期记忆实现跨会话知识沉淀。系统通过记忆管理器协调三层记忆的存储、检索、更新与遗忘,并采用滑动窗口、摘要记忆等策略优化Token消耗。
本文介绍了小龙虾(OpenClaw)AI Agent的详细安装教程。首先通过PowerShell以管理员身份运行安装命令,系统会自动检测环境并安装依赖项。安装过程包含风险确认、模式选择(推荐新手使用QuickStart)、模型配置(支持云端和本地模型)、聊天渠道设置(如QQ机器人注册)、搜索源选择(推荐Brave Search)以及Hook配置建议。安装完成后,可通过终端交互界面与AI对话,检查服
Function Call(函数调用)是大模型突破自身局限的关键技术,使AI能够通过调用外部工具完成复杂任务。其核心流程包括:需求解析(判断是否需要调用工具)、参数提取(将自然语言转为机器参数)、函数执行(调用外部API或系统)、结果整理(将结构化数据转为自然语言回答)。该技术解决了大模型的三大痛点:获取实时数据、执行精准计算、减少幻觉回答,广泛应用于智能助手、数据分析、自动化运维等领域。
随着大语言模型(LLM)快速普及,“幻觉”、知识陈旧、私有数据无法利用等问题成为产业落地的核心瓶颈。RAG(Retrieval-Augmented Generation,检索增强生成)作为当前最成熟、最稳定、成本最低的大模型落地方案,已经成为企业知识库、智能问答、客服助手、Agent 架构的标配技术。本文从定义、动机、完整 Pipeline、关键技术、工程优化、Agent 长期记忆等维度,对 RA
简单来说,。它让这门原本只属于浏览器的语言,变成了能开发网站后端、桌面应用、命令行工具等的“全能”编程平台。







