
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了如何在本地环境中部署和使用ollama与vLLM两大开源大模型框架。ollama适合本地开发和小规模部署,提供简单命令管理Llama2等主流模型;vLLM则专注于生产环境的高并发需求,兼容OpenAI API协议。文章详细讲解了两种框架的安装配置方法(curl安装ollama,pip安装vLLM),并提供了Python客户端实现代码示例,包括统一调用封装的设计方案。最后给出了优化建议:o

<span class="status-indicator status-waiting">⚠️ 请先上传并处理PDF文件</span>

本文详细介绍了Ollama大模型的本地安装、配置与使用方法。首先通过分步指南展示了Linux系统下手动安装Ollama的完整流程,包括二进制文件下载、权限设置、服务配置等关键步骤。其次讲解了如何通过ollama pull命令下载特定大模型,并以Qwen1.5-7b-chat为例演示了模型下载和存储路径。最后介绍了ollama run命令启动交互式对话的方法,并指出Ollama相比传统部署方式的优势

本文详细介绍了Ollama大模型的本地安装、配置与使用方法。首先通过分步指南展示了Linux系统下手动安装Ollama的完整流程,包括二进制文件下载、权限设置、服务配置等关键步骤。其次讲解了如何通过ollama pull命令下载特定大模型,并以Qwen1.5-7b-chat为例演示了模型下载和存储路径。最后介绍了ollama run命令启动交互式对话的方法,并指出Ollama相比传统部署方式的优势

本文系统介绍了大模型微调技术及其应用。主要内容包括:1. 微调基础概念:区分全量微调与高效微调(如LoRA/QLoRA),分析微调的优势与风险;2. 应用场景:涵盖对话风格调整、知识灌注、推理能力提升等;3. 主流工具对比:详细解析unsloth、LLama-Factory等四款微调工具的特点;4. 数据集构建原理:深入讲解对话、Function Calling、思维链等不同场景下的数据集构造方法

本文深入解析了MCP协议中的Client组件,该组件作为连接业务应用与模型服务的核心枢纽,通过抽象复杂分布式逻辑为上层提供统一接口。文章详细阐述了MCPClient的四大角色(协议网关、上下文管家、模型协调员、安全卫士)、核心工作流程及关键子流程(上下文管理、智能路由)。同时提供了Python/Java/Go等语言的实现示例,包括基础创建与高级定制方法,并给出分层部署、性能优化等最佳实践建议。MC

本文详细介绍了如何通过Qwen-Agent框架将Qwen3大语言模型与MCP工具进行集成。Qwen-Agent是阿里通义团队开发的开源智能体框架,可为Qwen模型提供工具调用、记忆管理、MCP接入等增强功能。文章重点讲解了MCP工具的接入流程,包括SQLite数据库操作、高德地图调用、网页抓取等功能模块的实现方法,并展示了多工具协同工作的完整案例。通过代码示例和视频演示,完整呈现了从环境配置到实际

本文详细介绍了如何将MCP工具接入LangGraph框架构建智能体的完整流程。主要内容包括:1)使用uv工具创建Python项目并配置虚拟环境;2)开发两个MCP服务器示例(天气查询和文件写入);3)通过MCP-Inspector测试工具功能;4)创建LangGraph客户端,将MCP工具转换为LangChain工具;5)演示如何接入更多MCP工具(如Filesystem和FireCrawl)。整

本文详细介绍了如何从零搭建Qwen3模型与MCP工具的集成客户端。主要内容包括:1. 使用uv工具初始化Python项目环境;2. 编写核心客户端代码,实现模型调用、工具管理和多服务器连接;3. 配置MCP服务器(如Filesystem工具)并通过JSON文件定义服务;4. 演示了天气查询、文件操作等工具的单/并联调用流程。该方案支持本地和在线模型接入,可扩展自定义工具,为后续Agent开发提供底

本文介绍了为Qwen3混合推理模型准备微调数据集的方法,重点推荐OpenMathReasoning数学推理数据集和FineTome-100k对话数据集。OpenMathReasoning包含54万道数学题及详细解答,涵盖代数、几何等领域,适合提升模型数学推理能力;FineTome-100k包含10万条多轮对话数据,可保持模型的对话能力。建议在微调过程中平衡两类数据的配比,以同时提升数学能力并保留混








