logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI学习 - 大模型基础入门

本文介绍了在Windows系统上使用Ollama部署本地大语言模型的基础入门指南。主要内容包括:硬件配置建议、Ollama安装步骤、推荐的中文友好模型(如qwen3.5:9b)、模型拉取与运行方法,以及常见问题解决方案。文章还详细解释了大模型的核心概念,包括Token处理机制、Context上下文理解、Context Window处理限制,以及Temperature参数如何控制输出随机性。通过Py

#人工智能#学习
ollama应用运行但ollama list执行报错could not connect to ollama app, is it running?

摘要: 本地部署ollama运行deepseek模型时出现端口冲突问题,执行ollama list报错无法连接。检查发现默认端口11435处于系统限制区间(11377-11476)。通过netsh命令查看被禁端口范围后,将环境变量OLLAMA_HOST改为可用端口11500,成功解决问题。临时方案可通过命令行设置,永久方案需在环境变量中配置新端口。调整后模型列表正常显示,可运行deepseek-r

#list#数据结构
AI学习-RESTful API 系统性学习记录

RESTful API 学习摘要 RESTful API是一种基于资源的架构风格,核心是通过HTTP方法(GET/POST/PUT/DELETE等)统一操作资源(名词化URL)。相比传统自定义接口(如/getUser),它具有六大架构约束: 客户端-服务器分离 无状态(每个请求独立) 可缓存(明确缓存策略) 统一接口(资源标识+标准操作) 分层系统(中间层透明) 按需代码(可选) 实际开发中,应规

#学习#restful#后端
AI学习-RESTful API 系统性学习记录

RESTful API 学习摘要 RESTful API是一种基于资源的架构风格,核心是通过HTTP方法(GET/POST/PUT/DELETE等)统一操作资源(名词化URL)。相比传统自定义接口(如/getUser),它具有六大架构约束: 客户端-服务器分离 无状态(每个请求独立) 可缓存(明确缓存策略) 统一接口(资源标识+标准操作) 分层系统(中间层透明) 按需代码(可选) 实际开发中,应规

#学习#restful#后端
AI学习-FastAPI 系统性学习记录

本文系统性地介绍了FastAPI技术栈的核心架构与组件关系。主要内容包括: 整体架构:FastAPI框架通过ASGI协议与Uvicorn服务器通信,形成"应用层-协议层-服务器层"解耦的三层结构。 核心组件: FastAPI基于Starlette(提供路由/请求处理等基础能力)和Pydantic(实现数据校验) Uvicorn服务器采用uvloop(高性能事件循环)和httptools(HTTP协

#学习#fastapi
AI学习-FastAPI 系统性学习记录

本文系统性地介绍了FastAPI技术栈的核心架构与组件关系。主要内容包括: 整体架构:FastAPI框架通过ASGI协议与Uvicorn服务器通信,形成"应用层-协议层-服务器层"解耦的三层结构。 核心组件: FastAPI基于Starlette(提供路由/请求处理等基础能力)和Pydantic(实现数据校验) Uvicorn服务器采用uvloop(高性能事件循环)和httptools(HTTP协

#学习#fastapi
ollama应用运行但ollama list执行报错could not connect to ollama app, is it running?

摘要: 本地部署ollama运行deepseek模型时出现端口冲突问题,执行ollama list报错无法连接。检查发现默认端口11435处于系统限制区间(11377-11476)。通过netsh命令查看被禁端口范围后,将环境变量OLLAMA_HOST改为可用端口11500,成功解决问题。临时方案可通过命令行设置,永久方案需在环境变量中配置新端口。调整后模型列表正常显示,可运行deepseek-r

#list#数据结构
AI学习-从本地 RAG 到生产级 Agent 系统

文章摘要 本文系统介绍了从本地RAG到生产级Agent系统的技术演进路径。主要内容包括:1) Agent与LLM的本质区别在于多步推理-行动循环;2) ReAct框架的三步循环机制(思考-行动-观察);3) 工具调用的底层原理与优化技巧;4) 记忆系统的四种类型与管理策略;5) 工具设计的四个关键要素和错误处理规范。文章还涵盖了Agent质量优化、框架选型、多Agent协作等进阶内容,为构建生产级

#人工智能#学习#microsoft
AI学习-RAG 实战指南:从入门到工业级落地

RAG实战指南:从入门到工业级落地 本文介绍了RAG(检索增强生成)系统的快速搭建与优化方法。5分钟快速上手部分展示了如何用LangChain、FAISS和HuggingFace搭建基础系统,包括文档检索和LLM回答生成。实战问题部分探讨了检索精度、性能和大规模部署的解决方案,如递归字符分割、FAISS+HNSW索引和向量量化技术。核心原理部分深入解析了BM25和向量检索的互补优势,以及文本向量化

#人工智能#机器学习
AI学习 - 大模型基础入门

本文介绍了在Windows系统上使用Ollama部署本地大语言模型的基础入门指南。主要内容包括:硬件配置建议、Ollama安装步骤、推荐的中文友好模型(如qwen3.5:9b)、模型拉取与运行方法,以及常见问题解决方案。文章还详细解释了大模型的核心概念,包括Token处理机制、Context上下文理解、Context Window处理限制,以及Temperature参数如何控制输出随机性。通过Py

#人工智能#学习
    共 18 条
  • 1
  • 2
  • 请选择