深藏功yu名个人主页

@weixin_43224466

深藏功yu名

2023-07-28 09:26:54 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Docker+FastAPI+千问API，复刻豆包式流式聊天界面

本文介绍如何使用Docker、FastAPI和千问API搭建一个类似"豆包"的流式聊天应用。主要内容包括：Docker基础知识讲解(镜像、容器概念)和安装指南；Docker Compose多容器管理工具介绍；千问API的接入方法；项目实战部分涵盖前后端开发(实现SSE流式输出和聊天界面)；详细的Docker配置说明；以及项目部署和常见问题解决方案。通过本教程，读者可以掌握容器化

#docker #fastapi #容器

Day21：（实战篇）从零搭建 RAG 系统（附通义千问 _ Deepseek _ 本地大模型完整代码）

本文提供了一个从零搭建RAG系统的实战教程，包含通义千问、Deepseek和本地大模型三种实现方案。教程采用Python+LangChain+Chroma技术栈，详细演示了文档加载、文本拆分、向量化存储等核心步骤。特别针对中文场景优化了文本分割策略，并提供了API调用和本地模型两种向量化方案。通过构建"2026年LPR利率"的问答系统，展示了RAG如何解决大模型知识更新的问题。

#python #pycharm #人工智能 +1

Day18：Ollama 安装与本地模型运行：把你的电脑变成AI宠物乐园

本文介绍如何使用Ollama在本地电脑上运行大语言模型，实现离线AI助手功能。详细讲解了Ollama在Windows、macOS和Linux系统的安装方法，以及常用命令操作（模型下载、运行和删除）。重点展示了如何通过Python调用本地模型API进行问答交互，并对比了本地模型与在线模型在响应速度、隐私保护和成本方面的优势。通过简单的代码示例，读者可以快速上手将大模型部署到个人电脑，打造专属AI助手

#人工智能 #学习 #pycharm +2

从API到数据库，手把手教你打造一个能干活、能背锅的Agent

这篇文章介绍了如何让AI Agent具备实际工作能力，通过集成API和数据库实现实用功能。主要内容包括： RESTful API集成 - 教Agent像快递员一样处理数据（GET查订单/POST创建资源等），附商品查询和订单创建代码示例 GraphQL应用 - 让Agent能精准获取所需数据而非固定套餐数据库连接 - 为Agent配备记忆仓库(SQL+Redis)存储用户偏好等数据实时通信 -

#数据库 #AI #自然语言处理

Day23：Embedding与向量化保姆级教程！让大模型读懂你的文字

这篇文章介绍了Embedding与向量化的概念及其在RAG系统中的关键作用，提供了两种向量化方案：在线通义千问API和本地BGE模型部署。主要内容包括：通俗解释Embedding如何将文本转换为机器可读的数字向量对比在线和本地两种向量化方案的优缺点详细的环境准备和代码实现步骤通义千问在线API的完整使用教程本地BGE模型离线部署的实践指南文章提供了可直接运行的代码示例，展示了向量生成过

#python #人工智能 #自然语言处理 +1

Docker+FastAPI+千问API，复刻豆包式流式聊天界面

#docker #fastapi #容器

大模型推理加速实战技术

大模型推理加速技术实战摘要本文系统讲解了大模型推理加速的核心技术与实践方法。重点介绍了vLLM引擎及其革命性的PagedAttention机制，该技术通过分页式显存管理将显存利用率从50%提升至95%以上，实现3-5倍加速。文章详细对比了Ollama、vLLM和TensorRT-LLM三大工具的性能差异，其中vLLM凭借开箱即用和Python3.10完美兼容成为最优选择。实战部分提供了vLLM完

#人工智能 #AI #pycharm

从API到数据库，手把手教你打造一个能干活、能背锅的Agent

#数据库 #AI #自然语言处理

Day25（高阶篇）：RAG检索与重排序算法精研｜从原理到参数调优，彻底攻克检索瓶颈

RAG高阶检索与重排序技术精要本文深入解析RAG系统中的检索与重排序核心技术，帮助开发者突破精度瓶颈。核心内容包括：检索算法原理：详解余弦相似度（语义匹配）和BM25（关键词匹配）的底层逻辑，强调向量归一化对精度的影响混合检索策略：通过权重调节（语义0.4-0.7/关键词0.3-0.6）适配不同场景，解决专业术语和长文本检索难题重排序优化：对比三种重排序方案（大模型过滤/专用模型/云API

#排序算法 #算法 #AI +2

Day24（进阶篇）：向量数据库 Chroma_FAISS 深度攻坚 —— 索引优化、性能调优与生产级落地

本文深入探讨向量数据库Chroma和FAISS的生产级优化策略。文章首先对比了暴力搜索(KNN)与近似最近邻搜索(ANN)的区别，重点解析了HNSW索引原理及其参数调优方法。通过详细对比Chroma与FAISS在索引类型、持久化、性能等方面的差异，帮助开发者根据场景选择合适的方案。实战部分提供了Chroma批量写入优化和FAISS的HNSW索引+GPU加速两种生产级实现方案，包含异常处理、索引备份

#数据库 #faiss #AI +2

共 28 条

请选择