logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

企业级私有化知识库RAG系统

我的思考过程第一轮筛选:OpenAIAPI首先被我排除。一是企业级私密文件数据不能上传云端;二是长期使用API费用不低;三是公司网络可能访问不了。隐私是第一位的。第二轮对比:vLLM被排除。它虽然吞吐量高,但主要针对GPU服务器场景。我的开发机只有16GB内存,vLLM加载7B模型都很吃力。而且vLLM的配置复杂,需要自己写Dockerfile、配置GPU驱动,对于原型验证阶段太重了。第三轮决策:

#python#github#windows +3
企业级私有化知识库RAG系统

我的思考过程第一轮筛选:OpenAIAPI首先被我排除。一是企业级私密文件数据不能上传云端;二是长期使用API费用不低;三是公司网络可能访问不了。隐私是第一位的。第二轮对比:vLLM被排除。它虽然吞吐量高,但主要针对GPU服务器场景。我的开发机只有16GB内存,vLLM加载7B模型都很吃力。而且vLLM的配置复杂,需要自己写Dockerfile、配置GPU驱动,对于原型验证阶段太重了。第三轮决策:

#python#github#windows +3
基于LangChain的多智能体文档问答系统1.0

开发了一个生产级的多智能体协作系统,实现基于本地大模型的智能文档问答。系统采用4个专门化Agent(协调者、研究员、分析师、写作师)协同工作,通过RAG技术实现私有文档的智能检索与问答。项目解决了传统单模型问答的局限性,实现了任务分解、并行处理、结果整合的完整Agent协作流程。

#python#github#windows +1
AutoGen快速入门

AutoGen 是一个开源编程框架,用于构建 AI 代理并促进多个代理之间的合作以解决问题,通过创建多个可定制、可对话、可协作的 AI 智能体,利用自然语言交互实现任务分工、工具调用与流程自动化,支持 RAG、代码执行、人机协作等场景,是构建 Agentic AI 系统的主流工具。第二步,由「控制台」进入「火山方舟」的模型广场找到你想要的模型,这里我们用「DeepSeek-V3」,右上角选择「AP

#python
到底了