
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
我的思考过程第一轮筛选:OpenAIAPI首先被我排除。一是企业级私密文件数据不能上传云端;二是长期使用API费用不低;三是公司网络可能访问不了。隐私是第一位的。第二轮对比:vLLM被排除。它虽然吞吐量高,但主要针对GPU服务器场景。我的开发机只有16GB内存,vLLM加载7B模型都很吃力。而且vLLM的配置复杂,需要自己写Dockerfile、配置GPU驱动,对于原型验证阶段太重了。第三轮决策:
我的思考过程第一轮筛选:OpenAIAPI首先被我排除。一是企业级私密文件数据不能上传云端;二是长期使用API费用不低;三是公司网络可能访问不了。隐私是第一位的。第二轮对比:vLLM被排除。它虽然吞吐量高,但主要针对GPU服务器场景。我的开发机只有16GB内存,vLLM加载7B模型都很吃力。而且vLLM的配置复杂,需要自己写Dockerfile、配置GPU驱动,对于原型验证阶段太重了。第三轮决策:
开发了一个生产级的多智能体协作系统,实现基于本地大模型的智能文档问答。系统采用4个专门化Agent(协调者、研究员、分析师、写作师)协同工作,通过RAG技术实现私有文档的智能检索与问答。项目解决了传统单模型问答的局限性,实现了任务分解、并行处理、结果整合的完整Agent协作流程。
AutoGen 是一个开源编程框架,用于构建 AI 代理并促进多个代理之间的合作以解决问题,通过创建多个可定制、可对话、可协作的 AI 智能体,利用自然语言交互实现任务分工、工具调用与流程自动化,支持 RAG、代码执行、人机协作等场景,是构建 Agentic AI 系统的主流工具。第二步,由「控制台」进入「火山方舟」的模型广场找到你想要的模型,这里我们用「DeepSeek-V3」,右上角选择「AP







