登录社区云,与社区用户共同成长
邀请您加入社区
Plan-Execute-Replan是一种协作的任务执行模式,核心思路是:先规划、再执行、随时调整。Multi-Agent(多智能体)就是不是一个AI在单打独斗,而是多个AI各司其职、分工协作。每个Agent负责一个专门的职责,就像公司里不同岗位的同事配合完成一—个项目。
讯飞同传双语字幕插件是基于星火大模型的跨语言沟通工具,通过实时语音转写与同步翻译技术,实现会议、网课、直播、视频创作等场景的双语字幕呈现。该插件遵循精准性、低侵入、高兼容、易用性四大设计原则,支持37种语言互译,具备智能降噪、悬浮字幕、专业词库定制等功能。通过端云协同技术,在保证识别翻译准确率的同时,实现毫秒级响应与弱网稳定运行。未来将持续迭代大模型能力,探索多模态交互与个性化适配,构建更完整的跨
序号步骤命令1拷贝代码到 master2修复 .dockerignore删除cache行3创建数据目录4构建并分发镜像5部署应用6检查 Pod7访问containerd 与 Docker 的关系K8s 1.24+ 默认使用 containerd 运行容器构建镜像仍需要 Docker / podman / nerdctlK8s 内部服务发现mysqlredisbackend应用代码中不需要 IP,直
销售单据OCR处理中心是一个基于FastAPI开发的系统,主要功能包括: 核心功能 支持图片上传和JSON数据导入 提供单据管理和状态跟踪(待处理/已完成/已取消) 具备统计分析功能(收入统计、订单分析、客户排行) 支持数据导出为CSV和打印功能 技术架构 后端:FastAPI + SQLite数据库 前端:原生HTML/CSS/JavaScript 采用深色主题UI设计 主要特点 提供完整的OC
遇到问题先看日志,大部分问题都是环境变量或字符集配置引起的。
通过RAG技术可以在一定程度上消除大模型的幻觉,但是如果召回的知识不够充分,那么大模型的回答仍会存在一定幻觉,验证上下文是否充分是为了判断大模型回答的结果是否可信。context_sufficient 现在判断的是“检索结果是否相对接近”,但没有判断“这些结果是否真的回答了用户问的具体主题”。个距离最小的——它只能告诉你"这是索引里最接近的",不能告诉你"它真的回答了你的问题"。“假设用户问的是论
调整后的检索上下文比最早的版本文段更长,基于检索到的信息可以帮助用户回忆以往的研究内容,同时这样的内容让用户看到后能感觉心里放心,知道模型回答的结果是有依据的。但是这些信息还需要在Django中的页面中反馈给用户才可以,这样用户能清楚的知道系统是如果工作的,以及判断给出的问答结果是否可靠。经过调整后,页面有了更为完整的 Agent Trace 信息,这样用户可以判断智能体的工作是否可靠。需要修改的
Ollama是一个轻量级的本地大模型部署工具,支持多种开源模型,适合快速部署和测试。FastAPI是一个高性能的Python Web框架,适合构建本地大模型API服务。Text Generation WebUI是一个开源的Web界面,支持多种大模型。vLLM是一个高性能推理框架,专为大模型优化,支持DeepSeek等开源模型。prompts = ["如何做西红柿炒鸡蛋?Docker可以简化环境配置
如果 MySQL 允许远程连接,可以使用服务器 IP,但需确保 MySQL 用户有对应主机的权限。被浏览器当成协议相对 URL,导致请求失败。
同步架构并发性能差、需要手写接口文档、无原生数据校验。而FastAPI作为近几年Python生态爆火的现代化Web后端框架,完美解决了传统框架的所有痛点,兼顾极致高性能、开发高效率、代码强安全三大核心优势,目前已经成为大厂微服务、后端API开发、机器学习模型上线部署的首选框架。本篇博客不走空洞理论,全程实操代码+落地讲解,从环境搭建、基础路由、核心接口开发,到企业进阶配置、生产Docker部署,一
本文介绍了一个基于YOLOv8和FastAPI的智能视频检测系统。该系统实现了实时目标检测、数据统计和可视化功能,适用于课堂行为分析、工厂安防监控等场景。技术架构采用四层设计:采集层通过OpenCV获取视频流,推理层使用YOLOv8进行目标检测,服务层由FastAPI提供接口支持,展示层通过WebSocket实现实时推送。系统核心包括兼容性强的摄像头采集模块、封装完善的YOLOv8检测器、高效的W
永远不要相信用户的输入。大模型接口的输入长度、特殊字符、甚至 emoji 都可能让 tokenizer 崩溃。一定要做输入校验和截断。写这篇笔记的时候,我又想起那个凌晨的告警电话。后来我把服务改成了异步流式 + 信号量限流 + 超时清理,再也没出过类似问题。技术选型没有银弹,但理解每个组件在大模型场景下的特殊行为,能帮你少踩很多坑。
user_info 对应的响应数据类:基础类 + Info类(id、用户名)"""⽤户信息基础数据模型"""nickname: Optional[str] = Field(None, max_length=50, description="昵称")avatar: Optional[str] = Field(None, max_length=255, description="头像URL")
摘要:本文记录了在阿里云服务器部署FastAPI服务时遇到的公网访问问题及解决方案。主要内容包括:1)通过curl安装uv工具并验证;2)启动服务后发现公网无法访问API文档;3)排查发现服务默认绑定localhost导致;4)解决方案包括修改安全组开放8001端口、调整服务配置绑定0.0.0.0地址,并提供了详细的操作步骤和配置示例。最后给出了验证服务是否正常的方法。
Prompt 就是你发给大模型的所有输入内容,不只是一句简单的问题,而是你塞进messages列表(如上所示)里的所有文字:指令、背景信息、参考资料、示例、格式要求...全部算在内,总称为Prompt。Prompt要装在上下文窗口里面。Agent(智能体),是一个以大模型为"大脑",能自主感知环境、做出决策、调用工具、完成多步骤任务的程序。Tool就是给大模型「装上手」的方案,让它从「只动嘴的参谋
本文探讨在项目系统开发中,选择Flask而非FastAPI的技术决策。项目采用独特的双模式架构(Server模式和Desktop模式),需要同时支持Linux Docker环境和Windows EXE打包。Flask因其同步线程模型、PyInstaller兼容性、Flask-SQLAlchemy的数据库切换能力以及SSE推送的天然支持,成为更合适的选择。文章详细对比了两种框架在具体场景下的适用性,
本文介绍了一个基于YOLOv8的轻量级实时视频检测系统,具备实时目标检测、动态统计和Excel自动记录功能。系统采用FastAPI+WebSocket架构,前端模块化设计,支持自动打开浏览器和优雅退出。核心功能包括:基于YOLOv8的实时检测标注、动态统计面板展示、Excel自动记录检测数据(支持动态新增类别列)、低延迟WebSocket视频流推送。文章详细阐述了系统架构、关键代码实现(摄像头采集
作用:用 Python 类映射数据库表结构,让 ORM 能操作数据库。继承 SQLAlchemy 的创建基类Base。为每个数据库表定义对应的模型类(如CategoryNews用tablename指定表名,用定义字段、类型、约束(主键、外键、索引等)。字段设计完全参照数据库表结构,确保一一对应。模型类规范:基类,继承数据库表模型类,继承基类属性及类型参照数据库表定义这是一张图片,ocr 内容为:模
本文介绍了一个基于Python技术栈的AI播客生成工具开发实践。文章从技术选型、系统架构到核心模块实现进行了详细阐述,主要包括:1)使用FastAPI构建后端服务;2)通过OpenAI API生成结构化播客脚本;3)利用Edge-TTS实现多角色语音合成;4)采用FFmpeg进行音频混音处理。该工具可将文本自动转换为带背景音乐的多角色对话播客,适合内容创作者快速实现音频内容生产。文章还分享了具体代
此外,耳机支持耳罩 90° 旋转折叠,收纳方便,游戏模式下延迟低至 80ms,满足轻度游戏需求,不过它不支持智慧双连功能,切换设备需手动操作,且机身塑料部件占比高,长期使用易显细微划痕。通话搭载 3 麦 AI 降噪技术,能智能过滤背景杂音,在咖啡馆开视频会议时,对方也能清晰听到人声,不过在强风环境下,抗风噪效果一般,仍会有轻微气流杂音混入。它支持蓝牙 5.4 连接,双设备同时在线,电脑办公时手机来
相比继续堆叠新功能,今天更重要的是把已有功能打磨得更可靠、更容易解释。这些改动说明项目不只是把 RAG 和 Agent 跑通,而是在逐步补齐真实 AI 应用工程中会遇到的问题。改成了更安全的表达式处理方式,只支持有限范围内的基础计算,并对非法输入返回明确错误信息。因此今天对上传后的反馈进行了补充,使页面能够展示 reload 是否成功,以及。第二,调试时不容易判断问题出在上传环节、知识库重建环节,
📊 BI数据可视化平台项目摘要 本项目开发了一个集全球物流可视化与FIFO库存管理于一体的BI平台。核心功能包括:1)基于Leaflet.js的交互式世界地图,通过科技感UI动态展示物流网络;2)智能FIFO库存系统,支持Excel批量导入和多维查询。技术栈采用FastAPI+SQLAlchemy后端与Tailwind CSS+原生JS前端,解决了地图渲染一致性、科技感UI实现等关键技术难点。项
开源项目UltraConsole介绍
FastAPI是一个基于 Python 的高性能 Web 框架,专门用于快速构建 API 接口服务。参数类型位置作用常用方法路径参数URL 路径的一部分指向特定资源GET查询参数URL?之后过滤、排序、分页GET请求体HTTP body创建、更新资源POST、PUT通过 Pydantic 模型严格定义 API 端点的输出格式,保障数据安全。id: inttitle: strreturn {"id"
路由时URL与处理函数之间的映射关系-d '{"book_name": "清风录","author": "青玉","publishing_house": "人民出版社",}'请求处理、返回# 定义类型# 类型注解BaseModel作用:强制数据验证与类型转换运行时验证:在实例化模型时,Pydantic 会自动检查输入数据是否符合定义的字段类型和约束。如果数据不合法(例如将字符串传给整数字段且无法
前面已经完成从Django上传论文的PDF并且重建知识向量数据库 ,但是这个功能仍存问题,因为在FastAPI中,重建工作是重新赋值了全局变量rag,而没有重建workflow,我的工作流在工具选择节点和工具执行节点是用到工厂函数创建的,这个节点中是有rag变量作为依赖的,所以如果我重建了rag,但是没有更新workflow,那么实现的工作流在后续问答环节可能无法回复与新上传论文相关的问题,所以这
很多有 Django 经验的开发者在搭 AI Agent 系统时会本能地沿用熟悉的框架,但 AI 编排层的核心需求——异步调度、SSE 流式输出、轻量无状态——恰好与 Django 的设计方向相悖。本文从实际项目出发,分析了 Django 在 AI 编排场景下的三个具体痛点:异步支持不彻底、SSE 实现繁琐、携带大量用不上的全家桶组件。对比说明了 FastAPI 原生异步、StreamingRes
前面已经将FastAPI封装的AI能力接入Django形成了一个比较基本的用户UI界面,但是这个用户界面就好像毛坯房,所以这篇博客的主要工作是对“毛坯房”进行简装,过程中将会优化页面的UI增加会话列表增加文档上传和数据库重建功能以及增加系统的可解释性。
本文介绍了如何将大模型能力接入实际业务,重点讲解了基于Coze平台搭建RAG智能体插件的全过程。项目核心技术包括:使用FastAPI构建RAG服务,ChromaDB存储向量数据,SentenceTransformer实现文本嵌入,以及Nginx反向代理和Let's Encrypt证书配置。作者详细阐述了从本地开发到公网部署的完整流程,包括HTTPS改造、插件接口开发和工作流配置等关键环节。该项目实
探讨医学影像科研团队如何通过整合MONAI、3D Slicer与FastAPI,将从数据清洗到实验复现的繁琐步骤标准化,构建端到端的自动化工作流。
摘要:本文介绍了一个基于FastAPI框架的AI新闻推荐系统后端开发实践。系统采用模块化设计,包含用户认证、新闻管理、收藏浏览和智能推荐等核心功能。用户模块实现了JWT认证和密码安全机制;新闻模块支持完整的CRUD操作和分类管理;通过Redis缓存策略提升系统性能;AI集成部分实现了智能摘要、分类和推荐功能。文章详细展示了各模块的代码实现,包括数据模型定义、API接口设计和业务逻辑处理,为开发高性
FastAPI框架全面指南摘要 本文系统介绍了FastAPI框架的核心特性和进阶应用。基础部分涵盖环境搭建、路由设计、请求体验证及响应模型,重点演示了Pydantic数据验证和自动API文档生成。进阶章节深入探讨依赖注入、中间件、数据库集成(支持SQLAlchemy异步ORM)、JWT认证及WebSocket实时通信,并提供了性能优化方案。 FastAPI凭借Starlette的异步支持、Pyda
本文介绍了FastAPI的高级应用,主要包括三个核心内容:1)依赖注入系统,通过Depends实现代码复用和模块化,用于分页、权限校验等场景;2)数据库ORM(SQLAlchemy)的异步操作,包括模型定义、CRUD接口实现和事务管理;3)企业级项目结构,采用分层架构组织代码。文章还通过JWT认证系统的实战案例,展示了如何整合这些技术构建生产级API。这些知识将帮助开发者编写可维护、高性能的后端服
摘要:构建多层级AI记忆系统指南 本文介绍了为智能体构建多层次记忆系统的Python实现方案,包括短期记忆和长期记忆的实现方法。 核心内容: 记忆系统必要性:对比人类记忆与AI记忆类型,解释短期记忆、长期记忆等不同层级的作用 短期记忆实现: 滑动窗口记忆管理,限制消息数量 自动摘要机制,压缩旧消息保持上下文 长期记忆实现: 使用ChromaDB向量数据库存储语义记忆 支持元数据存储和相似性检索 技
文章摘要(148字): 本文提出一套企业级AI智能体开发规范,基于FastAPI+Dify+MySQL实战项目总结。针对AI辅助编码常见的风格混乱、静默失败等问题,规范涵盖10大核心模块:操作溯源、代码风格、错误处理等,强调强类型注解、纯函数、显式错误抛出等原则。通过英文提示词优化和标准化日志记录,实现代码评审效率提升40%,错误定位时间缩短60%。文中提供可直接复用的代码模板和规范检查清单,帮助
ChainMind是一个基于FastAPI+Ollama+LangChain的本地知识库问答系统项目。该项目通过RAG(检索增强生成)技术解决LLM的幻觉和知识过时问题,包含文档上传、文本切分、向量存储、智能问答等核心功能。系统采用前后端分离架构,后端使用FastAPI构建RESTful API,前端采用React实现交互界面。关键技术点包括:文档处理服务支持PDF/TXT/MD格式,智能文本切分
本文介绍了使用FastAPI和SQLAlchemy 2.0异步ORM进行MySQL数据库开发的全过程。主要内容包括:1)安装异步ORM依赖;2)创建异步数据库引擎和模型类;3)实现自动建表功能;4)通过依赖注入管理数据库会话;5)完成书籍的CRUD操作(增删改查)。文章特别讲解了异步ORM的优势,提供了可直接运行的完整代码,并详细说明了查询、插入、更新和删除操作的实现方法。适合刚学习FastAPI
回头看这次功能开发,我觉得最有价值的地方,并不是把大模型接进了系统,也不是做出了一个会说话的辩论页面。真正有意义的是,我开始把原本分散在研究、验证、评审、优化里的几个动作,逐步组织成了一套可以协同工作的流程。不让用户停留在有个想法但不会验证不让系统停留在回测了一下但没有解释不让智能体停留在说得很好听但不落地而是让策略从想法开始,经过验证、讨论、裁决和优化,形成一个可追踪、可展示、可迭代的对象。从这
本文深入讲解了FastAPI的核心功能,包括路由模块化、请求参数处理、响应对象和中间件机制。主要内容包括:1. 路由系统:使用APIRouter实现模块化路由管理,通过prefix统一前缀和tags文档分组;2. 请求参数:详解路径参数、查询参数、请求体、表单数据和文件上传的使用方法;3. 响应处理:介绍默认JSON响应、HTML响应、重定向、文件下载以及响应模型的应用;4. 中间件:讲解中间件原
本文介绍如何用 Python FastAPI 将 LangChain Agent 封装成 HTTP 接口,供 Java Spring Boot 主服务调用。涵盖 FastAPI 路由、请求响应体定义、LangChain Tool 编写、ReAct Agent 推理机制,以及 Java 侧 RestTemplate / WebClient 调用方式,适合 Java 技术栈团队落地 AI 能力参考。
基于LQR最优控制算法实现的轨迹跟踪控制,建立了基于车辆的质心侧偏角、横摆角速度,横向误差,航向误差四自由度动力学模型作为控制模型,通过最优化航向误差和横向误差,实时计算最优的K值,计算期望的前轮转角实现轨迹跟踪,仿真效果良好,有对应的资料,包运行和。在自动驾驶领域,实现精准的轨迹跟踪控制是关键任务之一。今天来聊一聊基于LQR(线性二次型调节器)最优控制算法达成这一目标的相关内容,顺便带大家看看具
本文详细介绍 Dify 对接本地 BGE-M3 嵌入模型的完整部署方案,通过 FastAPI 搭建兼容 OpenAI 格式的本地向量服务,解释嵌入模型调用时list index out of range格式报错原因。附带完整可运行代码与部署配置流程。
一对多关系示例:一个部门(Department)有多个员工(Employee),但一个员工只属于一个部门。我们使用 app_one_to_one 子应用。在 app_one_to_one/routes.py 中定义路由与CRUD操作。app_one_to_many/models.py 定义模型,使用 relationship 建立一对多关系。one_to_one/models.py 定义模型,使用
fastapi
——fastapi
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net