登录社区云,与社区用户共同成长
邀请您加入社区
本文介绍了一个基于FastAPI和LangChain 1.0的RAG知识库助手"宽仔"的开发过程。该项目支持上传txt和pdf文件构建本地知识库,使用FAISS向量数据库和HuggingFace嵌入模型实现检索增强生成。系统具备对话记忆功能,能够进行连贯的多轮对话。文章详细说明了环境配置、依赖安装和核心代码实现,包括知识库初始化、对话链构建和Web界面开发。最终效果是一个可通过浏览器访问的本地We
确保实验环境具备以下条件:一台负载均衡服务器(LVS Director)、多台真实服务器(Real Server)、客户端测试机。所有机器需在同一局域网内,操作系统建议使用Linux(如CentOS或Ubuntu)。每台Real Server需配置相同的服务(如HTTP或Nginx),并设置环回接口(lo)避免ARP问题。在LVS Director上安装IPVSADM工具,用于配置LVS规则。若输
我长期专注 Python 爬虫工程化实战,主理专栏 👉 《Python爬虫实战》:从采集策略到反爬对抗,从数据清洗到分布式调度,持续输出可复用的方法论与可落地案例。内容主打一个“能跑、能用、能扩展”,让数据价值真正做到——抓得到、洗得净、用得上。
我长期专注 Python 爬虫工程化实战,主理专栏 《Python爬虫实战》:从采集策略到反爬对抗,从数据清洗到分布式调度,持续输出可复用的方法论与可落地案例。内容主打一个“能跑、能用、能扩展”,让数据价值真正做到——抓得到、洗得净、用得上。
在 AI 应用开发日益普及的今天,Python 依然是构建大语言模型(LLM)应用的首选语言。而 LangChain 作为连接模型与应用的桥梁框架,其环境搭建的规范性直接影响后续开发的效率和稳定性。经典的 pip + conda 组合与现代化的 uv 工具。前者是大多数开发者熟悉的路径,后者则代表了 Python 生态依赖管理的新范式。团队已有成熟的 conda 工作流,迁移成本高;需要频繁切换
对于经销商与采购方而言,不同品牌本质上在为不同维度的顾客价值服务,不存在绝对的优劣,只有是否与本区域需求和自身经营模型匹配的选择。
所以,写下这篇文章,制成excel汇总表,供大家参考,包括了京东云、阿里云、腾讯云3大厂商(别的小厂怕跑路hhh,别贪图便宜选不知名小厂,到时候跑路服务器连不上,数据丢了,丢了西瓜捡了芝麻,大厂稳定性高,价格首购1年3年也很划算)。99元/年,关键在续费同价,可续2次,也就是297用三年,很合适,对比京东云价格一摸一样。我就像一个互联网的猹,在京东云、阿里云、腾讯云的官网里反复对比、反复横跳,但不
【Python数据分析实践】2026年05月28日,使用Python爬虫采集20+公开新闻源数据,通过jieba分词、SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型等NLP技术进行文本挖掘,并使用Matplotlib/Plotly进行数据可视化。本文为自动化脚本输出的技术学习笔记。
本文从开发者角度比较了Gemini3.5与GPT、DeepSeek系列的技术特点:1)Gemini3.5采用分块注意力机制实现百万级上下文窗口,但存在"中间信息丢失"问题;2)其多模态API支持跨媒介关联推理,在图表分析上优于竞品;3)通过thinking_budget等参数实现动态计算分配,结构化输出采用约束解码;4)安全机制严格但灵活性不足。三大模型呈现明显技术分化:GPT
简单学习模型的短期记忆的基本概念
本文探讨了在多轮对话系统中有效管理上下文状态的技术方案。通过对比GPT5.5、Gemini3.5和DeepSeekV4等模型,作者最终选择GPT5.5作为核心模型,并提出四种状态管理方案:滑动窗口法简单但易丢失早期信息;摘要压缩法通过定期生成对话摘要平衡成本与效果;关键信息提取法将重要信息结构化存储;RAG增强法则适用于知识密集型场景。作者推荐组合使用这四种方法,形成分层架构:结构化记忆层、滑动窗
2026年AI全栈开发成为高薪技术赛道,智能体开发岗位需求同比激增217%。本文基于誉天教育442课时课程体系,详解AI全栈开发四阶段技术路线:1)Python全栈与大模型基础;2)模型微调与推理服务部署;3)企业级RAG系统构建;4)多智能体协作架构设计。课程突出项目驱动,覆盖FastAPI高并发架构、vLLM推理优化、GraphRAG知识图谱等关键技术,配套PromptForge内容中台、Ag
GEO优化机构的选择,本质上是在选择一个能帮你“讲好故事”并“让AI听懂故事”的合作伙伴。一个核心判断标准是:这个机构是否真的把“让企业被AI推荐”这件事当成一个完整的服务,而不是只卖一个软件或一个账号。比如星遇科技提出的“AI管理、AI获客、AI提效”三合一服务体系,他们不只是做GEO内容生成,而是把GEO作为“AI获客”这个板块的一部分,与AI数字人矩阵、私域成交系统结合,形成完整的“内容→流
本文介绍了Python函数编程的核心概念及其在AI开发中的应用。主要内容包括:1. 函数基础:定义、调用、参数传递(位置/默认/关键字/可变参数)及返回值处理。2. 代码组织:模块化开发、变量作用域、匿名函数和标准库使用。3. 异常处理:基础语法、高级用法(多重捕获/else/finally)及自定义异常。4. 实战案例:构建健壮的LLM调用模块,集成参数校验、成本估算、重试机制等。5. 类型注解
AI系统上线并非简单部署,而是需要严谨的发布策略和持续监控。文章对比了四种发布方式:蓝绿部署(快速切换但资源翻倍)、金丝雀发布(逐步验证风险低,AI模型首选)、影子测试(零风险验证)和滚动更新(无停机但回滚慢)。重点展示了金丝雀发布的Python实现代码,包含流量路由、错误率监控和自动回滚机制,通过5%-100%的渐进式流量切换确保安全上线。上线后需持续监控业务指标(准确率)、系统指标(延迟)和数
"昇腾实战派"vLLM-ascend知识地图汇总了32篇技术文章,涵盖模型部署、性能优化、特性适配等关键领域。内容包含Qwen2.5/DeepSeek等大模型在昇腾平台的部署指南、内存显存分析等性能优化方法、FlashComm2/Rope等特性适配经验,以及精度对齐、多机通信等疑难问题解决方案。特别提供了GLM4.6/Qwen3-VL等典型模型的优化案例和Profiling工具使用指导,适用于20
本文介绍了边界案例(Edge Case)的概念、分类及系统化测试方法。边界案例指出现在输入空间边缘的罕见情况,模型在这些极端/异常输入上易失效,虽仅占流量5%以下,却对应重大业务风险。 文章将边界案例分为六大类(IEVN-UT框架): 1.输入极值(超长/短文本) 2.空值(全空格/Null) 3.数值边界(决策边界样本) 4.近阈值(模糊样本) 5.异常格式(HTML/代码) 6.对抗输入(错别
本项目基于YOLO v11深度学习模型,实现蚊子的实时检测与识别。# 每行格式:class_id center_x center_y width height。数据集已经上传到 yolov11蚊子检测数据集,连接地址。增益因子缩放图像,模拟物体与摄像机的不同距离。四、训练完成后,结果保存在best.pt中。三、YOLO v11模型训练训练配置文件。批量大小,即单次输入多少图片训练。YOLO v11
本文提供了一个基于PyTorch框架的Informer时间序列预测模型实现,支持多变量输入单变量输出。代码包含完整的数据预处理流程(标准化、滑动窗口处理)、模型架构(包含位置编码、数据嵌入层和Transformer编解码器)以及训练评估模块。该模型适用于股票、风电等多种预测场景,数据可从CSV/Excel文件读取,便于替换自定义数据集。实现包含标准化处理、滑动窗口生成、Transformer编码器
文章摘要:断点是程序调试中的重要工具,分为静态断点和动态断点两种类型。静态断点在特定节点前后固定暂停,适合调试和逐步执行;动态断点根据条件在节点内部暂停,适合异常处理和条件判断。使用断点需要配合检查点器保存状态,通过传入None恢复执行。文章详细介绍了两种断点的设置方法、使用场景和恢复流程,并提供了完整示例代码。断点功能使开发者能够观察中间状态、进行人工干预,是调试和验证程序执行过程的有效手段。
Claude Code和OpenAI Codex是当前最热门的两大AI编程工具。Anthropic近期宣布Claude Code从6月15日起周用量上限提升50%,而OpenAI则推出即日起Codex企业版免费两个月的促销政策。本文将从技术能力、使用场景和企业选型等维度进行全面对比。
摘要: Claude Batch API 为离线任务提供半价处理通道,适合批量数据清洗、日志分析等非实时场景。通过异步批量提交 JSONL 文件,可在 24 小时内完成处理,成本直接减半。若结合 Prompt Caching(重复 System Prompt 缓存计费仅 10%),综合成本可降至原价的 5%。例如 5000 条评论分类任务,成本从 $45 降至 $4.28,节省 91%。方案支持轮
本文介绍了一个基于Claude API
这个RAG系统是用来干什么的?在正式拆解代码之前,先说清楚这个项目的背景。
本文介绍了一个基于LangChain、Redis和RAG技术的智能客服系统实现方案。项目通过Playwright爬取美团FAQ数据,经过BeautifulSoup解析和结构化处理后,使用DashScope Embedding将问题向量化并存入Redis向量数据库。系统采用LCEL链式编排实现语义检索,结合Prompt工程控制回答范围,并通过RedisChatMessageHistory实现多轮对话
12 个章节学完后回头看,每一章都在教正确的思路,但也在刻意忽略工程细节。真正产品:容器化隔离(Docker)或 chroot,不受 git 限制。完成时自动生成差异化文件,创建 Pull Request,通知 Leader 审查。真正产品:进程树管理,主进程退出时所有子进程一并终止。真正产品:内存队列做热路径,文件仅做持久化备份。真正产品:支持有条件审批,比如可以做但不能删那行注释。审批不校验请
通过对这五家公司的对比,我们可以看到每家公司都有其独特的优势。湖南云坤数智科技有限公司以其自研GEO源头系统和全链路闭环服务,在本地化和专业性方面表现突出。而阿里云、百度智能云、腾讯云和华为云则分别在技术实力、应用场景、社交网络和全球化服务等方面各具特色。如果你是中小企业,特别是湖南本地的企业,我强烈推荐你选择湖南云坤数智科技有限公司。他们的服务不仅针对性强,而且效果显著,能帮助你在短时间内大幅提
AI金融分析框架---一整套金融分析团队为你服务
python
——python
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net