社区云

架构

2501_91888447 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 4小时前

架构师效率神器：AI智能体驱动业务需求到技术架构自动化映射，亲测有效

需求到架构的映射是一个非线性、多约束、知识密集需求的不确定性：自然语言需求存在歧义（如“快速响应”）、变更频繁（如用户新增直播功能）；架构的多维度约束：需平衡性能（延迟≤200ms）、成本（云服务器预算≤10万/月）、 scalability（支持100万并发）、合规（GDPR数据保护）等；映射的非线性：需求与架构的对应关系并非一一对应（如“高并发”可对应微服务、Serverless或分布式缓存）

#人工智能 #架构 #自动化

481 

6 
酷柚易汛智推官来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 6小时前

自然语言编程的现状与未来挑战：从技术原理到实践落地

自然语言编程通过大模型、意图识别与代码校验的协同，降低人机协作成本，正成为开发新趋势。其核心流程为意图理解→逻辑拆解→代码生成→校验优化，适用于快速原型开发、低代码增强等场景，可将开发时间缩短70%以上。当前依赖GPT-4 Turbo等模型实现需求到代码的转化，但在复杂逻辑理解与开源模型精度上仍存挑战。

#云计算 #微服务 #java +2

398 

6 
编程小饴来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 8小时前

RAG架构演进全解析：从Naive到Agentic，小白也能掌握的大模型增强技术

《检索增强生成(RAG)架构演进综述》系统梳理了RAG技术从Naive到Agentic的四代架构发展。文章分析了每代架构的核心特点与技术突破：Naive RAG的基础三阶段流程、Advanced RAG新增的预/后检索优化、Modular RAG的模块化设计理念，以及Agentic RAG的智能体协同创新。研究揭示了RAG如何通过持续迭代解决知识更新、语义对齐等关键问题，为LLM应用落地提供重要参

#架构 #人工智能 #大数据 +2

442 

12 
ISACAChina 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 8小时前

《第四届数字信任大会》精彩观点：腾讯经验-人工智能安全风险之应对与实践｜从十大风险到企业级防护架构

AI安全风险与防护实践摘要：ISACA大会揭示了AI应用中的十大安全风险，包括数据污染、提示词注入等全生命周期威胁，并分析了三个典型漏洞案例。面对大模型越狱等新型威胁，专家提出企业级防护方案：构建全生命周期安全体系，采用LLM-WAF等专用工具，实施130+控制措施覆盖七大层次，通过统一安全水位消除生态薄弱点，为AI应用提供全方位防护。（149字）

#人工智能 #安全 #架构

192 

1 
陈敬雷-充电了么-CEO兼CTO 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 8小时前

深度拆解 DeepSeek-V3/R1 推理架构！从核心组件到工作流，揭秘高效推理的底层逻辑

本文深度解析了DeepSeek-V3/R1推理系统的架构设计与工作流程。该系统通过API服务器、负载均衡器（预填充/解码/专家并行）、预填充服务、解码服务及外部键值缓存等核心组件的协同运作，实现了高效推理。重点阐述了负载均衡器如何根据实例负载动态分配请求，以及专家并行机制如何优化GPU计算资源利用率。文章还详细介绍了从请求接收、负载均衡、专家分配到结果缓存的全流程，展现了系统在吞吐量、响应速度和可

#架构 #人工智能 #自然语言处理 +2

427 

13 
耶耶耶~14 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 9小时前

AI原生应用认知架构：从感知到推理的完整链路

随着GPT-4、多模态大模型的普及，AI应用正从“功能辅助”向“主动认知”进化。传统应用（如计算器、日程表）是“规则驱动”，而AI原生应用（如智能助手、自动驾驶）是“数据与模型驱动”，能像人类一样“感知-理解-推理-决策”。本文聚焦这类应用的核心认知架构，覆盖从感知到推理的完整链路，适合技术开发者、产品经理及AI爱好者理解AI如何“思考”。认知架构的五大核心层（感知→记忆→理解→推理→决策）各层的

#架构 #人工智能

506 

19 
Python_金钱豹来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 10小时前

RAG爆火必学！效果优化全攻略：架构设计+核心要点入门到精通宝典，收藏这一篇就够了！

RAG技术全解析：让大模型告别"胡说八道"，构建企业级AI知识库的终极指南**你是否遇到过这样的场景：向大模型询问公司最新的产品规格，它却给出了2021年的过时信息？或者让AI助手帮你查找内部文档，它却开始"一本正经地胡说八道"？

#人工智能 #神经网络 #深度学习 +1

594 

13 
程序猿李巡天来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 10小时前

Agentic Memory、RAG、知识图谱：构建未来 AI 智能系统的核心架构全攻略，从入门到精通详解！

本文深入分析了现代 AI 堆栈中的三大核心技术：Agentic Memory（代理记忆）、检索增强生成（RAG）与知识图谱。三者共同支撑了具备持久性、推理与自适应能力的下一代智能系统，是企事业单位和科研机构开发高质量 AI 应用的必修课。

#人工智能 #知识图谱 #架构 +4

672 

16 
程序猿李巡天来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 10小时前

大语言模型×多模态融合全解：从入门到精通，架构原理与实战宝典，收藏这一篇就够了！

随着 **Transformer 架构** 的成功，人工智能不仅在语言处理上突飞猛进，在视觉、语音等领域也迎来了突破。如今，研究者们已经能够把“看”和“听”的能力与“语言”结合起来，形成了功能强大的 **视觉-语言模型** 和 **音频-语言模型**。

#语言模型 #架构 #人工智能 +4

398 

9 
程序猿李巡天来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 10小时前

保姆级RAG教程：仅用几十行代码！UltraRAG 2.0+Milvus+MCP整合实战，超详细入门到精通指南！

做RAG系统，要解决的核心问题是什么？总结有二：**成本过高**，如何在多轮推理、动态检索、自适应知识组织等高级特性下，避免工程实现的巨大开销？

#milvus #架构 #网络 +2

479 

10 
小天才学习机打游戏来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 10小时前

多模态大模型训练全攻略：从入门到精通详解LLM多模态策略，收藏这一篇就够了！

在打造多模态大语言模型（既能看图，又能理解文字的 AI）时，很多人第一反应是：把模型做大、堆更多显卡算力！但研究发现，**光靠“蛮力扩容”并不是唯一的捷径**。相反，数据处理方式的优化，同样能带来突破性进展。

#架构 #人工智能 #知识图谱 +2

359 

21 
小天才学习机打游戏来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 10小时前

AI Agent工具调用入门：FastAPI + LangGraph从零到精通，详细教程+实战项目，收藏这一篇就够了！

你是否曾好奇，那些强大的 AI 助手是如何做到不仅能聊天，还能帮你查询信息、执行计算的？今天，我们就来揭开这层神秘的面纱，亲手构建一个属于自己的、简易版的 AI Agent。

#人工智能 #fastapi #架构 +2

402 

17 
网安福宝来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 12小时前

多模态大模型全解析：视觉语言与语音语言模型的架构演进与实践指南（建议收藏）

文章详细介绍了多模态大模型架构，特别是视觉语言模型(VLM)和语音语言模型(SLM)。VLM通过对比学习、掩码预测、生成式学习和映射学习等方法实现图像与文本的理解和生成。SLM则通过不同的输入输出模式、语音表示学习方法和融合架构，实现语音与文本的结合。这些架构使AI能够同时处理和生成多种模态的信息，接近人类的多模态认知能力。

#语言模型 #架构 #人工智能 +3

316 

8 
python零基础入门小白来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 12小时前

【干货收藏】AI大模型性能评估指南：2025年从延迟到成本的全方位解析！

文章系统介绍了2025年评估AI大模型性能的三大核心维度：延迟（TTFT、TPOT和端到端时延）、吞吐量（生成Token吞吐量和每分钟请求数）以及成本（单请求成本和每百万Token成本）。同时分析了输入输出长度、模型规模和预加载时间等关键影响因素。作者强调评估大模型是一个系统工程，需要多维度考量，并在实际应用中根据场景需求在延迟、吞吐量和成本之间找到最佳平衡点。

#人工智能 #深度学习 #transformer +3

347 

13 
python零基础入门小白来自武汉城市开发者社区

devpress.csdn.net/wuhan · 12小时前

LangSmith+LangChain构建可监控的RAG系统，完整代码已开源（建议收藏）

本文详细介绍LangSmith在LangChain应用中的调试与追踪功能，展示如何评估RAG系统性能，以及使用LangServe快速部署API服务。同时涵盖生产环境中的监控与日志管理，帮助开发者实现从开发到部署的全生命周期管理，代码已开源在GitHub。

#开源 #transformer #金融 +3

627 

11 
yihanss 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 12小时前

FastAPI+LangGraph入门：从零开始打造能使用工具的AI Agent（值得收藏）

本文详细介绍了如何使用FastAPI和LangGraph从零构建一个能使用工具的AI Agent。通过创建计算器、时间获取和掷骰子等工具，结合LangGraph的create_react_agent实现Agent的思考与行动能力，并利用FastAPI的lifespan模式高效管理资源，最终实现了支持多轮对话记忆的流式和非流式API接口。本教程适合初学者，为开发复杂AI应用打下基础。

#fastapi #人工智能 #数据库 +2

726 

22 
txzq 来自魔乐社区

modelers.csdn.net · 2024-04-16 18:18:13

运维监控体系建设-三大监控体系以及监控数据采集

通过这篇文章，我们大致了解了监控的三大体系，和这三大监控体系的主要用作用。另外也简单讲解了三种监控的数据采集方案，和原始数据的整合处理，只有经过整合处理后的监控数据，才能辅助我们找到对应的人来发现问题，定位问题和解决问题。此外，我们如何通过CMDB来管理企业应用系统数据，系统部署架构数据，系统资源数据，我们会有专门的文章来讲解。

#运维 #架构

3556 

31 
筠· 来自魔乐社区

modelers.csdn.net · 2024-06-20 18:44:19

aarch64架构中使用docker安装mysql

现在就可以使用工具连接mysql了。

#架构 #docker #mysql

767 

2 
咔咔学姐kk 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 12小时前

上下文工程：超越RAG，大模型应用开发的未来方向

上下文工程是AI领域新概念，关注优化大模型输入而非改变结构。随着上下文窗口增长，出现"语境腐烂"现象，模型长语境下性能下降。文章提出写、选、压、隔四个核心环节，并详细解释实施方法。RAG技术在上下文工程框架下将迎来"第二春"，理想系统应恰到好处地注入信息，这是大模型应用工程化的必经之路。

#人工智能 #架构 #大数据 +2

628 

9 
程序员小猴紫来自武汉城市开发者社区

devpress.csdn.net/wuhan · 12小时前

企业RAG实战：构建“先取证、再生成、可追责“的答案供应链！

本文介绍了企业级RAG系统的完整实施框架，强调其价值在于"先取证、再生成、可追责"。文章详细阐述了五大核心工程：构建权威来源目录、实现句级来源标注、建立可信度评分机制、设计可运维的RAG流水线，以及建立持续评测与运营体系。这套方案帮助企业构建可信、可追溯的答案供应链，将RAG从概念转化为生产力，确保AI回答的权威性、可追溯性和可信度。

#大数据 #人工智能 #transformer +3

389 

13 
程序员王饱饱来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 12小时前

万字长文深度解读：大公司如何打造大模型智能应用？揭秘大模型应用落地的背后故事！

从 BERT、GPT、T5 等通用大模型展示了令人瞩目的语言理解和 NLP 任务解决能力，到 ChatGPT 惊艳发布，再到国产大模型的百花齐放，我们目睹了大模型通过海量参数和强大的学习能力，不仅在问答、对话、摘要、翻译等任务上取得了不错的成果，更是推动了人工智能的边界不断扩展。

#后端 #python #架构 +2

555 

15 
编程喵酱来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 12小时前

大模型企业应用指南：从智能问答到维修诊断的技术架构与实战案例

文章介绍了大模型在企业中的三大应用类型，重点分析了制造业场景下的智能问答系统。以设备维修诊断问答助手为例，详细阐述了技术架构及三大核心挑战（数据获取、参考信息完整性、知识库维护）的解决方案。强调实施关键在于确保答案可追溯性、参考信息可读性，以及通过人工复核保障准确性，为企业构建智能问答系统提供了实用指导。

#架构 #大数据 #人工智能 +2

538 

13 
程序员王饱饱来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 12小时前

一文搞懂大模型RAG流式输出：提升应用体验的关键技术！

文章介绍了在RAG应用中实现流式输出的技术方案，包括其三大优势：提升用户体验、实时性和内存优化。详细讲解了在FastAPI中通过StreamingResponse和SSE协议实现流式输出的方法，并结合OpenAI API展示了LLM流式输出。重点介绍了使用LlamaIndex框架在RAG应用中实现流式输出的核心逻辑和完整代码示例，帮助开发者提升大模型应用的用户体验。

#后端 #python #架构 +2

758 

9 
m0_69745974 来自魔乐社区

modelers.csdn.net · 2022-04-29 18:39:43

排序算法：归并排序

例子==下面通过一个例子来看看归并排序是怎么工作的，原数组如下。第一步：分解首先将数组分解成两部分，即19、15、37为一组，12、25为一组，为了区分，我们起个名字叫“第一层”，如下图：第二步：分解继续分解，19、15为一组，37为一组，12为一组，25为一组，这四组为“第二层”，如下图：第三步：分解继续分解，此时只剩下19、15这一组可以分解，分解成19、15，这两组为“第三层”，如下图：第四

#经验分享 #架构 #java

671 
普通网友来自魔乐社区

modelers.csdn.net · 2022-01-18 20:26:51

Android知识笔记：对于Jetpack Compose的一次尝试，超强Android进阶路线知识图谱

在布局文件中我们给每个控件起一个名字（ID），而在程序中我们需要根据这个 ID 查找我们需要的具体控件，如TextView nameTextView = (TextView) rootView.findViewById(R.id.tv_name);页面中的每个控件都需要这样的操作获取，还要重新再起一个符合源码规范的新名字，对于几十甚至几百个控件的页面来说，完成这样的操作是相当繁琐相当痛苦的。耦合严

#架构 #移动开发 #android

244 
lgf228 来自魔乐社区

modelers.csdn.net · 2024-11-27 22:10:03

剖析前后端 API 接口参数设计：JSON 数据结构化全攻略

JSON Schema 是一种强大的工具，用于定义 JSON 数据的结构和格式。它允许开发者明确指定数据的属性、类型、数组和对象等，从而确保数据的有效性和一致性。：可用于定义满足特定正则表达式模式的属性。例如，可以使用来限制用户名字符串的格式：},在这个示例中，只有以user开头后跟数字的字符串才能作为username的值。2.：用于控制是否允许对象中存在未在properties中定义的属性。默认

#json #数据结构 #微服务 +2

1668 

31 
禅与计算机程序设计艺术来自魔乐社区

modelers.csdn.net · 2023-12-29 01:45:58

数据安全与隐私保护策略： Zero Trust 架构

1.背景介绍数据安全和隐私保护是当今数字世界中最重要的问题之一。随着数字化的推进，数据的产生和传输量不断增加，数据安全和隐私保护的需求也越来越高。传统的安全策略，如防火墙和身份验证，已经不能满足当今的安全需求。因此，一种新的安全策略必须诞生，这就是 Zero Trust 架构。Zero Trust 架构是一种新的网络安全框架，它的核心思想是“不信任任何人，任何地方，任何时间”。它要求在网络...

#架构 #php #开发语言

1425 

18 
Python程序员小泉来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 13小时前

大模型技术全解析：从Transformer架构到实战应用的程序员指南！

本文系统介绍大语言模型(LLM)的核心概念、技术架构与应用场景。详解Transformer架构的自注意力机制，对比GPT(解码器)与BERT(编码器)的差异，阐述预训练与微调流程，解释Token处理机制。大模型通过自监督学习掌握语言规律，在文本生成、理解等任务表现卓越。最后介绍智泊AI的AI培训课程，帮助学员掌握大模型技术，成为企业刚需的AI人才。

#transformer #架构 #深度学习 +3

347 

10 
沈页来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 13小时前

一文详解混合专家模型(MoE)，让大模型更轻量、更高效的革命性架构

混合专家模型(MoE)通过"分而治之"思想提升大模型效率，将标准Transformer的前馈网络替换为多个"专家"网络，并配备路由机制决定输入分配。这种设计使模型在推理过程中只需激活部分专家而非全部参数，大幅降低计算成本，如DeepSeek模型能以五百万美元训练成本实现高性能，让大技术更加普惠可用。混合专家模型的核心思想就是在推理过程中，不要让模型全部动起来，而是让模型部分动起来。

#架构 #人工智能

741 

9 
finogeeks 来自魔乐社区

modelers.csdn.net · 2023-05-17 18:18:33

小程序架构足够安全吗?数据安全如何保障？

当然随着小程序的流行，小程序的各个方面都是开发者讨论的热点，其中免不掉说到安全，因为安全已经成为了一个非常重要的问题。

#小程序 #架构 #安全

1326 
金融机器智能官方来自魔乐社区

modelers.csdn.net · 2024-01-24 23:51:07

大模型+知识图谱双驱架构：新一代《知识语义框架SPG》白皮书

SPG充分融合了RDF/OWL的语义性和LPG的结构性，具有语义简洁和大数据兼容的优势。该框架能够实现知识动态到静态自动分层、领域内知识的唯一性和知识之间的依赖关系定义。同时，SPG框架还提供了可编程的范式，支持快速构建新的领域图谱和跨场景迁移。在解决典型问题和场景方面具有广泛的应用价值。举例来说，在黑产图谱和产业链事理图谱中，SPG框架可以帮助企业更好地识别和应对黑灰产，提高风险防控能力。在知识

#知识图谱 #架构 #人工智能

2051 

29 
我算是程序猿来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 13小时前

蚂蚁开源发布2025全球大模型开源生态全景图，程序员必看指南，建议收藏！

《全球大模型开源开发生态全景与趋势报告》2.0版显示，62%大模型开源项目诞生于"GPT时刻"后，平均仅30个月。中美开发者贡献超四成核心力量，中国倾向开放权重路线，美国多采用闭源模式。AI编程工具迅猛增长，分为命令行工具和IDE插件两类。2025年大模型发展呈现参数规模化、强化学习提升推理能力、多模态主流化等趋势。

#开源 #人工智能 #大数据 +3

329 

20 
桃子叔叔来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 13小时前

全面解读大模型数据蒸馏---基于架构优化的蒸馏LLaVA-MoD

全面解读大模型数据蒸馏---基于架构优化的蒸馏参考论文：LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation论文地址：https://arxiv.org/pdf/2408.15881github代码地址：https://github.com/shufangxun/LLaVA-MoD这类方法通过优化学生模型的结构来提高知识蒸馏效率，其

#架构 #人工智能

353 

5 
我算是程序猿来自 2048 AI社区

2048ai.net · 13小时前

2025年AI算法高薪风口！DeepSeek领衔，掌握这些技能年薪30万+不是梦！

AI算法岗位薪资持续走高，DeepSeek等企业开出百万年薪招聘，但真正胜任者稀缺。针对这一现状，"深度算法培养计划"应运而生，由字节、百度等一线大厂在职专家授课，通过9个企业级实战项目培养实用技能。课程承诺就业保障，往期学员平均薪资超30万，是小白和程序员转型AI领域的高性价比选择。

#人工智能 #算法 #大数据 +2

425 

8 
倾听铃的声来自魔乐社区

modelers.csdn.net · 2022-03-31 14:17:07

java常用数据结构有哪些

java数据结构有：1、数组；2、链表，一种递归的数据结构；3、栈，按照“后进先出”、“先进后出”的原则来存储数据；4、队列；5、树，是由 n（n>0）个有限节点组成的一个具有层次关系的集合；6、堆；7、图；8、哈希表。本教程操作环境：windows7系统、java8版、DELL G3电脑。Java常见数据结构这 8 种数据结构有什么区别呢？①、数组优点：按照索引查询元素的速度很快；按照索引

#java #数据库 #面试 +1

1w 

15 
程序员笑武来自魔乐社区

modelers.csdn.net · 2025-03-04 11:03:54

知识图谱与一般知识库的关系

在信息技术领域，知识图谱和传统知识库虽然都用于管理和表示知识，但在结构、灵活性以及应用方面存在显著差异。传统知识库通常采用固定的模式来存储数据，这些模式定义了实体及其属性之间的关系。相比之下，知识图谱通过节点（代表实体）和边（描述实体间的关系）构建网络状的数据模型。这种灵活的图形结构使得知识图谱能够更自然地表达复杂多样的现实世界关联。由于采用了更加丰富的语义建模方式，知识图谱可以捕捉到更为细致入微

#知识图谱 #人工智能 #架构 +2

1342 

19 
大靠山来自魔乐社区

modelers.csdn.net · 2025-01-16 10:45:00

知识图谱增强大模型应用架构

最近OpenAI连续12天进行12场直播，发布新品。其中第八天介绍了ChatGPT搜索功能项全体用户开放。搜索增强大模型值得OpenAI安排一天专门介绍，和o1、ChatGPT Vision等功能同等待遇，说明其意义重大。ChatGPT的外部搜索能力，使其不仅限于预训练的数据，而是可以实时访问和检索互联网的最新信息。这就是典型的知识增强大模型应用，通过外部知识的增强能够扩展大模型的能力，让其在

#知识图谱 #架构 #人工智能 +4

792 

18 
2501_92846429 来自魔乐社区

modelers.csdn.net · 2025-07-22 16:51:27

足球软件哪个好？深度解析技术架构与数据分析优势

当今体育分析软件已从基础数据记录发展为集实时处理、预测建模和可视化于一体的智能平台。以worldliveball为例，其核心技术架构融合了分布式计算（Apache Kafka/Flink）、机器学习算法（LSTM/CNN）和边缘计算处理，实现85.2%的预测准确率和3秒内延迟。系统创新性地采用Shapley值算法评估球员贡献，通过动态影响评分和空间控制指数等800+指标，为职业俱乐部、媒体和学术研

#架构 #数据分析 #数据挖掘

808 

8 
Java架构师公社来自魔乐社区

modelers.csdn.net · 2020-10-30 14:37:08

mysql磁盘满了之后，居然还能这么玩！

使用命令发现磁盘使用率为100%了，还剩几十兆。一系列神操作备份数据库，删除实例、删除数据库表、重启mysql服务，结果磁盘空间均没有释放。怎么办网上查了很多资源，说要进行磁盘碎片化整理。原因是datafree占据的空间太多啦。具体可以通过这个sql查看。SELECTCONCAT(TRUNCATE(SUM(data_length)/1024/1024,2),'MB')ASdata_size,CON

#mysql #数据库 #java +2

543 

1 

标签介绍

架构

——架构

热门标签

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net