登录社区云,与社区用户共同成长
邀请您加入社区
本文将带领开发者入门Android AI大模型,涵盖大模型基础概念、类型、训练与推理过程,并推荐适合Android的轻量级模型。教程详细讲解在Android项目中集成大模型的环境搭建、模型转换、加载初始化及推理过程,并介绍图像分类、文本分类和目标检测等实际应用案例。此外,还分析了开发中可能遇到的问题及解决方案,帮助开发者更好地应对挑战。
本文深入剖析了OpenClaw(原Clawdbot)的核心动力模块——Agent任务引擎,揭示了其架构设计、工作区划分、调度并发控制及高可用容错机制。通过分析OpenClaw的实践,文章强调了理解这些工程智慧对于构建稳健生产级Agent系统的价值,并指出了如何将实践沉淀为规范,以更精准地指导AI。文章还讨论了如何在企业级落地中参考OpenClaw的架构实践,并指出了其代价和解决方案。
本文深入浅出地介绍了软件架构的核心概念,包括架构的理解、4+1模式、C4模型、TOGAF-4A架构以及互联网模型的实际应用。文章详细阐述了业务架构、产品架构、应用架构、技术架构和代码架构的设计原则与实现方法,旨在帮助初学者系统地掌握系统架构设计的方法论,为构建高效、稳定的软件系统打下坚实基础。
本文梳理了当前市场上的10种主流AI产品形态,包括对话式AI、嵌入式AI(Copilot)、生成式工具、智能体、AI搜索、情感陪伴AI、数据洞察AI、内容增强/润色、AI硬件和AI原生工作流平台。文章分析了每种形态的技术本质、解决的问题及商业模式,强调理解这些基础形态有助于判断AI产品的创新性。同时,作者还提供了一套包含500个原型模板库的资源,以辅助读者更好地理解和应用这些AI产品形态。
本文深入解析了Skill的概念、编写方法和技能创建器Skill-creator的设计思路。首先介绍了Skill的定义和最小形态,即一个包含指令文档、参考资料、可执行脚本等资源的文件夹。接着,文章详细阐述了Skill的完整结构,包括SKILL.md、scripts/、references/、assets/和agents/openai.yaml等文件的作用。文章重点分析了如何给AI编写指令,强调了简洁
本文深入解析了企业AI新热点Context Graph(上下文图谱),它通过记录企业决策路径、显影被忽略的工作流,让AI从单纯“搜内容”升级到“懂关系”。文章强调隐性流程才是关键资产,系统需捕捉“怎么做”反向推断“为什么”,并需与多种AI能力协同。实践证明,Context Graph是AI嵌入业务的基础设施,推动AI投资从模型转向上下文资产积累,率先建立者将引领Agentic Automation
Spring AI 是由 Spring 团队推出的开源项目(GitHub:),并非一个AI模型,而是一个面向AI应用的抽象层与生产就绪框架。统一的 API 抽象(如ChatClient开箱即用的主流厂商支持(OpenAI、Azure OpenAI、Ollama、Amazon Bedrock、Google Vertex AI 等)与 Spring Boot 自动配置、依赖注入、AOP、Reactiv
上海AI Lab & 复旦&中科院&上交大等9所高校联合发表了《迈向高效智能体(Agents):记忆、工具学习与规划综述》
本文我们将简要介绍上下文学习(in-context learning)的含义,并介绍对LLMs进行微调的各种可行方式。
最初尝试过用更大的模型(如 Qwen3 235B、DeepSeek V3.1 671B)配合 Prompt/Context Engineering 去“优化流程”。
2025—2026 年,以开放桌面智能体与云端一体机形态为代表的强自主 Agent 快速出圈,能够 7×24 小时在本地或云端以高权限方式执行复杂任务,对传统软件 / SaaS 模式形成实质冲击。
今天,我们为大家整理了 9 份来自 AI 三巨头的重磅指南,涵盖了从基础提示工程到进阶智能体(Agents)开发,再到企业级落地的全链路知识体系。
本文介绍了向量嵌入的基本概念和应用。向量嵌入通过将词语、句子或物体转化为多维数字向量,使计算机能够理解语义关系。相似事物在向量空间中距离更近,支持语义搜索、推荐系统等应用。文章解释了向量嵌入的工作原理、常见类型(词嵌入、句子嵌入等)和实际应用案例,并提供了动手体验的代码示例。向量嵌入技术是AI理解语义信息的关键基础。
单agent落幕,双agent才能解决复杂问题!附LangGraph+Milvus实操
第三步,将抓取到的关系描述、实体文本块一起输入LLM,生成最终答案。为此,微软提出了“图社区”的概念——将一个庞大的知识图谱,通过特定算法,划分成多个层次的子图(备注:这部分的归属的没有明确边界,行业内通常将其归为构建阶段,小白无需纠结归属,重点掌握用法即可)。\2. 冲突融合:针对同一实体的不同描述(比如一个文档说“张三是科学家”,另一个文档说“张三是教授”),解决方案是让LLM定期对该节点的所
对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?答案只有一个:人工智能(尤其是大模型方向)当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应
答案生成后,千万别直接返回给用户!LLM-as-Judge(模型当裁判):把“初步答案+用户问题+引用段落”,一起发给O4或O4-mini模型(选型理由:O系列模型的推理能力极强,擅长判断“答案是否贴合原文”),让它验证答案的准确性。信心评估:让验证模型输出“信心值”(高/中/低),比如“信心值高:答案完全基于引用段落,无遗漏、无错误”“信心值低:引用段落未明确覆盖用户问题,需重新筛选”。小白可设
摘要 RAG(检索增强生成)技术将大语言模型与外部知识库结合,通过检索相关信息辅助生成更准确的回答。其核心流程包括文档分块、向量化、检索和生成,其中文档分块策略直接影响效果。中文场景下需选择合适的Embedding模型,并采用混合检索(语义+关键词)和重排序提升精度。评估时需关注检索和生成质量,使用RAGAS框架进行全面分析。进阶方案包括Agentic RAG(具备自我优化能力)和Multimod
本文通过学习All-in-RAG第一章,详细梳理了RAG技术的核心小节,包括RAG简介、准备工作、四步构建RAG和Python虚拟环境部署。文章阐述了RAG技术如何结合外部知识库检索与大语言模型生成,解决大模型知识滞后和生成幻觉等问题,并介绍了RAG的适用场景。同时,文章强调了环境配置、工具准备和虚拟环境部署的重要性,为后续深入学习RAG技术细节奠定了基础。整体而言,本文为想要学习大模型技术的程序
本文深入浅出地解释了RAG(检索增强生成)技术的本质,强调其核心是利用检索将模型的“想象空间”转换为“被约束的知识空间”。文章指出RAG更像是一条流水线而非自由创作,并详细阐述了为何Chain(链式结构)比Agent更适合RAG架构的绝大部分环节。Chain提供可预测性、可调试性和成本控制,是RAG工程实践的关键。Agent仅适用于极少数场景,如查询意图判断和查询重写。文章最后总结,优秀的RAG系
什么是上下文工程上下文工程是指构建动态系统,以合适的格式为大语言模型(LLM)提供正确的信息和工具,从而让LLM能够合理地完成任务。上下文不仅指你发送给 LLM 的单一提示词(prompt),更应该被视为模型在生成响应前所看到的一切信息。上下文工程就是如何将合适的信息填充到有限的上下文里的艺术和科学。
RAG知识库的文档处理,没有所谓的“标准答案”,也没有一成不变的“标准流程”。对于小白和程序员来说,无需死记硬背各种操作步骤,只需抓住核心:以业务需求为导向,根据文档类型(结构化/非结构化)灵活调整处理方式,做好“元数据提取、分段合理、文档去噪、果断取舍”这四件事,就能搭建出满足需求、表现优秀的RAG知识库。切忌机械照抄别人的处理流程,毕竟每个业务的需求不同、文档特点不同,适合别人的不一定适合你。
在大多数 RAG 系统中,“R”(即 Retrieval,检索)指的就是向量搜索。通过使用Embedding模型将用户查询和数据进行向量化,然后通过语义相似度提取出最相关的信息。这通常需要借助向量数据库实现。由于朴素RAG的非常适合为查询请求进行检索相关上下文,并将其作为LLM生成回答的依据。用于朴素RAG的数据集通常包括一系列“文本”字段,每条文本都生成一个嵌入向量,如下图所示:需要注意的是,这
这可不是小打小闹的更新,而是一个拥有1300亿(130B)参数的庞然大物!这意味着,我们普通开发者和AI爱好者,终于有机会零距离接触和体验世界顶级的视频生成技术了。
在当今的大语言模型(LLM)应用架构中,检索增强生成(RAG)已成为解决模型幻觉和知识时效性问题的核心方案。
简历命名:大模型评测技术运营实习生+姓名+学校。
GitHub 上开源了一个从零开始训练大模型的一个项目,可以说是新手学习大模型的福音项目。
临近新年,Agent后三篇白皮书的原文解读已更新在网页端。 这篇文章将根据五篇白皮书全面解读AI Agent的理论。
大模型(LLM)无疑是当下最炙手可热的话题之一。从改变人们交互方式的 ChatGPT,到各行各业基于大模型开发的创新应用,LLM 正以迅猛之势重塑科技生态与产业格局。
谷歌在2025年9月15日最新发布的这份《Startup Technical Guide: AI Agents》白皮书为各领域的智能化转型提供了一套兼具实操性与前瞻性的的技术路线图
Prompt提示语是使用大模型解决实际问题的最直接的方式,本篇介绍Prompt提示工程常用的技巧,包括Zero-Shot、Few-Shot、CoT思维链、Least-to-Most任务分解。
本文将向您介绍智能体式RAG的概念、实现方法以及其优点和局限性。
代理(Agent)乃一种智能实体,具备自主环境感知与决策行动能力,旨在达成既定目标。作为个人或组织之数字化替身,AI代理执行特定任务与交易,其核心价值在于简化工作流程,削减繁复性,并有效降低人力投入与沟通障碍,促进效率与协作的双重提升。简而言之,代理技术让AI成为高效助手,助力个人与组织在复杂多变的环境中更加游刃有余。
大模型需要先经过模型设计和实现,然后再进行预训练获得通用能力,最后通过微调强化能力
AI大模型不再是技术圈的“小众游戏”,政策扶持、资本涌入与技术简化,正共同打造一个普通人可参与的职业新赛道。
在应用AI领域,“提示工程”(Prompt Engineering)多年来一直是关注焦点,如今一个新术语逐渐凸显:上下文工程(Context Engineering)。基于语言模型进行开发,正从“为提示找到合适的词句”,转向更宏观的问题——“何种上下文配置最有可能让模型产生预期行为?”
在当前的人工智能浪潮中,我们正经历一场从“语言模型”到“行动智能体”(AI Agent)的深刻范式迁移。大模型(LLM)的出现解决了机器的认知问题,但要让机器真正参与并主导现实世界的复杂任务,我们需要一个更完整、更具备自主性的系统框架。
RAG 技术一直以来都备受关注,尤其是当它与大模型(LLM)结合后,人们都满怀期待地认为:这下终于可以轻松解决那些复杂的问答任务了!然而,现实往往并不如人意。很多开发者在完成一个 RAG 流程后,都会感到困惑:**为什么它的效果并没有达到预期呢?
多模态检索增强生成_(Multimodal Retrieval Augmented Generation,简称RAG)_是一种新兴的设计范式,允许AI模型与文本、图像、视频等多种信息存储接口进行交互。
在人工智能技术的浪潮中,AI大模型(Foundation Models)正以其卓越的数据处理能力和复杂的计算结构,在公路交通领域引发一场深刻的变革。这些模型不仅推动了社会生产力的提升,还在理解、学习、适应和实现任何知识工作的能力上展现出巨大潜力,即向通用人工智能(AGI)阶段的快速进化。
文章探讨了传统RAG方法在智能体记忆管理中的局限性,如检索坍塌和剪枝脆弱等问题。为解决这些问题,提出了xMemory框架,通过“解耦到聚合”原则重构记忆管理,将原始消息流分解为情节、语义、主题四个层级,并采用稀疏度和语义分数指导结构优化。xMemory采用两阶段自顶向下自适应检索策略,有效提升证据命中率和性能,同时在LoCoMo和PerLTQA任务上显著降低Token消耗。实验证明,xMemory
分块是RAG系统中至关重要的环节,直接影响LLM的输出质量。文章详细介绍了固定大小、基于句子/段落、语义、递归分割、滑动窗口和层次化等多种分块方法及其适用场景。强调了分块要保证语义连贯、避免信息断裂,并警惕常见的分块失误。好的分块策略是构建高效RAG系统的基石。
结合前面的内容,大家应该能猜到——Agentic RAG,本质就是「传统RAG与AI智能体的深度融合」。我们已经知道,传统RAG的最大短板是“没有自主性”,只能按固定流程走;而AI智能体的核心优势就是“自主性”,能自主规划、动态调整。于是,开发者们就想到:把AI智能体引入传统RAG的工作流程中,既保留传统RAG“精准检索外部数据、减少幻觉”的优点,又借助AI智能体的自主性,解决传统RAG的灵活性不
小白 0-1 教程:免费使用 Claude Code + 智谱 GLM 国产大模型!
本仓库包含了对检索增强生成 (RAG) 在各种应用中的全面探索。 每个笔记本都提供了从入门级到高级实现的详细实践指南,包括多查询和自定义 RAG 构建。
想象一下,大模型就像一个刚毕业的博士生,知识渊博(通才)。而你的业务(比如能源工厂的故障预测)是一个高度专业的岗位。微调,就是对这个博士生进行岗前专项培训,通过学习和消化你提供的内部资料(领域数据),让他迅速成长为这个岗位上的专家(专才)。简单来说:模型微调是使通用大模型适应特定领域或任务的关键技术,通过针对性的训练,将其从"通才"转化为"专才",从而在专业场景中表现得更准确、更可靠。明确你要模型
RAG是的缩写,翻译为中文的意思就检索增强,以基于最新,最准确的数据建立LLM的语料知识库。LLMLangChain是一个用于开发由语言模型驱动的应用程序的框架。具有上下文感知能力:将语言模型与上下文源(提示说明、少量镜头示例、基于其响应的内容等)联系起来。原因:依靠语言模型进行推理(关于如何根据提供的上下文回答,采取什么行动等)import osos.environ["QIANFAN_AK"]
RAG
——RAG
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net