登录社区云,与社区用户共同成长
邀请您加入社区
一核:LangChain(基础组件)三翼:LangGraph(编排)、LangSmith(可观测)、LangServe(部署)辅助:LangFlow(可视化)、LangHub(共享)、第三方集成(扩展)这套生态让大模型应用开发从 “手工作坊” 转向 “工业化生产”,兼顾灵活性、效率与生产级可靠性。
Agent = LLM(大脑) + Planning(规划) + Memory(记忆) + Tools(工具)其中,只有 LLM 部分属于大模型应用范式”,其余模块均依赖传统软件工程技术实现。
1.文章即路径:所有AI生成文本,都是大模型在Token空间中逐点行走、串联而成的完整轨迹;2.Prompt即定位:初始提示词锁定路径起点与行进目标,决定整篇内容的核心方向;3.生成即迭代:每一个Token都依赖全部历史路径决策,步步接续,无跳跃、无预判;4.幻觉即偏轨:路径误入Token空间的虚拟分支,是概率生成机制的固有特性;5.参数即策略:调控每一步的选路规则,平衡文本的精准度与创造力;6.
维度内容重要性技术实力核心技术、专利、架构能力⭐⭐⭐⭐⭐工程文化代码质量、开发流程、团队氛围⭐⭐⭐⭐行业影响力开源贡献、技术分享、社区活跃度⭐⭐⭐⭐⭐人才吸引力招聘能力、开发者社区认可⭐⭐⭐⭐建立技术品牌是一个长期的过程,需要持续的投入和耐心。希望这些策略和案例能帮助创业团队更好地建立自己的技术品牌。✅ 开源核心技术,建立技术护城河✅ 持续输出高质量技术内容✅ 建设活跃的开发者社区✅ 参与行业交流
AWQ 算法核心 idea 和代码主导是 MIT Han Lab。
AI Agent长期记忆系统的构建挑战与解决方案 摘要:本文剖析了AI Agent在长期协作任务中的记忆缺陷,指出大模型本身的无状态特性导致其无法自然形成长期记忆。作者提出需构建包含工作记忆、情景记忆、语义记忆和程序记忆的四层记忆系统,并强调写入策略比检索机制更为关键。文章分析了向量数据库的适用场景与局限,比较了RAG、MemGPT等不同方案的适用性,指出完善的元数据设计才是记忆系统的核心。最后作
自回归填空解决了"理解与生成不可兼得"的底层矛盾;MoE+DSA解决了"模型越大、推理越贵"的成本矛盾;异步Agent RL解决了"训练与实战脱节"的成长矛盾。这套组合拳的最终结果,就是GLM-5能以开源模型的身份,在代码能力、长文本推理、智能体任务上逼近甚至超越部分闭源顶级模型,同时把幻觉率压到行业最低水平,用约15%的成本实现闭源模型95%的性能。你不再需要为"用不起的聪明"买单,也能拥有一个
本文深入探讨了LLM多模态模型与世界模型在技术本质、硬件算法及全球赛道格局上的核心区别。LLM如同“万能杠精/哲学家”,擅长概率预测和描述,而世界模型则像“物理工程师”,专注于基于动作的时空因果预测。两者在基础硬件(算力、显存需求)、软件算法架构(自回归Transformer vs DiT结合3D高斯泼溅)、以及国内外发展格局(如World Labs、NVIDIA Cosmos、极佳视界等)上存在
vLLM 负责跑得快,AWQ 负责装得下;vLLM+AWQ 就是在消费级显卡上高效跑大模型的主流方案。AWQ 是“带结构的 4bit 权重 + 必须实时反量化计算”,vLLM 是“依赖新 GPU 硬件加速的推理引擎”;不是“直接加载就行”,而是“加载后还要高速算”,所以必须要求 SM7.5+、INT4/Tensor Core 这些算力架构。
硬件平台NVIDIA RTX 3080 Ti 12GB涵盖模型Qwen3 系列 / Gemma 4 系列。
对于大龄程序员而言,转行到AI大模型领域是一个既充满挑战又极具吸引力的选择。在这个领域,您将有机会接触到最新的技术趋势,参与到前沿的项目中,并且有可能获得更高的薪酬。
形态谁决定下一步能查外部知识能调工具/行动典型形态Chatbot用户不一定否纯对话RAG人写死的检索流程是通常否知识库问答Workflow人写死的流程图可以可以拖拽式流程、自动化编排Agent模型动态决定可以可以自主任务执行最简单的判断口诀是:人提前写死路径,就是 Workflow;模型当场决定路径,才是 Agent。
AI发展正面临从"算力至上"到"判断力优先"的范式转变。当前大模型虽然通过算力扩张实现了能力突破,但始终无法解决幻觉、安全性和可靠性等核心问题。数字世界的AI可以容错,但物理世界的AI需要确定性判断——知道何时该行动、何时该收敛。判断力与算力形成互补:算力决定能力上限,判断力保障安全底线。行业长期忽视判断力建设,因其成效难以量化。随着AI进入自动驾驶、工业控制等关键领域,构建可靠的决策系统比单纯提
2026年AI Agent技术迎来爆发式发展,主流厂商纷纷推出企业级Agent平台。报告分析了12大主流框架的技术特点,包括OpenAI、腾讯元乘兵等企业级平台,以及LangGraph、AutoGPT等开源框架。AI Agent已从概念验证走向规模化应用,在企业核心业务流程中实现平均35%的效率提升。报告重点探讨了Agent的四大核心能力(规划、工具使用、记忆、感知)和技术架构演进,并指出多Age
随着AI岗位需求激增,传统大数据技能面临挑战。文章指出,大数据工程师转型大模型应用开发是关键,转型方向包括RAG应用开发、AI Agent开发和LLM数据工程。这些方向能利用大数据工程师的现有技能,如数据管道、SQL和分布式系统经验,实现低成本高效率的转型。文章还提供了具体的实践路径和避坑指南,鼓励工程师主动学习和实践,提升自身在大模型领域的竞争力。
KV Cache是大模型自回归生成任务的核心优化技术,通过缓存历史Key和Value向量,将推理复杂度从O(n²)降至O(n)。文章系统分析了KV Cache的两大范式:应用层的语义缓存和底层的前缀精确匹配缓存,深入探讨了其技术原理、工程应用及规模化挑战。KV Cache能显著提升响应速度、降低GPU负载,并有效减少长任务Agent的运行成本。文章还详细阐述了KV Cache在Transforme
当你和ChatGPT对话的时候,你有没有想过一个问题:它到底是怎么"理解"你说的话,然后给出回答的?很多人把大语言模型(Large Language Model, LLM)想象成一个超级聪明的大脑。但真相可能比你想象的更简单,也可能更令人震撼——。今天我想从数学和工程的角度,把LLM的工作原理彻底讲清楚。不需要你有很深的数学背景,但我会尽量做到准确,不搞模糊的比喻。
本文探讨如何利用智能工具提升工作效率,解决信息过载与执行困难问题。文章介绍了10个实战场景,包括超长文档解析、多格式文件处理、代码辅助开发、跨语言文献调研、创意内容生成、企业知识库构建、会议纪要整理、合同审查、数据分析报告以及个性化学习路径定制。这些智能工具能够深度理解上下文,打破格式壁垒,辅助逻辑推理,实现跨语言信息整合,并针对不同需求提供定制化解决方案。通过将先进技术与实际工作场景结合,帮助知
文章回应了"识别正确就能解决AI决策问题"的误区,指出识别存在物理极限无法100%准确,且正确识别后仍需判断力处理矛盾情境。作者强调判断力能解决识别不确定时的安全决策问题,通过纳秒级响应和物理硬约束确保安全。文章认为可靠的AI需要识别和判断力两条腿走路,前者解决感知问题,后者处理不确定性和安全决策。目前判断力领域仍待发展,相关算法已开源。
为什么新疆喀什与黑龙江漠河的同分同秒出生者,其心理投射与行为节律模型截然不同?解答“是否有针对偏远地区优化真太阳时的排盘工具”这一核心技术痛点,必须首先揭开现代标准时制(平太阳时)带来的统计学噪音。玄易排盘项目组依托百万级典籍高净值语料与 GIS 空间测算系统,不仅还原了四柱时空模型的客观校验基准,更彻底祛除了历法神秘主义的最后一块遮羞布。这不仅是时间的修正,更是古典数理模型向现代行为统计学的全面
上游行业正处于数字钻井演进的决定性时刻。二十多年来,数字化工作的重点一直是通过追求更好的预测、更好的物理模型和更强的数据规范,以此作为实现更高性能的途径。早期的钻井模型是确定性和以物理为中心的,建立在水力计算、扭矩和阻力计算、孔隙压力和地质力学估算以及稳态建井模拟器之上。这些模型提供了严谨性,但也受到其对输入质量敏感性以及对钻井环境理想化假设的限制。第二代方法扩展到概率推理、统计学习和基于回归的预
实体对齐是信息融合与数据集成领域的核心技术,旨在识别并关联不同图数据中指向现实世界同一对象的等价实体节点。这一技术在构建大规模统一知识库、支撑智能化语义搜索以及提升推荐系统精准度等国家大数据战略需求中具有重要的应用价值。然而,随着多源图数据规模的持续扩张,实体对齐任务面临图结构高度异构、语义信息复杂多样带来的严峻挑战。具体而言,不同图数据通常由不同机构独立构建,其构建背景与业务需求各异,导致其拓扑
莆田字序生命科技研发的V5.1认知决策系统为AI植入了判断力引擎,解决了大模型缺乏情境认知的核心缺陷。该系统通过六十四卦态势空间实现:1)安全场景强制响应(如遇红灯/侮辱立即停止);2)日常交互动态调整(社交/学习场景自由发挥);3)复杂问题多维度解析。其创新在于将安全设为不可覆盖的硬件级约束,同时保持开放场景的灵活性。目前已提交13项专利,核心算法开源,支持对接各类AI系统与执行器。
Prompt 就是你发给大模型的所有输入内容,不只是一句简单的问题,而是你塞进 messages 列表里的所有文字:指令、背景信息、参考资料、示例、格式要求……全部算在内,总称 Prompt。外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传{ role: "system", content: "你是一个 OnCall 助理,回答必须简洁" },{ role: "user", co
作为一名本地大模型用户,我分享了最近体验 OmniInfer 的感受:它不是单纯的聊天 UI,而是一个跨平台本地 AI 推理底座,支持多后端、OpenAI-compatible API,并覆盖 Windows、macOS、Linux、Android、iOS 等场景。文章也介绍了两个基于 OmniInfer 的 Demo:桌面端 OmniStudio 和安卓端 OpenOmniBot,适合关注本地
本文深入解析了大语言模型的核心技术架构。首先介绍了文本数字化的关键步骤,包括Tokenization和词嵌入转换。重点剖析了Transformer的自注意力机制,详细解释了Q、K、V矩阵的数学原理和计算过程。针对推理阶段的性能瓶颈,文章阐述了KVCache技术如何通过缓存历史键值向量来优化计算效率,同时分析了其显存消耗的代价。最后总结了Tokenizer、注意力机制和KVCache共同构成了大模型
NVIDIA 深度学习培训中心(DLI)提供的《构建基于大语言模型的应用》 AI 培训班即将开课,由 NVIDIA 认证讲师全天实时中文授课和答疑,配合云端实验环境的动手实操帮助每位学员深入理解 LLM 应用开发并积累实践经验,从而快速投入实际开发工作。无论是个人技能跃升还是团队能力建设,NVIDIA 深度学习培训中心(DLI)的生成式 AI 认证学习路径都能为您提供系统支撑 —— 从认证科目选择
DeepSeek 新账号送 500 万免费 token,等价 $3.40 付费额度。本文用 14 天亲测数据告诉你这 500 万 token 能跑多少次 API 调用、哪些坑会让你 4 天烧光、以及怎么用 OpenAI SDK 一行代码切到 DeepSeek。
截至2025年底,超过500篇文献: 以Transformer架构为基石,沿着“基座模型训练 → 能力激发 → 自主智能体”的技术栈,系统梳理LLM生态系统的全生命周期。
当前,传统的地质灾害评价模型(如信息量法、多因子加权分析等)仍在广泛应用,但随着大语言模型(如DeepSeek、ChatGPT)与GIS技术的结合,这一领域迎来了全新的智能化解决方案。利用DeepSeek、ChatGPT和相关AI工具分别梳理 AI 技术、GIS 在地质灾害防治领域的国内外研究进展,指出当前研究的不足,如数据融合不充分、模型精度待提高等,明确本研究的切入点。坡度、坡型、高程、地形起
摘要:本文剖析了AI产品经理的发展路径,指出应用型AI产品经理是最具前景的方向。文章揭示了三大常见误区:观望不前、盲目学习和技术跑偏,并提出"三步学习法":夯实产品基础、掌握AI项目落地能力、补充AI知识。同时强调AI产品经理的核心在于技术与业务的结合能力,而非单纯的技术深度。文末推荐了系统学习资源,帮助读者抓住AI时代机遇,实现职业跃迁。(149字)
大模型本质上是一个函数,其基础能力是根据前文预测下一个 token。模型内部可学习的数字称为参数,这些参数通过海量数据训练调整,压缩了语言知识、推理模式等。训练过程涉及大量文本输入、预测、错误计算和参数调整,使模型学习统计规律。推理阶段则利用训练好的参数生成回答,此阶段参数不会更新。大模型的核心在于拥有大量参数,通过训练学习并应用能力。先不碰复杂数学,先把“大模型到底是什么”这个图像建立起来。大模
本次课程,专门面向产品经理人群,解析当下最热门的AI产品应用的必备的「大模型」、「多模态」的实际应用和算法原理!前段时间还跟字节、腾讯的资深 AI 产品经理沟通,他们反馈:在大量招人,只要有 AI 相关的项目经验,基本都能拿到面试机会,而且领导很舍得给钱,涨薪 40-60% 很正常!对于产品经理来说,如果你不懂技术,做不了业务和AI大模型技术衔接、定义不了数据需求,是没法完整的落地一个产品的!课程
文章阐述了AI智能体的核心价值与工作逻辑,将其定义为具备自主思考、资源调动、工具实操、团队协作能力的数字员工。智能体以大模型为核心大脑,通过封装好的Skill技能执行任务,调用全域软硬件资源,并支持多智能体协作。此外,智能体还具备记忆系统以积累经验并持续优化。文章最后指出,AI智能体将替代重复性人工工作,开启智能生产力时代。当下AI技术迭代的核心,早已不再是单纯的聊天对话,而是AI智能体(Agen
企业大模型应用面临的核心挑战是让AI准确理解内部私有资料。RAG技术通过检索增强生成有效解决了这一问题,目前主流架构有三种:Classic RAG通过向量检索匹配相似文本片段,适合固定答案查询;Graph RAG构建知识图谱处理关联性问题;Agentic RAG则能自主规划查询路径应对复杂问题。三种架构各具优势:Classic RAG简单高效,Graph RAG擅长关系分析,Agentic RAG
本项目是一个基于深度学习的船舶航行轨迹智能预测与分析平台,整合了多种AI模型和大语言分析能力。系统采用Vue3+Flask技术栈,支持LSTM、GRU、Transformer等5种深度学习模型进行轨迹预测,具备单船预测、批量预测和实时监测三种模式。核心功能包括:1)多架构轨迹预测与模型评估;2)大模型航行智能分析;3)实时偏差告警与可视化大屏展示;4)Word报告自动生成。测试数据显示各模型预测精
2026年,半导体行业迎来了一场“降维打击”。hw最新公示的“三进制逻辑门电路”专利,不仅仅是多了一个数,更是对传统二进制架构的一次颠覆性挑战。这标志着中国在芯片设计底层逻辑上,终于拥有了“yyls”的话语权。本文将深度剖析这项专利的技术原理,探讨它如何解决光刻机限制、提升AI推理效率,并助力大模型产业彻底脱离美国技术束缚。
小米推出新一代开源大模型MiMo V2.5,定位为全模态智能体基础模型。该系列采用MoE架构,支持文本、图像、视频、音频等多模态输入,具备100万Token超长上下文处理能力。核心亮点包括强化Agent工具调用、长链任务规划及软件工程能力,总参数310B但仅激活15B参数,实现高效低成本推理。MiMo V2.5-Pro特别优化编程任务,支持多文件项目开发。模型采用MIT协议开源,适合开发者构建AI
今天这篇大模型辅助文献检索与筛选全技巧指南,就是为科研人量身打造的——不搞虚的理论,全程聚焦“能直接落地”的实操方法,从检索词构建、文献初筛、核心提炼到价值判断,每一步都有大模型精准辅助技巧,还有实用工具调用示例,跟着做就能把文献处理效率拉满,把时间省下来做核心研究!更关键的是,大模型能适配不同科研阶段的需求,不管是开题时的文献调研、实验中的文献参考,还是论文撰写时的文献梳理,都能高效辅助,是科研
ollama 是一个语言大模型平台,可以在上面安装部署市面上的语言模型。开源免费,可离线使用。本文介绍如何在 windows 系统上安装和使用 ollama。
On-policy distillation(OPD)已成为 LLM 领域中一种流行的训练范式。与仅从环境中可验证结果获取稀疏信号的强化学习(RLVR)不同,OPD 选择一个规模更大的模型作为 teacher,为每个采样轨迹提供密集且细粒度的信号。近年来,该领域探索了 on-policy self-distillation(OPSD),其中同一个模型既作为 teacher 又作为 student,
随着互联网的普及和电子商务的快速发展,电商平台积累了海量的数据,包括商品信息、用户评价、销售记录等。这些数据蕴含着丰富的商业价值,如消费者需求、市场趋势等。然而,传统的数据分析方法在处理复杂的非结构化数据(如文本评价)时存在一定的局限性。本文章的目的在于探讨如何利用大语言模型来进行电商数据分析,挖掘这些数据背后的潜在信息,为电商企业的决策提供支持。范围涵盖了从数据收集、预处理到模型应用和结果分析的
几乎同时,网信部门也发布公告,针对该平台未落实信息内容管理主体责任,在热搜榜单主榜扎堆呈现炒作明星个人动态和琐事类词条等不良内容,存在泛娱乐化倾向问题,对该平台采取约谈、责令限期改正、警告、从严处理责任人等处置处罚措施。近日,国内某头部直播电商平台遭遇监管“双杀”:国家市场监管总局对其旗下电商子公司立案调查,同时网信部门也对该平台采取约谈、责令限期改正等处罚措施。监管层将推进直播电商主体库建设,强
摘要 本文系统剖析了Transformer架构的核心原理及其在大语言模型中的工程实现。首先从语言建模的演进历程切入,指出Transformer通过自注意力机制解决了传统RNN/LSTM的并行计算瓶颈和长距离依赖问题。文章深入解析了三大核心组件:1) Embedding层将离散符号转化为连续向量空间;2) RoPE位置编码通过旋转角度建模相对位置关系;3) Self-Attention机制实现上下文
语言模型
——语言模型
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net