登录社区云,与社区用户共同成长
邀请您加入社区
摘要:本文开发了一个基于Vue框架的老龄Ken用户服务系统,针对人口老龄化带来的服务需求,设计实现了包含用户管理、在线咨询、健康档案等12个功能模块。系统采用前后端分离架构,前端使用Vue组件提accessories,后端采用Node.js+Express后端框架,通过REST构建RESTtokened API实现数据交互。测试表明系统能有效提升老龄服务质量,但仍存在智能化程度不足等问题,未来拟引
抽象特性底层等效实现是否零成本泛型模板实例化✅ 是Iterator 链手写 for 循环✅ 是Trait 静态分发内联函数调用✅ 是条件分支✅ 是宏代码文本替换✅ 是Rust 让你既能写出像 Python 一样简洁、安全、高表达力的代码,又能获得像 C 一样高效的运行性能——这正是“零成本抽象”的魔力所在。
list.toArray(new int[list.size()][]) 集合转数组元素。deque.removeLast() deque.removeFirst() 删除元素。Arrays.sort(arr, (a,b)->a[0]-b[0]) 排序第一个元素。deque.peekLast() deque.peekFirst() 获取首尾元素。deque.addLast() deque.addF
大模型微调不是“全参开干”就完事。从LoRA到BitFit,从Adapter到Prefix-Tuning,九种主流方法各有千秋。本文一次性讲清每种技术的原理、适用场景与资源代价,帮你避开“调了等于没调”的坑,精准选对落地策略。
【强烈推荐收藏】LLM微调技术全解析:从零开始学大模型微调,程序员必备指南
大模型省侧落地反思:为什么业务导向是关键?细分场景怎么做?缺哪些 AI 人才?
看不懂AI圈新术语?一文搞懂LLM、RAG、MCP、Agent的关系
这篇文章深度解读了谷歌最新《AI Agents技术指南》,详细介绍了ADK开发框架、Agent2Agent协议、ReAct框架和AgentOps方法论,全面展示了从技术背景、核心架构到企业级部署的完整技术路径,并通过实际应用案例探讨AI Agent技术的未来发展趋势,为开发者提供了构建AI Agent系统的实用指南。
本文详细介绍了RAG应用的经典架构与流程,包括数据索引阶段(加载、分割、嵌入、索引)和数据查询阶段(检索、生成),以及演进出的检索前处理与检索后处理。同时分析了RAG应用面临的五大挑战:检索召回精确度、大模型抗干扰能力、上下文窗口限制、RAG与微调选择及响应性能问题。最后阐述了RAG架构的三阶段演进:从Naive RAG到Advanced RAG再到Modular RAG,展示了RAG技术不断优化
以 Llama-3.1-8B 为例,零训练的 RLMT 模型 Llama-3.1-8B-RLMT-Zero 聊天平均分达 15.6,比经过多阶段微调、用 2500 万 + 样本训练的 Llama-3.1-8B-Instruct 高 5.5 分;同时,RLMT 还支持两种灵活的训练模式。以 Llama-3.1-8B-RLMT-Zero 为例,随着训练步骤推进,其推理部分的 token 从初始阶段的不
本文探讨了RAG系统中数据召回问题的排查与解决方案。作者发现多向量库存储导致不相关数据被召回,分析了文档质量问题和设计缺陷两个原因。提出采用两次召回策略:第一次高阈值召回并重排序,第二次在相关库中使用较低阈值召回。强调RAG系统需要持续优化调整,召回质量直接影响大模型表现。
在过去半年中,Claude团队不断迭代Claude Code,探索了智能体设计中的核心挑战,包括长时任务的内存管理、权限体系的平衡,以及子代理的协同方式。在这一体验中,Claude会实时生成软件,没有预设功能或预写代码,用户可以直接看到Claude在交互过程中即时创造与适配的过程。在一系列公共评测中大幅领先,特别是在金融、法律、医学和STEM等专业领域的知识与推理上,远超此前的Opus 4.1。在
大模型算法岗简历怎么写?这些关键细节,帮你打动面试官!
从榜单来看,Gemini系列、GPT5、Seed1.6-vision等闭源模型的整体性能更胜一筹,但Qwen-Omni、InternVL、SAIL-VL、Ovis等系列的开源模型已具备强劲竞争力,英文榜单前10的模型中有5个为开源模型,而中文榜单前10的模型中,有7个为开源模型。而开源阵营中,Qwen3-Omni-30B-A3B-Instruct分别取得英文榜第二名和中文榜第三名的好成绩,此外,I
本次大模型训练使用的数据集是原用于训练Paddle的PPLCNET模型的数据集中的图片,排除了部分类别后,剩余总类别为3600类,每个类别(菜品)用独立文件夹区分存储。但原数据集并没有特别完善的中文菜名,如使用英文+数字的命名或使用主要食材进行命名,因此,本次数据集的构建采用了如下过程进行二次构建。
比如,“猫鼻子”的Token和“猫眼睛”的Token总是一起出现,并且位置固定,那么它们就可以被合并成一个代表“猫脸”的新Token。目前的多模态大模型(MLLM)在融合视觉和语言信息方面取得了很大进展,但背后一直存在一个根本性的挑战:图像和文字,这两种模态的信息表示方式,存在一道天然的鸿沟。BPE算法的核心思想很简单:在文本处理中,它会不断地把语料库里最高频出现的相邻字符对(比如'e'和's')
graph-rag-agent项目创新融合GraphRAG与DeepSearch技术,实现可解释、可推理的智能问答系统。项目支持多格式文档处理、LLM驱动的实体关系提取、增量更新机制,提供多级检索策略和思考过程可视化。系统包含NaiveRagAgent、GraphAgent等多种Agent实现,并配备完整评估系统。文章还提供大模型学习资源,涵盖基础理论、RAG开发、Agent设计等5大模块,助力不
文章详细介绍了大模型在业务中的四种落地模式(嵌入式、辅助式、代理式、群体式)及六种常用技术(PE、RAG、PEFT、ME、FT、Agent)。分析了各模式与技术特点、适用场景及优缺点,并提供了学习路线与应用建议,帮助开发者根据业务需求选择合适的技术方案,实现大模型在业务中的高效应用,从基础提示工程到复杂Agent架构的系统化指南。
文章介绍了如何为不同应用场景选择合适的Embedding模型,提供了六步评估框架:明确业务需求、评估数据特性、调研可用模型、评估候选模型、规划集成部署、进行端到端测试。针对文本、图像、音频和多模态数据,详细分析了各种模型选择方法和评估指标,强调最合适的模型不一定是benchmark分最高的,而是最契合业务实际需求与技术约束的模型。
2025 Agent 落地元年!从技术概念到商业主流,程序员必看的 “超级外挂” 攻略
2025工业大模型应用进展与展望|附21页PDF文件下载
RAG系统工作流程概览RAG系统的核心在于检索与生成流程的深度融合,其核心逻辑是通过动态引入外部知识,大幅提升输出内容的准确性与相关性。具体工作流程以用户查询为起点:首先,检索模块借助向量检索等技术,将用户查询转化为向量形式,从文档库、知识图谱或搜索引擎等外部知识源中快速定位、筛选并提取高度相关的信息片段;随后,以LLM为基础的生成模块会整合查询内容与检索到的上下文信息,经推理、整合与重组,最终生
95%的AI智能体项目在投入生产前失败,主要原因是过度关注准确性而非问题解决率。传统方法因系统提示过长导致LLM注意力分散。Parlant框架通过按需激活的规则系统、双重防护机制和状态机架构,使智能体更可控、可预测。该框架支持条件-动作配对、工具调用控制和并行任务处理,适用于金融、医疗等高风险场景。构建成功智能体的关键是架构设计和行为建模,而非单纯追求AI的"聪明"程度。
文章介绍了MCP支持的三大通信方式:stdio通过标准输入输出通信,适合本地开发和插件集成;SSE基于HTTP长连接,支持流式传输,适合在线对话和长任务;HTTP采用传统请求-响应模式,适合轻量远程调用。这三种方式分别针对不同场景,使MCP能够灵活适配从本地到云端的各类环境,为大模型与外部服务提供稳定通信通道。
在大模型时代,Agent作为应用落地范式成为共识,但企业落地效果差,主要因通用大模型缺乏业务理解。通过Ontology建模(如Palantir方案)可让大模型快速掌握业务知识和经验,形成智能化决策大脑,提升企业数字化决策效率,降低成本。企业自建此系统难度高,建议采用成熟方案。Ontology的价值取决于企业数字化决策带来的效益,在制造业、供应链、能源、医疗和金融等领域有广泛应用场景。
文章详解大模型显存管理的底层逻辑,拆解四大显存构成要素(模型参数、激活值、梯度和优化器状态),结合Qwen2.5-7B模型测算推理、LoRA微调与全量微调场景的显存需求。深入探讨GaLore等前沿优化技术如何突破显存限制,并提供实用估算工具与针对性建议,帮助开发者在有限显存条件下高效部署大模型,推动大模型应用从数据中心走向消费级硬件。
本文详解GRPO算法,一种用于大语言模型训练的新型强化学习技术。通过组内相对奖励机制替代传统价值网络,GRPO显著降低了计算开销和内存需求,同时提升了训练稳定性。在DeepSeek-R1模型中,GRPO算法在数学推理和代码生成任务中表现优异,训练效率较PPO提升30%,内存占用减少50%,为大规模语言模型微调提供了更高效的解决方案。
文章介绍大模型智能体上下文管理,涵盖上下文概念、窗口处理策略、系统提示词设计、RAG工作流程、思维链应用、多工具调用设计、评估指标和压缩技术等。通过电商客服场景展示实践,提供代码实现示例,为开发者构建高效智能体提供全面指导。
Ling 2.0是业界首个在MoE模型上支持FP8混合精度训练的开源方案。通过细粒度量化、FP8优化器、按需转置等技术,在保持模型效果几乎无损的同时,实现了90-120%的吞吐提升,单卡显存节省14-16GB。该方案解决了FP8训练中的精度损失问题,为有限计算资源下的大模型训练提供了高效解决方案。
本文面向企业法务团队和管理者,系统介绍了AI的定义、分类、商业战略价值及实施方法。重点分析了AI在知识产权、数据安全、隐私保护、伦理合规等方面的风险,提出了相应的管理策略。同时探讨了AI对残障人士的影响及企业如何负责任地应用AI技术,为企业合规使用AI提供专业指引。
AI Agent是能够自主感知环境、思考规划并行动以达成目标的智能系统,由LLM大脑、工具箱和记忆系统组成。其核心是通过"感知-思考-行动"的循环工作,ReAct框架让LLM交替生成思考和行动指令。与普通聊天机器人不同,AI Agent能主动完成复杂任务,代表了大模型时代人机交互的新范式,未来将深刻改变我们工作和生活的方式。
重新排列范围,使得指定位置的元素等于排序后的元素,并且左边的元素都不大于它,右边的元素都不小于它。算法的原理是 “覆盖” 要删除的元素,将保留的元素移到前面,返回新的逻辑尾迭代器,但。对范围内的每个元素应用一个函数,并将结果存储在另一个范围内。移除范围内连续的重复元素,返回新的逻辑结尾迭代器。旋转范围内的元素,使中间元素成为新的第一个元素。这些算法不会改变它们所操作的容器中的元素。这些算法会修改它
生产调度:在给定的资源(机器、人员、物料)约束下,为任务(工单、工序)分配时间与资源,实现"成本最低、效率最高、交期最准"的目标。传统调度算法:基于数学模型的精确优化方法,如遗传算法(GA)、蚁群算法(ACO)、禁忌搜索(TS)等,擅长处理结构化、确定性问题。大语言模型(LLM):基于Transformer架构的预训练语言模型(如GPT-4、Claude 3、Llama 3),具备自然语言理解、上
摘要:MCP支持三种通信方式:stdio模式通过标准输入输出实现本地高效通信,适合开发调试;SSE模式基于HTTP长连接,支持流式传输,是在线对话和长任务的首选;HTTP模式采用传统请求-响应机制,适合轻量级远程调用。这三种方式使MCP能够灵活适配从本地到云端的不同应用场景,为AI模型与外部服务提供稳定可靠的通信通道。
LoRA(低秩自适应)是一种高效的大模型微调方法,通过冻结原模型参数并引入可训练的低秩矩阵,显著降低训练成本和显存需求。其核心优势包括:仅需微调少量参数(0.01%-1%)、训练速度快、产出模型小(MB级)、支持模块化任务切换且无推理延迟。该方法广泛应用于指令微调、领域知识注入、代码优化等场景,成为当前大模型定制化的主流技术之一,尤其适合消费级硬件实现高效微调。
程序员进阶指南:大模型算法岗高薪密码拆解 + 免费学习资源全攻略,冲刺154万年薪不是梦!
场景智能体:AutoSFT+知识图谱,遗忘率<2%数据飞轮:TEE+区块链确权,数据不出域可用算力网格:Serverless+动态混部,PUE≤1.15绿色低碳:稀疏MoE+液冷,碳排-30%数字孪生:BIM+GIS+实时视频,虚实同步<500ms。
大模型入门不迷路:什么是 AI 模型训练?新手 & 程序员都适用的指南
你可以把《群星低语》看成一个游戏,但也可以跳出游戏的范畴,将它视为人和AI相处的未来发展方向和初级形态——科技公司研发的聊天AI是无形的,而当游戏公司为这些AI赋予了生动的外表、神情、声音、语气,它们是否会无限接近于我们梦想中的人工智能,以至于,就像现在人们在游戏中寻找虚拟角色的陪伴和慰藉那样,未来,我们也许不再需要真正的人类了?)比起通常游戏的受众,这类选择和AI“游玩”的玩家肯定是对现存的游戏
本文系统解析AI智能体五大核心模式:反思模式赋予AI自省能力;工具调用模式扩展认知边界;推理-行动闭环实现知行合一;规划分解模式应对复杂任务;多智能体协作实现社会性智能。每种模式都包含详细流程与深度思考,帮助读者理解AI如何从"工具"向"伙伴"转变。文章还提供了大模型学习资料,助力开发者把握AI技术前沿,为AGI发展奠定基础。
大模型转行指南:从迷茫到落地,一个“三老”从业者的真心话
RAG的出现,让LLM从“通用型对话工具”升级为“垂直领域的知识助手”。它不仅解决了LLM的知识时效性、准确性问题,更降低了专业AI系统的开发门槛,为医疗、法律、教育、工业等领域的AI落地提供了可行路径。未来,随着“多模态RAG”(支持图片、视频、音频等非文本知识的检索)、“记忆增强RAG”(结合长短期记忆模块,让系统记住用户历史需求)等技术的发展,RAG将进一步突破现有局限,成为LLM走向“通用
摘 要视觉多模态(Vision-centric Multimodal)以图像/视频为核心,协同文本、音频、雷达、结构化传感等异构数据,在交通、医疗、制造、金融等领域率先完成规模化落地。本文提出“视觉中枢-语义桥接-任务协同”三层融合框架;系统分析视觉大模型、跨模态对齐、稀疏推理、边缘系统四项关键技术;给出电网缺陷检测、高速抛洒物识别、医疗影像报告生成三个实测场景,视觉模态贡献度分别提升18%、27
算法
——算法
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net