登录社区云,与社区用户共同成长
邀请您加入社区
清晨的咖啡桌上,同事小张举着保温杯问我:“你说这枸杞真能补肾吗?为什么中医说‘入肾经’,西医却查不到‘肾’和枸杞的直接关联?小张眼睛一亮:“这AI像个‘有知识储备的老师’,而不是‘凭记忆答题的学生’!”——这正是的魔力:让AI从“靠训练数据‘背答案’”,变成“查知识库‘解问题’”,真正实现“博学且精准”。
摘要:本文系统介绍大模型微调四阶段学习路径:基础(20天,环境配置/理论)、实践(1个月,数据处理/模型优化)、研究(2个月,论文阅读/创新)、进阶(1个月,前沿技术)。大模型微调已成为AI落地核心技能,在法律、医疗、教育等领域广泛应用。文章指出当前是学习黄金期,并提供学习资源包(含案例库/提示模板/学习路线图),强调掌握该技术可获得显著职业优势。学习路径从应用开发延伸至模型训练与商业部署,帮助学
VisPile:融合大语言模型与知识图谱的可视化文本分析系统 本文介绍VisPile系统,这是一款创新的情报分析工具,通过整合大语言模型(LLM)和知识图谱(KG)技术,显著提升文本分析效率。系统提供文档智能搜索、自动分组、内容分析、关系发现等核心功能,并配备AI生成内容的验证机制。经专业情报分析师评估,VisPile能帮助用户快速从海量文档中提取关键信息,构建知识体系,发现隐藏关联。系统采用开源
本文探讨了大语言模型中多智能体系统的应用,分析了10种架构模式(并行、顺序、循环、路由器等)及其适用场景。研究对比了单智能体与多智能体系统的优劣,指出多智能体系统在处理复杂任务时的优势,如分工协作和专业化处理。文章详细阐述了智能体间的通信机制(图状态、工具调用等),并通过具体案例展示了不同架构的实现方式,为构建高效的多智能体系统提供了实践指导。
国内AI大模型备案超430款,但企业仍倾向选择海外模型。本文从价值、接入、选型、趋势四方面解析大模型落地逻辑:大模型不仅是工具,更是企业增长引擎,可提升效率、激活传统产业;中小企业可通过"一步API"低成本接入;国内模型在本土化场景占优,海外模型在技术积淀和生态成熟度领先。未来垂直模型、云边端协同和API生态将成主流,建议企业根据需求理性选型,结合国内外模型优势快速落地应用。
智谱华章在港交所成功上市,成为"全球大模型第一股",募资超43亿港元。这家源自清华大学技术的公司是中国独立通用大模型领域的领军企业,收入年复合增长率达130%。公司即将推出新一代GLM-5模型,并设立X-Lab部门进行前沿技术探索。尽管目前仍处亏损状态,智谱持续加大研发投入,计划扩大对外投资,目标是成为国际领先的大模型企业。其股价首日涨幅近10%,市值突破560亿港元,展现出市
AgentVNE结合大语言模型与图神经网络,解决边缘计算中多智能体部署难题。其双层架构中,LLM层识别语义约束生成资源偏置,GNN层捕捉虚拟-物理网络高阶相似度。实验表明,该方法降低50-60%通信延迟,高负载提升5-10%服务接纳率,为边缘智能体"语义+拓扑"双漂移问题提供高效解决方案。
神经网络诞生于20世纪40年代,取得重要突破的节点在20世纪70年代、20世纪80年代、21世纪初。20世纪70年代:Paul Werbos博士提出了影响深远的Back Propagation的神经网络学习算法,实际上找到了训练多层神经网络的方法。
推荐几个2026年从零开始学习AI的GitHub仓库
你是不是用 FastAPI 写接口时只会用 str、int、list 这些基础类型注解?或者在写 LangChain 工具链时,不知道怎么让大模型准确识别工具参数的类型?这篇详解 Python typing 模块的常用类型、类型别名、泛型、协议、类型守卫,配合 FastAPI 接口开发和 LLM 工具调用的代码示例,让你彻底搞懂类型注解的底层逻辑和应用场景,代码可读性提升一倍,调试时间减少一半。
谷歌最新发布的《Agents》白皮书,就像一把钥匙,打开了AI从“能说” 到 “会做” 的大门。
文章详细介绍了NVIDIA最新的Llama Nemotron模型如何通过先进的推理技术,优化信息检索和生成的过程,从而提高AI系统的整体性能。
本文将围绕如何在 ReactAgent 中引入并实践 HITL(Human In The Loop,人机回路)机制展开,重点介绍实现方案及代码设计。并结合在做Agent基础平台期间,经历的一些agent的能力升级,对于Agent与工程设计之间存在的一些关联关系,分享一些个人观点。为什么需要HITL如果没有通用的人机协同,我们是如何解决人类在Agent问答中的参与过程:多轮对话式的追问,在系统提示词
本文从前端开发视角系统介绍了AI Agent开发所需的核心技术栈,涵盖LLM大语言模型基础、Prompt Engineering提示词优化、LangChain.js工具链应用、RAG检索增强生成技术、Agent工作流设计、MCP模型上下文协议及多模态开发等关键领域。文章深入剖析了各技术模块的实现原理与实践方法,包括向量数据库应用、工作流配置、多模态交互等具体场景,旨在帮助前端开发者快速构建智能化应
在大模型技术迅猛发展的今天,AI 应用正从“泛化对话”迈向“深度业务嵌入”的新阶段。如果说上半场的竞争聚焦于模型能力的展示与通用场景的覆盖,那么下半场的核心战场,则毫无疑问是深入企业业务一线的 Agent(智能体)应用。企业对 AI 的期待早已超越“能聊天、会回答”的初级阶段,转而追求能够理解行业语境、执行复杂任务、保障数据主权,并真正融入业务流程的生产力级智能体。这一趋势并非空穴来风。
刷到网友分享的一则扎心案例:朋友入手了单价9万的房子,如今房价直接跌了30%,每月还要背负3.5万的房贷,算下来每天一睁眼,就相当于亏了1000块……图片来源网络,侵删评论区里满是唏嘘,不少网友留言说自己身边也有类似的情况——有人高位接盘后资产大幅缩水,有人从事房产相关行业被波及,日子过得捉襟见肘。说实话,这几年房地产行业的低迷,早就不是什么新鲜事了。走在大街上,能看到不少停工搁置的工地,曾经门庭
大语言模型(Large Language Model, LLM)简称大模型,本质上是基于海量文本数据训练的、通过统计规律映射语言与知识的 “概率生成模型” —— 核心并非 “理解” 语言或世界,而是通过学习人类文本中的字符(词 / 字 /Token)序列关系,实现 “给定输入后,生成符合人类逻辑与常识的输出”。可从 3 个核心层面理解。
看下来,大模型微调领域范式创立时期是 2021-2023 年:LoRA (2021)、P-Tuning v2 (2021)、QLoRA (2023) 解决了大模型微调的根本问题:如何在有限硬件上高效且不牺牲太多性能地微调模型。是到23年之后,就没有大的变化,基本上都是在基石基础上缝缝补补的小改进。在工程领域,研究的更多的是把 QLoRA/LoRA 运行得更快、更稳定的问题。比如,FlashAtte
本文深入解析大模型的三大核心技术:RAG通过动态知识融合解决模型静态知识边界问题;Agent借助自主决策能力重构人机协作范式;多模态技术依托跨模态理解解锁复杂场景潜力。三者协同演进,攻克数据时效性、隐私安全与专业适配等挑战,推动行业从效率革新迈向业务重构,在医疗、金融、制造等领域催生行业级变革。ML-Summit会议大模型内容分布RAG:大模型的动态知识引擎,解决模型静态知识边界、时效性与可信度问
本文系统介绍大模型应用学习的五大核心技术:提示词工程、检索增强生成(RAG)、微调、模型部署及人工智能系统。通过从基础沟通技巧到高级系统构建的完整学习路线,帮助读者掌握大模型应用全流程,为成为年薪50W+的大模型应用工程师奠定基础,适合零基础入门到进阶学习。最近两年大模型发展很迅速,在理论研究方面得到很大的拓展,基础模型的能力也取得重大突破,大模型现在正在积极探索落地的方向,如果与各行各业结合起来
2025年大模型领域以推理模型、RLVR与GRPO技术为主导,GRPO成为研究热点。架构上Transformer仍是主流,但效率优化增多。推理扩展和工具调用成为提升性能的重要手段,"刷榜"现象凸显benchmark评估的局限性。AI在编程、写作和研究领域展现强大能力,私有数据成为竞争优势。未来发展方向包括RLVR扩展、工业级扩散模型和更好的长上下文处理技术。本文基于老司机推荐的年终盘点这篇文章的原
中国大模型行业蓬勃发展,产业链涵盖基础层、模型层和应用层。当前商业化进程活跃,金融、政府、教育等领域渗透率高。2023年市场规模增长超100%,预计2030年将超2200亿元,年复合增速40%以上。未来预测大模型、决策大模型和具身智能大模型有望成为行业新风口。百度、阿里、腾讯等企业积极布局,专利申请数量领先。行业概况1、定义大模型是指包含超大规模参数(通常在十亿个以上)的神经网络模型。
总结了一份AI相关的知识框架和学习路径:- 企业级应用学完这三个阶段,你将完成从AI新手到AI架构师的完整蜕变。作者能力有限,借此希望为想学习AI的朋友们提供一条系统性的学习路线,快速入门,拥抱AI!
结合多场面试的复盘,我总结了4个核心要点,能直接提升面试通过率:第一,吃透底层原理,拒绝“八股式背诵”:这是AI面试的核心。面试官更看重对技术的理解而非背诵能力,只有真正搞懂原理,才能在面试中从容应对各种追问,甚至能基于原理推导未知问题的解决方案;第二,深耕简历内容,提前做好问题预判:简历是面试的“核心剧本”,面试官的问题基本都围绕简历展开。建议提前借助AI工具(比如用ChatGPT根据简历生成可
作为一个长期混迹于 AI 应用后端与系统工程圈的人,我踩过 Flask 的性能坑、Django 的复杂度陷阱,直到三年前遇到 FastAPI,才找到了能同时支撑快速原型、生产级部署、大模型高并发推理的「瑞士军刀」。这 20 多篇深度长文,将从最基础的 hello world 讲起,一步步带你搭建出支持 RAG 知识库、多模态对话的企业级 AI 系统。
文章介绍了国产AI大模型的发展现状,分析了百度文心一言、腾讯元宝、阿里通义千问等主流产品。根据访问量排名,网站端DeepSeek领先,APP应用端豆包和字节跳动表现最佳。文章指出,头部互联网企业在AI大模型领域具有竞争优势,并建议大多数用户选择DeepSeek或豆包AI即可满足需求。还记得2022年11月30日Chat-GPT3.5发布吗?短短5天的时间,其用户量就飞速突破了100万。时至今日,从
2026年AI行业预测显示:AI Agent将成为生产环境核心,重塑销售客服结构,推动垂直领域落地,安全治理成为刚需,AI将从被动响应转向主动行动并进入物理世界。行业分歧集中在AGI实现时间、中美技术竞争、头部公司格局等问题。随着发展重心转向商业化应用,"AI能否盈利"将取代"能否通用"成为关键议题。
本文系统介绍了AI产品经理的学习路径,涵盖五大核心能力:AI技术、数据分析、产品思维、项目管理和基础知识。重点解析了大模型学习的7个阶段,从初阶应用到商业闭环,并提供完整学习资料包(含路线图、案例、视频教程等)。文章指出大模型岗位缺口达47万,初级工程师平均薪资28K,并展示学习者通过4个月系统学习实现薪资翻倍的案例。文末附免费资料领取方式,帮助读者快速掌握大模型技术,抓住AI职业发展机遇。
本文系统介绍了21种智能体设计模式,从基础概念到具体实现。智能体作为自主系统,具备感知环境、采取行动以实现目标的能力,其设计模式包括提示链、路由、并行化、反思等关键技术。这些模式可组合应用,构建从简单自动化到复杂协作的多智能体系统。文章还探讨了智能体的等级划分和未来发展趋势,指出智能体将向通才型、个性化、具身化方向发展,并可能成为经济参与者。21种设计模式为开发者提供了模块化工具箱,通过灵活组合可
本文介绍LangChain流式传输系统,通过values、updates、messages、custom四种模式及其组合实现LLM应用的渐进式输出。values模式返回完整历史记录,updates仅显示增量更新,messages输出LLM调用细节,custom支持自定义数据流。文章通过代码示例演示各模式实现方式,帮助开发者提升大模型应用的交互体验和响应速度。多模式组合可同时获取不同类型的数据流。
摘要: 知识图谱作为AI核心资产面临日益严重的窃取风险。传统防护手段存在性能损耗与防护不足的缺陷。AURA框架创新性地采用“主动价值破坏”策略,通过四阶段自动化流程(关键节点选择、污染物生成、污染注入、授权过滤)实现知识图谱的智能防护。实验证明,该框架可使窃取模型准确率下降40%-60%,同时授权用户性能损耗低于2%。其技术突破包括防御理念革新、自适应架构设计、双维度污染物生成等,为金融、医疗等高
DeepSeek-V3.1正式发布,采用专为国产芯片优化的UE8M0FP8Scale参数精度技术,通过无符号指数位与零尾数位组合,将动态范围扩展76个数量级,显著降低内存占用。该技术与国产芯片(如昇腾910B)协同,使128K上下文模型运行效率提升30%-40%。目前摩尔线程、燧原等厂商已原生支持FP8,华为下一代芯片也将集成该单元。技术革新带来语言任务困惑度提升15-20%,同时国家政策推动国产
报告提出了“1+3+N”合作体系,即围绕一个算力集群,通过三条技术路线(标准化软件研发、标准模型能力强化、定制化模型精调)和多个应用场景,推动AI大模型在企业知识管理、视联网内容分析、增值内容创作和客户服务等领域的应用。此外,报告还对AI大模型的未来发展趋势进行了展望,强调了技术创新、应用创新和跨领域协同的重要性。深入探讨了AI大模型在电信行业的应用前景,特别是电信运营商与云服务商在该领域的合作机
,
ChatGPT****热潮席卷全球。**ChatGPT(Chat Generative Pre-trained Transformer)是由OpenAI于2022年12月推出的对话AI模型,一经面世便受到广泛关注,其2023年1月月活跃用户达到1亿,是史上月活用户增长最快的消费者应用。在问答模式的基础上ChatGPT可以进行推理、编写代码、文本创作等等,这样的特殊优势和用户体验使得应用场景流量大幅
文章介绍两种解决大模型难题的创新方法:LENS通过给错误回答添加"置信度加权惩罚",使训练中负样本组产生有效梯度,解决算力浪费问题;GRSP将推理拆分为语义片段,通过长度感知权重减少冗余token,避免模型"过度思考"。实验表明,LENS在难题训练上表现更优,GRSP在减少token消耗的同时保持高准确率,特别适合高效训练大模型推理场景。
近年来,人工智能大模型技术呈现爆发式增长,模型参数规模从亿级迅速扩展至万亿级。根据最新研究显示,全球AI算力需求正以每3~4个月翻番的速度突破临界点,远超传统摩尔定律预测的计算能力提升速度(每18个月翻倍),形成了所谓的"逆摩尔定律"(InverseMoore'sLaw)。IDC预测,2023-2030年全球IDC市场将保持高速增长,其中AI算力需求增速显著高于传统算力。
知识图谱
——知识图谱
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net