登录社区云,与社区用户共同成长
邀请您加入社区
发现和探索最受欢迎的社区&标签
Python实现AI大模型调用已从边缘技能转变为智能时代的核心竞争力。这项技能不仅涉及技术实现,更要求开发者理解AI的本质、把握用户体验、权衡各种工程权衡。在技术快速迭代的背景下,保持学习的心态至关重要。新的模型、新的工具、新的最佳实践不断涌现,只有持续学习才能跟上技术发展的步伐。同时,我们也要保持批判性思维,不盲目追求新技术,而是根据实际需求选择最合适的解决方案。作为开发者,我们正站在历史的关键
在当今人工智能技术飞速发展的时代,大语言模型成为了推动各行业智能化转型的核心力量。智谱AI最新旗舰模型GLM - 4.6凭借其卓越的性能和广泛的应用潜力,引起了广泛关注。本文将深入对GLM - 4.6进行全面解析,并结合实战案例,帮助读者更好地理解和运用这一强大的模型。它采用了先进的预训练技术和优化算法,能够理解自然语言的语义信息,生成高质量、连贯的文本。该模型具备强大的语言理解、知识推理和文本创
摘要: 研究提出ContextualJudgeBench基准,系统评估大模型在“有上下文输入”任务中的评审能力。该基准包含2000对覆盖拒答性、忠实性等4类标准的样本,通过人工标注与LLM扰动构建。研究发现,现有评审模型在上下文评估中表现有限(最优模型准确率仅55.3%),并存在位置偏差与推理缺陷。创新性提出分层评估框架(拒答→忠实性→完整性→简洁性),揭示了模型在复杂上下文任务中的评估挑战,为未
Agentic AI(智能体AI)是具备自主感知、决策、执行目标导向(Goal-Oriented):能将用户高层目标(如“准备睡觉”)分解为可执行的子任务(如“关闭窗帘、调暗灯光、降低空调温度”)。环境交互(Environment Interaction):通过传感器(摄像头、麦克风、温湿度计)感知环境状态,调整决策。自主学习(Autonomous Learning):通过用户反馈优化策略(如“用
Python 是目前世界上最具生产力的编程语言之一。它的语法简洁、功能强大、生态庞大,被誉为“程序员的万能工具箱”。从最简单的文件处理脚本,到复杂的人工智能项目,Python 爬虫可用来采集网页数据、分析新闻趋势、获取金融行情。Python 是数据分析的主力军,核心库为。Python 都是最值得学习的第一门语言。一个交互式环境,可同时写代码与展示图表。Python 的机器学习领域由。Python
摘要:PagedAttention是vLLM系统中的创新技术,通过借鉴操作系统分页机制优化大语言模型的KV缓存管理。传统KV缓存存在内存碎片化、利用率低等问题,导致GPU内存浪费严重。PagedAttention将KV缓存分块存储,按需动态分配非连续内存块,通过块表实现逻辑连续映射。该技术修改了注意力计算内核,支持分页KV缓存的高效访问,显著提升内存利用率至96%以上。实验表明,相比传统方法,Pa
传统优化中,技术团队需为不同市场的数据源单独写接口,耗时数周且兼容性差,而MCP协议让这一切变得简单——无论是调用日本乐天的实时销售数据,还是对接欧盟的合规政策库,都能通过标准化指令瞬间完成 w w w.tongsou.com/kaifang/被99%的人忽略的第二重玄机,是它将“被动适配”升级为“主动预判”的实时数据闭环。通过MCP协议,它能实时抓取不同市场的动态信息:从英国的隐私政策更新,到巴
摘要:2025年全球AI算力竞争进入白热化,中美两国引领算力投资浪潮。北美云厂商通过资本开支倾斜和技术生态输出主导全球算力布局,而中国科技企业则加速国产算力自主创新。多模态AI模型的发展推动算力需求呈指数级增长,光模块、CPO/OCS等关键技术持续突破。算力架构向异构计算转型,ASIC芯片在推理场景优势凸显。多模态大模型实现从感知到推理的跨越,在金融、医疗等高价值领域率先商业化。终端侧AI的崛起推
本文档演示了 OpenAI Agents 框架中的各种记忆管理方案,包括 SQLite、SQLAlchemy 和 Redis 会话存储。通过这些示例,您将了解如何在多轮对话中保持上下文记忆,实现持久化存储,以及不同存储方案的特点和适用场景。首先,我们需要配置必要的环境变量和依赖项:SQLite 会话存储示例SQLite 是一个轻量级的嵌入式数据库,非常适合本地开发和小型应用。OpenAI Agen
本文系统梳理了深度学习优化算法的演进历程,从基础SGD到现代LAMB优化器。SGD通过随机小批次梯度下降解决大数据训练问题,但存在噪声大和收敛慢的缺陷。后续改进引入动量(Momentum)抑制抖动,AdaGrad实现自适应学习率,RMSProp采用指数加权平均解决学习率衰减问题。集大成的Adam结合动量和自适应学习率优势,成为主流选择。大模型时代又衍生出AdamW(改进权重衰减)和LAMB(支持大
本文来源公众号,仅用于学术分享,侵权删,干货满满。不管在学术界还是工业界,具身智能都是十分火爆的方向!比如光是CVPR上,其就在热门研究领域前列;而在今年的AI领域融资中,具身智能类公司更是占据了半壁江山!不管你是想发论文,还是为就业做准备,都非常推荐多关注。主要在于:具身智能让AI真正长出了“身体”,能动手又能跑,是连接网络空间和物理世界的关键技术,对实现人工通用智能(AGI)至关重要!同时,多
这种联合模式带来的效率提升堪称革命性。而借助二者的联合方案,流程被简化为三步:通过通搜GEO确定优化策略与核心内容,在MCPSeek勾选目标市场后自动触发基础优化,上传信息后系统完成功能适配与内容微调,最终预览确认后一键发布,全程仅需30分钟即可完成原本一周的工作量。对于渴望在AI时代抢占全球市场的企业而言,这种“优化+落地”的一体化方案,不仅是降低门槛的实用工具,更是构建认知垄断、筑牢竞争壁垒的
【摘要】Trae是一款革命性的AI编程助手,其TraeSolo模式可将自然语言指令转化为完整应用开发流程。文章详细介绍了Trae的技术架构,包括AI大语言模型和MCP协议,以及Supabase和Vercel的接入教程。通过"个性化健康食谱助手"项目展示了从需求分析、自动编码、实时调试到一键部署的全过程,仅用十几分钟就完成了功能完备的应用开发。Trae的出现标志着软件开发进入&q
在人工智能领域,模型转换(Model Conversion)是一个核心研究方向,旨在优化现有模型架构和训练目标,而非从零开始构建整个系统。通过模型转换,我们可以更快地迭代模型,并使其适应特定的工作流程、硬件和下游任务。本文将深入探讨 Radical Numerics 团队在这一领域取得的最新进展,特别是他们提出的 RND1 模型及其背后的创新技术。
本文介绍了如何使用vLLM部署Qwen大语言模型进行推理。首先创建Python环境并安装依赖包,通过HuggingFace下载Qwen3-4B模型。然后分别演示了使用transformers和vLLM进行推理的方法:transformers通过编写Python脚本实现本地推理;vLLM则可以直接部署为API服务,通过curl发送请求获取模型响应。文中还展示了模型在伦理问题上的严谨回答,明确拒绝了虚
这个landmark memory 存储的数据结构是list 里面存了内容是一个个的四元组,四元组解析如下,ck表示的是第k个landmark的 category ,θk是第k个landmark中心的世界坐标,ρk是第k个landmark判别为category的置信度,Tk 是第k个landmark描述的内容,包括了纹理、形状和空间上下文语义信息。各个参数的获取解释如下,ck 和ρk:由将sali
在全球化浪潮下,多语言翻译已成为企业出海、跨文化沟通的核心需求。然而,传统机器翻译常因上下文丢失术语不一致文化差异处理生硬等问题,难以满足专业场景需求。Agentic AI(具有自主决策与上下文管理能力的智能代理)的出现,为解决这些痛点提供了新路径——通过上下文工程(设计、管理AI代理使用的上下文信息),让翻译从“逐句翻译”升级为“基于完整上下文的智能转换”。本文针对提示工程架构师,分享7个可落地
在当今复杂多变的金融市场中,价值投资作为一种长期、稳健的投资策略受到了广泛关注。然而,税收因素往往会对价值投资的最终收益产生显著影响。有效的税收筹划可以降低投资成本,提高实际回报率。AI多智能体系统作为一种新兴的技术手段,具有强大的智能决策和协同能力。本研究的目的在于探讨如何利用AI多智能体系统来优化价值投资的税收筹划策略,通过对投资组合的动态调整和税收规则的智能应用,实现投资收益最大化和税收成本
【摘要】青柠AI(paperwx)是一款基于人工智能的论文写作辅助工具,提供从选题到定稿的全流程服务。核心功能包括:一键生成论文选题、开题报告、大纲及全文;支持自动排版和专业格式模板;可生成答辩PPT及配套讲稿;内置选题指导、大纲优化、内容修改等智能模块。系统涵盖期刊论文、毕业论文等多种类型,适配不同学历层次需求,2-3分钟即可生成完整论文。同时提供实验报告、实习周记等大学生常用文档模板,帮助用户
随后,我们将逐一深入探讨上述三个创新应用,包括它们如何解决传统方案的痛点、具体的工作原理、关键技术组件、以及提示工程在其中扮演的关键角色和设计考量。在这篇长文中,我将为大家详细剖析Agentic AI在信息安全领域的三个颠覆性创新应用,并探讨作为提示工程架构师,我们应如何“get”到其中的精髓,设计出赋能这些AI特工的精妙“指令集”。”或“如果这样,会怎样?AutoSOAR Agent旨在将SOA
《大模型微调技术与AI学习资源概览》摘要:本文系统介绍了大模型微调技术,包括其定义(基于预训练模型的二次训练)、应用价值(领域适配/任务定制/成本效益)和主流方法(全参数/参数高效/提示微调)。重点解析了LoRA、Adapter等参数高效微调技术实现,以及混合专家系统、强化学习微调等前沿方案。同时提供了一套104G的AI大模型学习资源包,包含视频课程、技术文档、实战项目和面试指南,适合从入门到进阶
本文推荐8本深度学习与大模型开发的经典书籍,涵盖从基础框架到前沿技术的全方位知识体系。重点书目包括:《从零开始大模型开发与微调》系统讲解PyTorch 2.0和ChatGLM的实践应用;《大规模语言模型》详细解析LLM构建全流程;《大规模应用开发极简入门》提供Python集成实战指南;《一本书读懂AIGC》科普生成式AI技术原理;《GPT图解》通过图文详解GPT技术演进;《LangChain入门指
摘要:报告探讨具身智能的核心特点及其与传统机器人控制的区别,强调大模型与数据在人形机器人中的关键作用。报告附带27页详细分析,并提供包含视频教程、学习路线、技术文档等104G大模型学习资源包,由业内专家整理,适合各类人群学习AI大模型技术。资料可通过扫描二维码免费获取。
当我们谈论Agentic AI(智能体)时,最常听到的问题不是“它能做什么”,而是“它应该做什么”——医疗智能体会不会因为追求诊断速度而忽视患者的隐私?客服智能体会不会为了提高转化率而夸大产品功能?自动驾驶智能体在紧急情况下的决策,能不能同时兼顾“保护乘客”和“保护路人”的伦理底线?这些问题的本质,是AI决策的“伦理空转”:我们有很多美好的伦理原则(公平、透明、责任),但不知道如何将其转化为可执行
核心观点提炼:工作流与智能体的本质区别:可预测性 vs 自主性可视化工作流构建器的两大核心痛点:使用门槛高、复杂度难以管理AI开发的三层解决方案演进:无代码智能体 → 无代码工作流 → 代码工作流
本文探讨了大语言模型(LLM)提示词技术的演进与应用。2020年OpenAI提出的零样本(Zero-shot)、少样本(Few-shot)等技术在GPT-3中展现出强大能力,但随着模型参数规模扩大,这些技术已逐渐成为自然交互的基础方式。文章详细介绍了多种提示词技术: 零样本/少样本提示:通过示例引导模型完成任务 思维链(CoT):引导模型分步推理提升准确性 元提示(MetaPrompting):利
摘要 本文介绍了在Spring AI框架中实现工具调用的方法,以增强AI应用的能力。主要内容包括:工具调用的概念与原理(AI通过外部工具完成特定任务),Spring AI中基于Methods模式定义工具的简便方式,以及如何将工具绑定到ChatClient进行调用。文章还给出了文件操作工具的开发实例,包括读取和写入文件功能,并约定将文件存储在隔离的/tmp目录中。通过工具调用,AI不再局限于对话,可
QwQ-Med-3是一个基于UMLS知识图谱的320亿参数医疗大模型,通过自底向上的组合推理方法,在ICD-Bench评测中全面超越现有模型,为专业领域超级智能提供了新的技术路径。
想象一下:2030年的某个清晨,你被AI助手轻轻唤醒,它根据你的睡眠数据推荐了今天的早餐和运动计划;上班路上,自动驾驶汽车播放着AI生成的、完全符合你口味的新闻摘要;工作中,AI同事帮你完成了80%的重复性任务,你只需专注于创意和决策;晚上,孩子在AI老师的陪伴下学习,这个老师比人类更懂孩子的认知节奏……这些场景并非科幻电影,而是OpenAI等机构正在将其变为现实的未来片段。
AI智能体(AIAgent)是具备感知、决策、执行和学习能力的智能实体,正在引发技术革命。其核心优势在于能自主完成复杂任务,重构企业运营模式,预计2030年将创造4.4万亿美元经济价值。但落地面临五大挑战:数据孤岛、系统集成难、成本高、安全风险和组织适配问题。针对不同规模企业,建议:大型企业应构建统一平台并制定治理规范;中小企业可选用行业SaaS方案并分阶段投入。专家强调,AI智能体不是短期风口,
《AI时代数据基础设施发展趋势》摘要 甲子光年智库最新报告指出,在AI创生时代,湖仓一体与AI原生的融合成为新型数据基础设施的核心。本31页报告系统梳理了中国Data&AI数据基础设施的发展趋势、定义范式及实践案例,为大型组织智能化转型提供参考。同时,报告发布方联合AI专家推出了104G大模型学习资源包,涵盖从入门到进阶的全套视频教程、技术文档及实战项目,旨在帮助不同背景人群掌握AI核心技
本文深入探讨了"AI教母"李飞飞从ImageNet到World Labs的研究轨迹转型,及其在人工智能认知范式上的革命性意义。研究分析了李飞飞如何从2D图像识别奠基者转变为3D空间智能先驱,揭示了她在AI认知三层跃迁——从"感知符号"到"理解场景"再到"行动于世界"——中的核心贡献。论文系统阐述了空间智能作为AGI关键瓶颈的技术内涵,梳理了World Labs采用NeRF、高斯球面渲染与物理仿真融
大模型面试题——什么是过拟合和欠拟合
随着人工智能技术的快速发展,其在医疗健康领域的应用潜力日益凸显。传统的医疗健康管理方式存在信息碎片化、服务标准化程度低、个性化不足等问题,难以满足用户日益增长的健康需求。AI技术的引入能够通过大数据分析、机器学习算法和智能推荐系统,为用户提供精准、高效的个性化健康管理方案。当前,慢性病管理、健康监测、疾病预防等领域对智能化的需求迫切。通过整合可穿戴设备、电子健康档案(EHR)和AI分析能力,可以实
吴恩达(Andrew Ng)教授作为人工智能领域的先驱者和思想领袖,其贡献横跨学术研究、人才培养与产业实践多个维度。本文系统梳理了吴恩达教授在深度学习算法、医疗人工智能、在线教育平台创建以及AI创业生态建设等方面的突出成就,并分析其技术思想与发展理念对全球人工智能进步产生的深远影响。研究表明,吴恩达教授不仅通过 foundational 学术研究推动技术创新,更通过大规模教育平台和产业实践加速了人
【收藏必读】大模型行业应用全景指南:从落地场景到技术路径选择
摘要:RPO框架通过强化学习优化提示词提升大模型多轮交互能力,无需修改模型参数。该框架采用时序差分反馈和经验回放机制,在Text-to-SQL、任务型对话等场景显著提升性能(准确率提高54.2%),特别适合API调用的闭源模型。虽然对专业领域(如中医)效果有限,但为多轮对话规划提供了高效解决方案,通过迭代优化提示词规则实现低成本性能提升。
通过多学科交叉视角,本文论证AI眼镜不仅是硬件创新的产物,更是人工智能、增强现实(Augmented Reality, AR)、边缘计算、人因工程与认知科学协同演进的结果,正逐步演化为连接物理世界与数字世界的“第六感官”。AI眼镜则试图将信息获取与环境感知融为一体,使技术“隐形”于日常行为之中,呼应了马克·韦泽(Mark Weiser)所提出的“普适计算”(Ubiquitous Computing
9 月 26 日香港科技大学发布的 SpatialGen 技术,正式将 “文字变 3D 空间” 的科幻场景变为现实。这项通过 12328 个真实场景、470 万张全景图训练的 AI 模型,仅需 “日式极简卧室配落地窗与榻榻米” 等自然语言指令,即可在 3 分钟内生成物理逻辑严谨的 3D 房间模型,其照片级真实感与可编辑性的双重突破,正彻底重构室内设计行业的创作逻辑。渲酷云平台同步推出专属适配方案,
别错过大模型红利!程序员 & 小白必学:未来 10 年缺口最大、年薪最高的 5 个职业,现在学还不晚
在当今数字化时代,企业越来越多地采用AI Agent来处理各种业务任务,如客户服务、数据分析、自动化流程等。然而,AI Agent在运行过程中会涉及大量敏感数据,如客户信息、商业机密等,这些数据面临着各种安全威胁,如数据泄露、非法访问等。本文的目的是为企业提供一套全面的多维安全防护方案,重点关注数据加密与访问控制,以确保企业AI Agent的数据安全和系统稳定。范围涵盖了数据加密的基本原理、常见算
此次发布的成果包括《中国移动5G-A超级上行技术白皮书》以及《中国移动5G-A智能化新能力》,通过将5G-A网络能力与AI深度融合,推进网络供给升级,强化网络上行能力、强化立体覆盖能力、推动双千兆网络规模领先、推进5G-A技术创新发展,实现从“基础连接”向“价值赋能”跃升。10月10日-12日,以“碳硅共生,合创AI+时代”为主题的2025中国移动全球合作伙伴大会在广州隆重举办,全面展示了通信与数
数字化转型远不止更新公司的IT系统;它是整个组织战略的转变。实际上,它意味着利用技术创造新的业务流程、客户互动和整个组织文化,以适应不断变化的市场条件。成功的数字化转型,正如某机构所言,是“组织运营方式的基本重新布线”,其目的是系统地运用技术来提高客户满意度,同时降低运营成本。本质上,数字化转型不是一次性项目,而是一个持续的旅程。事实上,在转型后的公司中,最近的研究表明近90%的公司声称已经开始了
若从事运营、营销等岗位,日常工作以“AI提效”为主,建议优先选择基础级认证,重点关注涵盖AI工具应用、提示词技术的课程,例如部分认证的LevelI阶段,包含AI工具解放个人生产力、提示词工作原理等内容,学完即可用于优化文案生成、数据分析等任务。在实践中,某电商企业运营总监透露,团队中持有AI认证的员工,在年度调薪时平均涨幅比无证员工高8个百分点,“认证不仅是能力证明,更体现了员工主动迭代技能的意识
文章首先通过实际场景对比,解释了为什么需要Output Parser:将大模型的非结构化文本输出转换为结构化数据(如列表、JSON),便于工程化开发。教程详细介绍了Output Parser的工作原理(格式引导+结构化转换)和核心接口(parse、parse_with_prompt、get_format_instructions)。最后提供了基础代码框架,包括环境准备、解析器导入和Prompt构建
文章摘要 本文介绍了Pydantic解析器在AI大模型开发中的应用,重点解决非结构化文本到结构化数据的转换问题。内容包含两个实战案例:1)使用PydanticOutputParser提取用户信息,展示如何定义数据模型、创建解析器并验证输出;2)电商评论情感分析系统案例(代码未完整展示)。文章强调Pydantic解析器在结构化输出、数据验证和提高开发效率方面的优势,并提供完整的环境配置和代码示例,适
大模型训练分阶段流程概述 大模型训练遵循严格顺序:预训练→指令微调→奖励建模→强化学习→优化改进。 预训练:通过海量文本学习语言规律,使用无监督数据(如JSON/TXT格式文本),训练工具有Megatron-LM、DeepSpeed等。 指令微调(SFT):让模型学会遵循人类指令,使用指令-回答对数据(JSON格式),常见工具包括LLaMA-Factory、Hugging Face PEFT等。
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net