深度解析Agent AI:构建跨域多模态智能代理的全面指南与实战案例
深度解析Agent AI:构建跨域多模态智能代理的全面指南与实战案例
本文由斯坦福、微软、加州大学洛杉矶分校和华盛顿大学的联合团队发布,系统地将“Agent AI”推向了多模态交互的下一个前沿。该团队详细阐述了Agent的进阶路径,包括借力、融合、交互和进化四个阶段,同时介绍了三大核心技术,即无限记忆代理、统一多模态Transformer和混合现实知识推理。此外,文章还探讨了Agent AI面临的四大挑战,如幻觉治理、偏见包容性、数据隐私和可解释性,并提出了相应的解决方案。最后,展望了Agent AI在游戏、机器人、医疗等八个领域的应用前景,为构建跨域、跨模态的智能代理提供了统一的框架。
这份由顶尖高校联合团队发布的综述,将“Agent AI”视为多模态交互的未来发展方向。
它横跨计算机视觉、机器人、医疗、法律以及游戏引擎等多个领域,旨在“通用人工智能(AGI)”的背景下,为能够“看、听、动、推理”的代理系统提供一个统一的框架。
本篇综述试图回答以下几个关键问题:
- 如何在一个统一的框架内,利用现有的大模型,快速构建出跨域、跨模态、跨现实的智能代理?
- 怎样缓解代理在落地过程中特有的伦理风险,如幻觉、偏见、隐私和安全等问题?
- 如何设计出可持续自我改进的数据与评测体系,使代理在真实世界中能够不断进化,变得越来越聪明?
一、Agent的进阶路线
- 借力:将LLM/VLM作为“常识引擎”进行冻结,通过prompt工程或轻量适配层来输出高层计划,充分利用现有大模型的知识储备。
- 融合:引入Agent Token,将“语言、视觉、动作”映射到同一潜空间,进行端到端的微调。这样既能保持大模型的容量,又能注入领域特定的动作信息,实现多模态的深度融合。
- 交互:通过人在回路、环境反馈和自我对抗三条途径并行,形成“数据-模型”的双循环机制,不断优化代理的性能和行为。
- 进化:利用合成数据、蒸馏和增量RL等技术,实现代理在上线后仍能持续学习和改进,不会出现性能下降的情况。同时,建立如CuisineWorld、VideoAnalytica等评测闭环,确保代理的进化方向符合预期。
二、Agent AI的“三大件”
2.1 无限记忆代理(Infinite Memory Agent)
- 核心思想:将跨任务专家的轨迹转化为“可检索向量记忆”,当遇到新任务时,根据上下文向量召回最相关的子轨迹,然后交给低层控制器执行,从而实现对历史经验的有效利用。
- 技术要件:
- 采用轨迹分段编码(CNN+Transformer)将轨迹信息编码后存入记忆库。
- 利用向量近似搜索(FAISS)实现零样本或few - shot召回,快速找到相关的历史轨迹。
- 通过强化微调(Offline RL + IL)使代理能够适应新的动力学环境。
- 示例:RoboGen系统让机械臂在仿真环境中自主“提出任务-生成场景-练技能”,将真机数据需求从104小时大幅降低到102小时,显著提高了训练效率。
2.2 统一多模态Transformer(Agent Transformer)
- 输入:包括视觉块token、语言token以及动作/工具token(新设Agent Token),实现了多模态信息的统一输入。
- 结构:采用标准解码器结构,但动作token仅参与自注意力子空间,避免了与语言信息争夺容量,保证了模型对不同模态信息的有效处理。
- 训练:
- 一阶段进行大规模图文预训练,以保持模型的语义理解能力。
- 二阶段利用机器人或游戏轨迹进行Next Action Prediction,仅对动作token计算交叉熵损失,从而专注于动作预测的训练。
- 优势:无需依赖外部LLM黑箱,能够直接解释动作概率;模型体积较小(250 M~3 B),可以在实时控制环路中运行;并且方便加入安全层,如动作白名单、预算限制等,提高了模型的安全性和可靠性。
2.3 混合现实知识推理(Mixed - Reality with Knowledge - Inference Interaction)
- 微观层:当遇到未知场景时,先调用VLM生成“场景图”,再由LLM生成“常识假设”,最后与真机传感器的数据进行贝叶斯更新,实现对未知场景的快速理解和推理。
- 宏观层:在VR/AR环境中,人类可以通过“游戏手柄+自然语言”的方式快速进行示范,代理能够实时蒸馏策略,实现“教一遍,到处用”的高效学习模式。
- 结果:在Minecraft、Flight Simulator、Assassin’s Creed等6款商业游戏上的实验表明,利用10~48帧关键图即可零样本生成可执行的高层计划,人类盲测胜率比基线高18%,充分证明了该技术的有效性。
三、大模型的核心驱动力与挑战
3.1 幻觉治理
- 问题:LLM/VLM在动作生成时可能会“脑补”出不可行的步骤,从而导致机器人碰撞或医疗误判等严重问题。
- 方案:
- 检索增强生成(RAG):先将当前环境的图文信息向量化,然后在外部知识库中召回最相关的5条“状态-动作”对,通过对比损失约束模型输出,确保其不与召回片段矛盾。
- 双通道校验:并行生成“动作描述”和“安全说明”,由安全模型(轻量BERT)判断两者是否冲突。若置信度低于阈值,则触发“人类接管”或“保守回退”机制。
- 实验:在医疗问诊场景中,幻觉率从14.3%降低到了3.7%,同时平均响应时延仅增加了210 ms,有效解决了幻觉问题且对性能影响较小。
3.2 偏见与包容性
- 问题:由于训练语料主要以英语和西方文化为主,代理在处理少数族裔或特殊群体场景时,表现会有所下降。
- 方案:
- 数据层面:通过主动学习和人机协同标注的方式,对低置信度样本优先进行采集,目标是使肤色、性别、年龄等分布与census数据的误差小于3%,从而丰富训练数据的多样性。
- 模型层面:在损失函数中引入“人口奇偶”正则项,约束不同群体在情感分析、动作建议等方面的F1差异小于2%,确保模型对不同群体的公平性。
- 部署层面:提供“用户-代理”双向反馈按钮,将冒犯性输出写入在线回放池,并在24小时内自动进行重训,及时纠正模型的偏见。
3.3 数据隐私
- 问题:代理需要长期记忆用户的偏好,但医疗、游戏对话等数据中可能包含敏感信息,如何保护这些数据的隐私成为一个关键问题。
- 方案:
- 本地差分隐私:在用户侧对文本embedding添加Lap(1/ε)噪声,当ε=1时,模型在下游问答中的性能下降小于1.2%,在一定程度上保护了用户数据的隐私。
- 联邦微调:只上传梯度,服务器使用SecureAggregation进行聚合,300个客户端在100轮后收敛速度与集中式训练的差距小于5%,既保证了训练效果,又保护了数据隐私。
- 删除权:在向量数据库中为每个用户建立“可撤销索引”,当收到GDPR删除请求后,能够在5分钟内完成级联删除并给出哈希证明,确保用户数据的可删除性。
3.4 可解释性
- 问题:端到端Transformer的动作策略难以通过安全认证,因为其决策过程往往难以理解和解释。
- 方案:
- 引入Chain - of - Thought Token:在动作token前强制生成“我为什么这样做”的语言序列,并用0.1的α损失加权,使模型的决策过程具有一定的可解释性。
- 可视化注意力热图:将最后一层对视觉patch的attention进行双线性上采样,与机器人的第一视角叠加,工程师可以通过肉眼检查“模型是否在看正确物体”,直观地了解模型的决策依据。
- 符号策略蒸馏:将神经网络策略蒸馏成线性时序逻辑(LTL)公式,然后用模型检测器验证“永不碰撞”等硬规则,使验证通过率从71%提高到了96%,增强了模型的可解释性和安全性。
四、Agent八大前景方向预览
综述中,提到了Agent AI在以下八个领域的应用前景:
4.1 游戏:从“脚本NPC”到“自主玩家”
场景细分 | 技术方案 | 价值指标 | 挑战 | 落地预测 |
---|---|---|---|---|
1.1 NPC行为生成:开放世界、RPG、沙盒 | 用LLM替代行为树,实时读取玩家语音/文字并生成对话和任务;VLM解析玩家表情/手势以调整NPC情绪;记忆模块存储长期互动史,形成“关系图谱”。 | 重复对话率下降90%;玩家沉浸度提高40%(Steam盲测)。 | 上下文长度限制;多人同步一致性。 | 2025年AAA游戏首发;2027年成为引擎标配。 |
1.2 人类-NPC协作:副本、团本、体育 | Agent Transformer将“战术语言”映射为“战术动作”;多代理强化学习,使NPC小队与人类玩家共同训练。 | 通关率提高25%;语音指挥延迟小于200 ms。 | 奖励函数设计;实时语音噪声。 | 2026年电竞训练伙伴;2028年残奥会电竞示范项目。 |
1.3 游戏内容自动生产:地形、关卡、剧情 | LLM生成主线,VLM生成概念图,扩散模型贴图,程序网格化;玩家一句话即可生成“可玩副本”。 | 关卡生产时间从3周缩短到3小时;美术成本降低70%。 | 风格一致性;性能优化。 | 2025年Roblox、UE插件;2027年60%中小工作室采用。 |
4.2 机器人:从“示教再现”到“语言即任务”
场景细分 | 技术方案 | 价值指标 | 挑战 | 落地预测 |
---|---|---|---|---|
2.1 家庭服务:叠衣、洗碗、递水 | LLM将“把脏碗放进洗碗机”分解为6个子任务;VLM检测“脏碗”“洗碗机门”的姿态;小样本模仿学习,50次演示可达到85%的成功率。 | 家务人力时长减少30%;老人独立生活指数提高20%。 | 安全认证;硬件成本低于3万人民币。 | 2026年高端家用的beta版本;2029年规模化应用。 |
2.2 柔性制造:小批量多品种 | Agent读取MES订单,自动生成技能脚本并调度多机;数字孪生实时反馈,实现Sim→Real闭环。 | 换线时间从2天缩短到2小时;缺陷率降低40%。 | 跨品牌协议;机密数据共享。 | 2025年汽车、3C试点;2028年成为智能工厂Tier - 1方案。 |
2.3 灾难救援:核泄漏、地震 | 无人机群和地面机器人配合,LLM做“任务简报”并自动生成搜索路径;视觉-语言导航(VLN)零样本。 | 搜索覆盖率提高35%;人员辐射暴露减少80%。 | 极端环境感知;通信中断。 | 2027年消防演练;2030年福岛退役现场应用。 |
4.3 医疗:从“知识库问答”到“全链路代理”
场景细分 | 技术方案 | 价值指标 | 挑战 | 落地预测 |
---|---|---|---|---|
3.1 分诊 & 诊断:初级保健、远程村 | LLM结合症状、化验和影像进行鉴别诊断;检索PubMed实时证据,置信度低于0.8时自动转诊。 | 诊断准确率接近住院医师(Top - 3达到92%);患者等待时间减少50%。 | 法规(FDA/NMPA);责任归属。 | 2025年非洲远程分诊;2027年国内互联网医院L3级应用。 |
3.2 手术辅助:术中导航 | VLM实时解析内窥镜图像并叠加AR提示;Agent预测器械轨迹,提前0.5 s预警碰撞。 | 出血量减少15%;学习曲线缩短30%。 | 延迟小于50 ms;伦理审批。 | 2026年腹腔镜试点;2029年骨科关节置换常规应用。 |
3.3 康复 & 心理治疗:慢病、抑郁 | 情感推理代理通过多轮对话和表情识别,生成个性化康复游戏(Kinect/Quest)。 | 抑郁量表HAMD下降8分;患者依从性提高45%。 | 数据隐私;危机干预。 | 2025年北美数字疗法处方;2028年医保覆盖。 |
4.4 多媒体内容生产:从“剪映”到“导演AI”
场景细分 | 技术方案 | 价值指标 | 挑战 | 落地预测 |
---|---|---|---|---|
4.1 长视频理解 & 再创作:体育、影视 | Agent将2小时比赛浓缩为10秒高光时刻;自动生成解说词、配乐和字幕,支持多语言。 | 制作时间减少95%;社媒点击量提高3倍。 | 版权库;文化语境。 | 2024年巴黎奥运应用;2026年成为短视频平台标配。 |
4.2 广告/电商:直播切片 | 实时识别商品露出,自动剪辑并生成口播脚本;数字人主播与真人同框互动。 | 转化率提高20%;人力成本降低80%。 | 数字人伦理标识;实时性。 | 2025年抖音、TikTok商用量产。 |
4.5 XR(AR/VR/MR):从“人工建模”到“一句成景”
场景细分 | 技术方案 | 价值指标 | 挑战 | 落地预测 |
---|---|---|---|---|
5.1 零代码虚拟制片:电影、广告 | 导演说出“赛博朋克菜市场”,LLM生成脚本,VLM生成概念图,NeRF/高斯溅射生成实时可漫游场景;代理演员自动走位。 | 资产成本降低90%;迭代周期从天缩短到分钟。 | 光照一致性;实时渲染。 | 2025年Unreal插件;2027年30%网络大电影采用。 |
5.2 远程协作 & 培训:设备维修 | 现场工人佩戴HoloLens,Agent识别故障并叠加动画指引;语音问答,无需手动操作。 | 维修时间减少35%;培训周期减少50%。 | 遮挡、强光;网络带宽。 | 2025年航空、风电巡检应用;2028年成为工业标准。 |
4.6 知识检索与法律:从“关键词”到“代理律师”
场景细分 | 技术方案 | 价值指标 | 挑战 | 落地预测 |
---|---|---|---|---|
6.1 法律问答 & 合同生成 | LLM结合判例库、条文和客户目标生成合同;Agent自动比对对方修改并高亮风险。 | 律师初级工作量减少60%;风险漏检率降低40%。 | 责任界定;跨境法域。 | 2025年律所SaaS;2027年法院诉状自动生成试点。 |
6.2 专利/学术检索 | 代理读取发明披露,自动检索全球专利并生成可专利性报告;进行图表对比。 | 检索时间减少80%;新颖性判断准确率提高25%。 | 多语言;图像公式识别。 | 2024年EPO/USPTO内测;2026年向高校开放。 |
4.7 情感与社交:从“聊天机器人”到“数字伙伴”
场景细分 | 技术方案 | 价值指标 | 挑战 | 落地预测 |
---|---|---|---|---|
7.1 孤独症 & 老年陪护 | Agent记住用户生平、喜好,生成个性化对话;视觉识别情绪并调节语调、话题。 | 孤独量表UCLA下降30%;家属满意度达到4.5/5。 | 情感依赖;伦理边界。 | 2025年日本、北欧社区应用;2028年纳入社保。 |
7.2 虚拟偶像 & 社交元宇宙 | ・基于实时动作捕捉与语音合成技术,驱动 3D 虚拟形象与千万粉丝同步互动,支持多语言实时口型匹配;・结合用户画像与互动历史,动态调整偶像人设、话题方向,例如根据粉丝地域偏好推送本地化内容;・引入群体情绪感知模块,当检测到粉丝群体出现负面情绪时,自动触发安抚话术或趣味互动环节。 | ・单场直播同时在线人数峰值突破 100 万;・头部虚拟偶像年度打赏收入超 1 亿美元;・粉丝月均互动时长较传统虚拟形象提升 65%。 | ・深度伪造技术滥用风险,需明确虚拟形象标识;・跨文化语境下的内容审查,避免价值观冲突;・粉丝过度情感投射引发的伦理争议。 | ・2024 年初已实现初步商业化落地,头部娱乐公司推出专属虚拟偶像;・2026 年预计形成 “虚拟偶像经纪 - 内容制作 - 商业变现” 完整产业链,中小经纪公司渗透率超 30%;・2028 年社交元宇宙平台中,虚拟偶像将成为用户社交互动的核心媒介之一。 |
4.8 智能制造与智慧城市:从 “单点智能” 到 “群代理调度”
场景细分 | 技术方案 | 价值指标 | 挑战 | 落地预测 |
---|---|---|---|---|
8.1 交通信号 & 车路协同 | ・路口部署多模态感知 Agent(摄像头、雷达、车联网数据接收模块),实时采集车流、行人、天气数据,生成动态交通状态向量;・路口 Agent 与车载 Agent 建立分布式通信网络,通过联邦强化学习协商 “绿波带” 通行速度,减少车辆怠速等待;・引入全局交通调度 Agent,基于区域车流预测(LSTM 时序模型)动态分配各路口通行权,避免局部拥堵扩散;・针对紧急车辆(救护车、消防车),触发优先级调度机制,提前清空通行路线。 | ・核心城区平均通行时间降低 20%;・高峰时段车辆怠速时长减少 25%,间接降低碳排放量 15%;・紧急车辆通行响应时间缩短 30%,救援效率提升显著。 | ・车载 Agent 渗透率不足,部分老旧车辆无法接入协同网络;・交通、公安、城管等部门数据壁垒尚未完全打通,影响全局调度精度;・极端天气(暴雨、暴雪)下感知设备故障率上升,需冗余设计。 | ・2025 年在国内一线城市核心区(如北京中关村、上海陆家嘴)建成示范区;・2027 年新售车辆车载 Agent 预装率超 80%,实现区域级车路协同;・2028 年覆盖全国一线城市核心区,二三线城市重点区域试点,交通拥堵指数下降 18%。 |
8.2 楼宇 & 能源 | ・楼宇内部部署多类型传感器 Agent(温湿度、光照、人员密度、能耗计量),实时采集建筑运行数据;・能源管理 Agent 聚合光伏电站、储能设备、空调系统、照明系统数据,通过多目标优化算法(最小化能耗、最大化舒适度)生成调度方案;・支持自然语言交互,用户可通过语音询问 “当前楼宇能耗结构”“为何关闭某区域空调”,Agent 自动生成可视化报告与文字解释;・引入预测性维护 Agent,基于设备运行数据(如电机振动、管道压力)预测故障风险,提前触发维修工单。 | ・商业楼宇综合能耗降低 25%,住宅楼宇能耗降低 18%;・能源管理系统投资回报期缩短至 3 年以内;・设备故障停机时间减少 40%,维护成本降低 35%。 | ・老旧楼宇传感器改造难度大,布线成本高;・能源调度涉及电网、物业、用户多方利益,需建立协调机制;・能源数据属于敏感信息,需加强网络安全防护,防止数据泄露。 | ・2026 年新建绿色建筑强制标配智能能源 Agent 系统,实现能耗实时监控与优化;・2028 年完成一线城市重点老旧楼宇改造,能耗管理覆盖率超 60%;・2030 年全国存量楼宇改造率达 50%,助力 “双碳” 目标实现,建筑领域碳排放量较 2025 年下降 12%。 |
五、总结与展望
这份由斯坦福 - 微软 - 加州大学洛杉矶分校 - 华盛顿大学联合团队发布的综述,不仅系统梳理了 Agent AI 的技术框架(进阶路线、三大核心技术),更直面行业痛点(四大挑战与解决方案),并通过八大应用场景的详细落地规划,为跨域多模态智能代理的发展提供了清晰路径。
从技术层面看,Agent AI 正从 “依赖外部大模型的借力阶段” 向 “自主进化的闭环阶段” 迈进,无限记忆代理解决了 “经验复用” 问题,统一多模态 Transformer 实现了 “多模态协同”,混合现实知识推理打破了 “虚拟与现实的壁垒”,三者共同构成了 Agent AI 规模化落地的技术基石。从应用层面看,游戏、机器人、医疗等领域的落地预测显示,2025-2030 年将是 Agent AI 从 “试点验证” 到 “规模化普及” 的关键期,尤其是在智能制造与智慧城市领域,群代理调度模式将推动社会生产生活效率实现质的飞跃。
未来,随着幻觉治理、数据隐私等技术的持续优化,以及跨行业数据协同机制的完善,Agent AI 有望成为连接通用人工智能(AGI)与现实世界的核心载体,真正实现 “会看、会听、会动、会推理” 的智能代理愿景,为人类社会带来更高效、更安全、更具包容性的智能服务。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
为什么要学习大模型?
我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着AI技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。
大模型入门到实战全套学习大礼包
1、大模型系统化学习路线
作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!
2、大模型学习书籍&文档
学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。
3、AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
4、大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。
5、大模型大厂面试真题
面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
适用人群
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
更多推荐
所有评论(0)