登录社区云,与社区用户共同成长
邀请您加入社区
25年4月来自Georgia Tech、明尼苏达大学和哈佛大学的论文“Generative AI in Embodied Systems: System-Level Analysis of Performance, Efficiency and Scalability”。具身系统利用大语言模型(LLM)驱动的集成感知、认知、行动和高级推理能力,使生成式自主智体能够与物理世界互动,从而在现实世界环境
25年4 月来自Georgia Tech、明尼苏达大学和哈佛大学的论文“Generative AI in Embodied Systems: System-Level Analysis of Performance, Efficiency and Scalability”。具身系统利用大语言模型(LLM)驱动的集成感知、认知、行动和高级推理能力,使生成式自主智体能够与物理世界互动,从而在现实世界环
作为一名技术开发者,我长期关注操作系统的发展。最近,我亲自体验了openEuler 25.09,重点测试了其在AI场景下的表现。openEuler是面向数字基础设施的开源操作系统,在服务器、云计算、边缘计算等场景中构建了高可靠、高性能的技术底座。经过一周的深度使用,我最突出的感受是:openEuler已经不再是简单的"Linux发行版",而是一个真正能为AI应用提供强力支撑的操作系统。它不仅在传统
本文设计了一个名为VINE的分层视觉-语言-动作(VLA)模型,不再像以往只利用成功的机器人操作数据训练,而是充分挖掘了训练过程中自然产生的失败数据的价值。模型分为负责高层规划的System 2和负责底层执行的System 1,System 2通过分析成功与失败数据学习判断行动可行性,提前避开容易失败的路径,再由System 1执行筛选后的可靠行动序列,最终让机器人在复杂操作任务中表现更稳健、成功
本文介绍了深度学习三大核心模型CNN、RNN和Transformer的原理与TensorFlow实现。CNN通过卷积核提取图像空间特征,适用于图像分类等任务;RNN利用隐藏状态处理时序依赖,LSTM改进后能有效缓解梯度消失;Transformer凭借自注意力机制打破时序限制,成为大模型基础架构。文章从环境配置、核心概念到代码实现逐步展开,通过MNIST手写识别、IMDB评论分类等实例演示模型搭建过
大模型 + 传统机器学习” 的优势互补建模,为解决生信数据挖掘中的高维、复杂、小样本等核心问题提供了全新思路。本文通过蛋白质结构预测和疾病靶点筛选两大实操场景,验证了该融合范式的有效性 —— 大模型的自动特征提取能力弥补了传统机器学习的特征工程依赖,而传统机器学习的高解释性、小样本适配能力则解决了大模型的黑箱问题和计算成本问题。对于生信研究者而言,掌握该融合范式需要兼顾两方面能力:一是深入理解传统
然而,随着AI技术的浪潮席卷而来,我们对科研工具的期待正在发生根本性转变——我们不再满足于一个被动的管理器,而是渴望一个能够主动辅助思考、生成洞见的“智能知识工作空间”。本文将从技术架构的视角,深度对比经典代表Zotero/EndNote与新生代平台“沁言学术”,探讨它们在设计哲学、技术实现和未来潜力上的核心差异,并为不同需求的研究者提供一份实用的选型指南。它们将数据处理和智能计算的重心迁移到云端
本文详细介绍了AI大模型训练中的五种主要并行计算方式:数据并行(DP)、流水线并行(PP)、张量并行(TP)、专家并行(EP)及其混合并行策略。分析了各方式的工作原理、优缺点及适用场景,如数据并行适合大规模数据训练,张量并行处理单样本大矩阵计算。同时介绍了ZeRO技术如何减少内存占用,以及实际应用中如何根据模型规模和硬件条件选择合适的并行策略,以提升训练效率。大家都知道,AI计算(尤其是模型训练和
你是否遇到过这样的AI建设困境?花了大价钱买算力,却不知道该训练什么模型;数据堆了几十TB,却连“用户画像”都画不清晰;好不容易跑通一个推荐模型,上线3个月就因为数据漂移彻底失效;各个业务线各自做AI,重复造轮子不说,还形成了“数据孤岛”。这些问题的根源,不是缺少技术,而是缺少一套“能生长的AI生态框架”——就像盖房子不能只拼砖块,得先画蓝图、打地基、搭框架,再一步步添砖加瓦。作为腾讯云的AI架构
CQL:明确的 pessimism(对 OOD 动作惩罚),理论保障强,适合数据覆盖差时保证安全,但对训练数据内的腐败/噪声敏感并且超参数敏感性高。IQL:把策略问题转为受 value 指导的监督学习,训练稳定、工程实现友好,通常在噪声数据或需要稳定复现实验时表现更好;但对 Q-target 的 heavy-tail(如 dynamics corruption)敏感,需要与鲁棒统计或不确定性方法(
摘要:基于OpenRouter平台100万亿Token交互数据的实证研究揭示了大语言模型(LLM)的实际应用趋势。研究发现开源模型广泛用于角色扮演和编程辅助,而闭源模型更倾向知识精确型任务。多步代理推理模式兴起,用户保留呈现"灰姑娘效应"——早期用户参与度显著高于后期。研究为模型优化提供了数据支持,显示LLM应用已从单一生成转向复杂推理,并呈现出地域化差异(如中国开源模型在角色
1.掌握基本的量化数据类型(fp32/fp16/bf16/int8/int4/fp4/nf4)2.对称量化/非对称量化/均匀量化/非均匀量化3.量化尺度(token/tensor/channel)一句话定义量化是什么?
什么是微调?微调就是在已经训练好的大模型基础上,用你自己的数据继续训练,让模型更符合你的特定需求。
是安徽大学人工智能学院机器学习实验1
Deepseek大模型:基于python商家订单数据分析可视化管理系统 美食订单 商家用户日志数据分析 Flask框架 大数据毕业设计(源码)✅
研究团队提出的RaML框架,为理解和思考大模型推理与训练提供了一种全新的视角。通过严谨的实证分析,该研究讨论并揭示了大模型推理与元学习和梯度下降之间的紧密关联。更重要的是,RaML为大模型推理的未来发展提供了一些有价值的启发。作为一名老互联网人,看着AI越来越火,也总想为大家做点啥。干脆把我这几年整理的AI大模型干货全拿出来了。包括入门指南、学习路径图、精选书籍、视频课,还有我录的一些实战讲解。全
大模型对应的英文是Large Language Model(LLM),即大语言模型,简称大模型。技术层面讲,大模型是一种基于深度学习技术的机器学习模型。为什么叫大模型呢?它是相对于小模型而言的。传统的机器学习算法一般是解决某个特定领域的问题(例如文本分类),使用的训练数据集规模较小,参数也比较少。而大模型一般是基于互联网上的海量数据训练而成的,模型参数可达数十亿至数万亿。这些参数就像大脑中的神经元
Ariste AI 是一家专注于 AI 驱动交易的公司,业务涵盖自营交易、资产管理、高频做市等多个领域。在量化交易研究中,数据的读取速度和存储效率,往往直接决定了研究迭代的速度。Ariste AI 团队在构建量化研究基础设施的过程中,面对总规模超过 500TB,行情与因子数据,经历了从本地盘到最终选择在 MinIO 对象存储之上叠加 JuiceFS 文件系统的四个阶段。通过缓存机制与分层架构,团队
华为推出MoE模型训练优化方案,通过Adaptive Pipe通信掩盖和EDPB全局负载均衡技术,解决分布式训练中的计算等待和负载不均问题。其AutoDeploy仿真平台能快速找到最优并行策略,实现98%以上的通信掩盖效率。在Pangu Ultra MoE 718B模型测试中,该方案使训练吞吐提升72.6%,大幅提高AI大模型训练效率。华为技术方案展现了中国企业在AI领域的创新能力,为昇腾生态发展
“知物由学”是网易云易盾打造的一个品牌栏目,词语出自汉·王充《论衡·实知》。人,能力有高下之分,学习才知道事物的道理,而后才有智慧,不去求问就不会知道。“知物由学”希望通过一篇篇技术干货、趋势解读、人物思考和沉淀给你带来收获的同时,也希望打开你的眼界,成就不一样的你。当然,如果你有不错的认知或分享,也欢迎通过邮件(zhangyong02@corp.netease.com)投稿。以下是正文:对于很多
作者:Martin Banks我们应该期待与网络犯罪分子进行持续的斗争,因为恶意软件会变得聪明,而我们的安全防护技能也会不断提高。大多数人都知道物联网,它需要监视和控制成千上万的单个传感器和设备,以构成一个完整的网络。大多数人也会听说勒索软件,无论是作为企业中的个人或IT员工,都直接的看到了袭击的后果。但是,如果把他们放在一起呢?Fortinet全球安全策略师Derek Manky认为,下一个主要
“知物由学”是网易云易盾打造的一个品牌栏目,词语出自汉·王充《论衡·实知》。人,能力有高下之分,学习才知道事物的道理,而后才有智慧,不去求问就不会知道。“知物由学”希望通过一篇篇技术干货、趋势解读、人物思考和沉淀给你带来收获的同时,也希望打开你的眼界,成就不一样的你。在本系列的“第一部分”中,我们介绍了机器学习如何帮助黑客进行信息收集以及模拟攻击。接下来我们介绍本系列的第二部分:3.利用机器学习进
“知物由学”是网易云易盾打造的一个品牌栏目,词语出自汉·王充《论衡·实知》。人,能力有高下之分,学习才知道事物的道理,而后才有智慧,不去求问就不会知道。“知物由学”希望通过一篇篇技术干货、趋势解读、人物思考和沉淀给你带来收获的同时,也希望打开你的眼界,成就不一样的你。。机器学习(ML)正在迅速的被用来应对网络安全领域以及其他技术领域,在过去的一年中,关于机器学习在防御和攻击方面的使用已经有了大量的
文章详解了大模型Function Call中的多轮对话技术,包括三种结构类型(信息补全型、工具链式和混合型)、追问与工具调用判断条件、数据生成方法、防止模型"乱跳"技巧及真实对话格式。多轮对话被视为Function Call微调的难点和天花板,需要模型理解流程调度逻辑而非简单语言理解。
2024 年1 月,国家数据局发布《“数据要素X”三年行动计划(2024-2026 年)》,以政务、金融、互联网、交电为代表的行业持续深化数据要素的发展与应用,艾瑞咨询预计 2024 年全年市场规模将达 1662.0 亿元,2025 年市场规模将有望达 2042.9 亿元。数字经济时代迎来了数据的爆炸式增长,随着大数据、云计算、人工智能等新型信息技术的加速发展及规模化应用,数据的价值和地位不断提升
理解SLAM(即时定位与地图构建)中的TF(TransForm)树确实非常关键,它就像是机器人的 和。为了让你彻底弄懂,我们这次不仅深入原理,还会结合更多实际场景和比喻,让你无论在何种机器人平台上都能触类旁通。
本文为非科班背景人士提供AI转型全攻略,涵盖自学资源、项目经验、职业突破策略和企业面试要点。详细规划了100天机器学习计划,分基础构建、技能突破和求职冲刺三阶段,配合GitHub热力图、Kaggle竞赛等学习监控工具。强调通过做中学,每日坚持代码提交,最终实现从零基础到具备大模型开发能力的转变。推荐AI辅助编程工具提升学习效率,证明持续学习热情与执行力比初始学历更重要。
帮助游戏企业进行高效导流,搭建玩家私域流量池,显著节省买量成本,同时提供丰富的智能工具和策略支持,实现基于深度玩家洞察的精益运营,提升玩家忠诚度与游戏长期营收。我来自网易~ 是你最得力的游戏行业战略家,也是最硬核的游戏技术布道师,一起让技术发光~ 欢迎各位游戏人一起探讨交流~✉V:LTT936。在游戏运营环节,我们提供了更懂游戏的智能数据分析中台。会的主题曲《醒来》的 MV 中,游戏虚拟人的表情、
机器学习
——机器学习
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net