登录社区云,与社区用户共同成长
邀请您加入社区
25年12月来自北京人形机器人创新中心和北大的论文“RoboMIND 2.0: A Multimodal, Bimanual Mobile Manipulation Dataset for Generalizable Embodied Intelligence”。尽管数据驱动的模仿学习已经彻底改变了机器人操作,但当前的方法仍然受到大规模、多样化真实世界演示数据匮乏的限制。因此,现有模型在长时程双臂
对于 OpenLoong 项目,“Hello World” 不是打印文字,而是让机器人“动”起来。ROS 2 通信环境正常。控制器(如)正常加载。你的代码能够正确发送指令并驱动硬件/仿真模型。
移动机器人在现代科技发展中扮演着日益重要的角色,广泛应用于工业生产、物流配送、服务行业以及智能家居等众多领域。在这些应用场景中,移动机器人需要能够自主规划一条安全、高效的路径,从起始点移动到目标点,同时准确地确定自身在环境中的位置。路径规划的质量直接影响机器人的工作效率和任务完成能力,而精确的定位则是保证机器人按照规划路径准确行驶的关键。快速探索随机树(RRT)算法因其在复杂环境下快速搜索路径的能
运动-动力学规划(Kinodynamic Planning)结合了运动学约束(避障)和动力学约束(速度/加速度限制),直接生成机器人可执行的控制指令序列。传统方法先找路径再优化的方式无法保证动力学可行性,特别是对于非完整系统。State Lattice Planning通过离散化控制空间或状态空间,构建包含可行运动原语的格点图,确保每条边都对应实际可执行轨迹。方法分为正向(控制输入仿真)和逆向(状
基于采样的路径规划方法通过在构型空间中随机采样点构建树或图结构来探索可行路径。主要包括PRM(概率路线图)和RRT(快速搜索随机树)两种方法:PRM先构建全局道路图再搜索路径,适合静态环境;RRT则通过逐步扩展树结构直接寻找路径,更具目标导向性。两种方法都具有概率完备性,但PRM支持多次查询,RRT实现更简单。最优路径规划基于动态规划思想,通过迭代计算各状态最小代价来求解。这些方法通过离散采样将连
本文详细解析了Freqtrade交易系统中的关键订单配置参数。主要内容包括:1)订单类型设置(limit/market)及其适用场景组合;2)订单有效期策略(GTC/IOC/FOK)的选择建议;3)交易所原生止损单的配置方法及优势,包括触发价与限价机制。文章推荐了稳健的配置组合:入场/出场使用限价单(GTC),止损采用市价单并启用交易所挂单(limit_ratio设为0.985-0.99),这种设
函数 y=f(x)在点x0处的导数定义为:如果极限不存在,则称函数在x0处不可导。几何意义:导数就是切线的斜率。物理意义:导数就是瞬时变化率(如速度)。线积分有两种:对标量场的积分(求曲线质量、弧长)和对向量场的积分(求功、环量)。给定复杂函数 f(x),我们希望用简单函数(多项式、三角多项式)在某种度量下近似它,且误差尽可能小。这不仅是理论问题,也是数值计算、工程模拟的核心。
摘要: 在数字化转型背景下,企业客服面临多渠道服务需求、系统操作繁琐、人力管理压力大等挑战。RPA+AI技术通过自动化数据收集、智能知识库查询、自动生成服务摘要、高效处理积压业务及精准收集客户反馈等五大核心场景,显著提升客服效率与准确性。八爪鱼RPA结合AI技术,助力企业实现从被动响应到主动服务的转变,降低运营成本,优化客户体验,推动客服领域智能化升级。
今天最值得关注的两件事:一是Apptronik 的融资规模。一个 A 轮融了将近 10 亿美元,说明资本对人形机器人的信心还在加速。这个赛道的门槛越来越高,没有足够资金支撑的玩家会越来越难。二是哥大的面部表情研究。这篇 Science Robotics 的论文直接指出了行业的一个盲区——大家都在卷腿和手,但面部表情才是让机器人真正"像人"的关键。对于做仿生面部表情的团队来说,这是一个很好的技术参考
今天最让我兴奋的是哥大那篇面部表情的论文。做人形机器人的人都知道,腿和手的问题大家都在卷,但脸部表情一直是个被低估的方向。Lipson 团队用"自我观察+模仿学习"的方法,给这个方向打开了一扇新窗户。资本层面,Apptronik 一轮 9.35 亿的融资再次证明:人形机器人是当下最热的赛道,没有之一。明天见。
当AI拥有了思考的智慧,我们该为它打造一副怎样的“身体”?最近在广州,动易科技给出了自己的答案。这不仅是一家智造中心的落成,更宣告“Robot for AI”的时代正从图纸跃进现实。一个可量产、有温度的机器人C2,一个免费开源的运动“智能小脑”,他们将如何让机器真正走进并改变我们的物理世界?作者:动易科技2026年2月6日,一个普通的周五,广州海珠创意产业园里却酝酿着一场不普通的“相遇”。海珠区大
回头看,2024年是大模型的混战之年,2025年是AI应用落地的探索之年,而2026年,正在成为AI"走出浏览器、走上桌面"的破局之年。图片当AI终于学会了使用鼠标和键盘,人类离"只动口不动手"的终极办公愿景也就不远了。这不仅仅是工具的迭代,而是人与电脑交互方式的一次根本性变革。下一次你打开电脑的时候,或许该认真想想:你准备好跟一位AI同事共用一张桌面了吗?
智元 SOP 框架的发布标志着 VLA 模型在真实世界部署进入了可扩展在线进化的新纪元。通过深度整合在线、分布式和多任务机制,构建 “平行现实” 的创新架构,SOP 技术不仅解决了传统机器人学习的技术瓶颈,更为具身智能的大规模产业化应用开辟了新路径。从技术专业人士的角度,SOP 框架展现了多项革命性创新:Actor-Learner 异步架构实现了数据生产与消费的完美解耦;动态学习权重采样器实现了智
本文介绍了基于LangGraph+Agent Skills+A2A+MCP技术栈重构购物场景生成AI Agent系统的实践。通过引入Planner节点实现智能规划能力,采用模块化Agent Skills封装工具功能,结合AI Coding工具加速开发,在几天内完成了系统重构。新架构实现了从单体流程编排到模块化技能体系的转变,任务完成率提升20%,为电商运营提供更高效的场景生成解决方案。核心创新包括
真正理解现实世界,能解决问题的 AI 原来是这样。不得不说,在大模型技术逐渐成熟的当下,LongCat 面向实用化发力的方法让我们看到了一个 AI 落地的新解法:在模型架构之外,把 AI 能力充分嵌入已有生态,能够产生前所未有的能力。通过连接供给丰富、反馈真实的本地生活网络,AI 大模型可以精准直连用户的需求,提供真实、个性化且实时可用的信息。这两天,LongCat APP 即将上线「探索本地生活
清华、哈工大等团队将几何物理知识注入大模型参数,打破AI固有的频谱偏见,精准还原微米级月壤颗粒边缘,以超越国际主流模型的卓越性能,有力支撑月球原位资源利用,服务航天强国战略需求,为国家月球科研站建设与航天器精密设计提供了不可或缺的高精度计算工具。随着人类深空探测步伐的加快,月球地质演化研究与未来月球科研站的建设已成为航天领域的战略焦点。作为月球表面最主要的覆盖物,月壤不仅记录了月球亿万年来遭受微陨
本文深度解析北京人形机器人创新中心(X-Humanoid)重磅发布的具身天工3.0人形机器人,解析高扭矩关节、慧思开物平台、Pelican-VL模型的核心技术突破,解读其全维度开源战略的布局逻辑与行业意义,对比前代天工Ultra的定位差异,剖析其核心优势与开源生态运营、行业竞争等潜在挑战,探讨具身天工3.0对中国人形机器人行业的影响与未来发展趋势,为技术从业者、行业观察者提供最专业、最全面的深度解
本文深度解析美国旧金山初创企业Weave Robotics发布的固定式家用折叠机器人Weave Isaac 0,全面对比Isaac 0与1X NEO、Sunday Memo等主流家用机器人的差异,以及固定式与传统移动家用机器人的落地难度和实用性差异,解读Weave Robotics“放弃移动、专注单点”的核心战略与“固定式+移动版”的长期布局,剖析其核心优势与功能单一、区域覆盖有限等潜在隐患,探讨
本文深度解析美国人形机器人龙头企业Apptronik完成5.2亿美元A-X轮融资延伸的核心事件,分析此次融资对Apptronik的战略意义,解析其豪华投资方阵容的协同价值,详细介绍Apollo旗舰人形机器人的技术参数、量产规划与场景应用,解读Apptronik与Google DeepMind的技术合作及子公司Elevate Robotics的多元化布局,剖析其核心优势与量产成本、行业竞争等潜在挑战
我的其他两篇博客,分别介绍了外推法和内推法,本文将二者汇总起来,形成可复用的算法参考自craig的《机器人学导论》
本文探讨了ROS激光SLAM开发中遇到的CMake依赖管理问题。主要分析了"Cycle in constraint graph"错误的成因,指出混用系统库和自定义库路径导致的依赖循环问题。文章详细解析了静态库与动态库的区别,以及CMake中target_link_libraries的PUBLIC/PRIVATE/INTERFACE关键字对依赖传递性的影响。最终提出解决方案:使用
纳米机器人在医疗领域的应用正从科幻走向现实,其精准医疗潜力巨大但面临极端测试挑战。这些微米级智能装置需在动态复杂的人体环境中执行细胞级任务,软件更新必须通过无线方式进行,涉及安全传输、精确验证和风险控制。测试策略需结合虚拟细胞模型、类器官实验、数字孪生仿真和动物验证,构建分层验证体系。核心挑战包括不可控的生物环境、严格的安全性要求以及疗效验证难题,需创新测试方法并符合严格医疗监管标准。典型案例显示
摘要:皮带输送机巡检机器人通过智能检测、随线运行和数据分析三大核心能力,解决人工巡检难题。其高适配设计可匹配各类轨道,实现无死角覆盖;多维度检测体系分级预警设备异常;视觉识别系统精准判别皮带状态;智能化数据管理支持预测性维护。机器人具备7×24小时稳定运行能力,有效降低人力成本和非计划停机损失,推动工业产线向无人化、智能化升级。
手机、PC、汽车、家电全面植入AI引擎,字节、小米、OPPO筹备AI手机,苹果开放CarPlay AI语音功能,智能汽车成为最大AI终端。2026年的竞争,不再是单一技术的比拼,而是全产业链、生态、治理、人才、数据的综合竞争,谁能平衡创新与合规、效率与安全、技术与人文,谁就能占据未来制高点。OpenClaw的核心价值,是把大模型、算力、工具链、行业插件封装为开箱即用的AI工作流,开发者无需精通后端
而GPT-5.3-Codex作为OpenAI目前最强大的代理编程模型,融合了GPT-5.2-Codex的编码性能和GPT-5.2的推理及专业知识能力,推理速度能够提升约25%,可处理设计研究、工具调用和复杂操作的长时间任务。Frontier打通了原先隔离的数据仓库、客户管理系统和内部应用,使得所有AI代理都能共享统一的业务知识库,并让AI理解信息是如何流动的、决策是如何发生的、哪些结果是重要的。I
毕竟如何让广告的投放更精准、更高效是营销行业的终极课题之一,直至互联网时代,这个问题也有了答案,当广告平台比用户更了解自己时,广告自然也就可以投其所好,而这便是所谓的用户画像。日前,数据删除服务机构Incogni针对AI插件的最新研究报告显示,在抽样调查的Chrome AI插件中,有超过一半存在收集用户数据的行为,其中近1/3瞄准了直接定位用户本人的个人可识别信息(PII)。超过50%的AI插件存
如果说Anthropic是对OpenAI采取了一种系统且深刻的反叛,那么中国AI不同的人,其实都怀揣着各自不同的“Anthropic”,这里既有对宏大愿景的兴奋,也有战场迁移的无奈。在过去很长的一段时间里,这家公司是基模四巨头中的绝对异类。奥特曼想要构建一个“垂直一体”的帝国,OpenAI发布了包括GPTS在内的一系列的生态工具,秘密研发自己的芯片,半遮半掩自己的硬件计划,还从苹果挖来了一堆软硬件
摘要: 2015–2025年,机器人算法经历了从预设脚本到具身智能的跨越式发展。2015–2018年依赖高精度传感器与数学模型(如SLAM),但环境适应性差;2019–2022年深度学习主导,通过仿真训练实现柔性控制与视觉导航;2025年进入具身智能时代,多模态大模型(VLA)实现自然语言交互,eBPF内核技术保障物理级安全,触觉神经网络提升精细操作能力。核心跨越包括决策从数学方程转向意图理解,安
QiWe开放平台 · 个人名片API驱动企微外部群自动化,让开发更高效对接通道:进入官方站点联系客服团队定位:企微生态深度服务,专注 API+RPA 融合技术方案。
我给你整理一份的知识清单,不分虚的,按「通用基础 → 细分岗位 → 学习路线」来写,你可以直接对标自己要走的方向。
ICP算法在人形机器人中的关键应用与发展前景 摘要:ICP算法作为点云配准的核心技术,在人形机器人领域发挥重要作用。在环境感知方面,ICP用于SLAM中的精确定位与地图构建;在物体操作中,实现目标识别与抓取位姿估计;在模仿学习中支持动作捕捉与复现。未来发展趋势包括:与深度学习融合形成混合模型,提升实时计算效率,增强语义理解能力,以及多模态感知融合。尽管出现端到端配准网络等替代技术,ICP仍因其高精
摘要:点云配准是将不同视角或时间的点云数据对齐到同一坐标系的过程,核心是寻找最优刚体变换(旋转矩阵R和平移向量t)。经典ICP算法通过迭代最近点匹配和SVD分解实现,但易陷入局部最优且对初始位姿敏感。改进方法包括Point-to-Plane ICP、鲁棒损失函数和特征描述子匹配。全局配准算法(如RANSAC)和深度学习方法(如端到端网络)进一步提升了性能。ICP在人形机器人中应用广泛,但面临初始位
本文基于顶视投影方法,将六足机器人结构简化为3PRR并联构型,通过解析其运动学特性与控制策略,实现了对机器人平台的高精度轨迹跟踪控制。研究结合Quanser公司六足机器人平台,采用MATLAB构建数值仿真环境,验证了3PRR构型在紧凑工作空间内实现高加速度、重载荷搬运的可行性,为复杂地形下的机器人运动控制提供了理论支撑。
Kairos 3.0 是大晓机器人开发的开源世界基础模型,专注于学习真实世界的动态变化、因果关系和物理规律,并通过长时序视频生成技术实现对世界的理解和预测。其核心创新在于采用线性时间复杂度的 DiT 架构,结合滑动窗口、扩张滑动窗口和门控线性注意力机制,能够高效处理长视频序列,生成复杂且符合物理规律的动态交互场景。
在人工智能代理日益融入软件开发生命周期的背景下,一个核心悖论浮出水面:一方面,开发者普遍感知到生产力的提升,高达84%的开发者表示使用生成式AI工具后速度有所加快 [另一方面,严谨的实证研究却揭示了截然不同的图景。一项针对开源开发者的随机对照试验发现,允许使用AI工具反而使任务完成时间增加了19% [这种感知与现实的巨大鸿沟,深刻地揭示了一个事实:人工智能并非凭空创造能力,而是放大使用者已有的能力
26年1月来自北大和字节Seed的论文“Rethinking Video Generation Model for the Embodied World”。视频生成模型显著推动具身智能的发展,为生成能够捕捉机器人在物理世界中的感知、推理和行动的多样化机器人数据开辟了新的可能性。然而,合成能够准确反映真实世界机器人交互的高质量视频仍然是一项挑战,而缺乏标准化的基准测试限制公平的比较和进展。为了弥补这
26年1月来自蚂蚁Robbyant 团队的论文“A Pragmatic VLA Foundation Model”。视觉-语言-动作(VLA)基础模型在机器人操作领域具有巨大潜力,期望其能够忠实地泛化到不同的任务和平台,同时确保成本效益(例如,适应所需的数据和GPU运行时间)。为此,本文开发LingBot-VLA模型,该模型基于来自9种常用双臂机器人配置的约20,000小时真实世界数据。通过在3个
这套方案完全适配有基础 Java 开发团队的企业,代码可直接复用,仅需替换知识库内容和 API Key 即可落地,中小企业月度 API 调用成本通常低于 1000 元,且能无缝集成到现有官网系统。
机器人
——机器人
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net