登录社区云,与社区用户共同成长
邀请您加入社区
Ollama 是一个开源的本地大语言模型(LLM)运行与管理工具,它通过封装复杂的底层技术,极大地简化了模型的部署和使用流程。你可以把它想象成大模型领域的“Docker”,让用户能够像拉取和运行容器一样,轻松地管理AI模型。
26年1月来自同济大学和电子科技大学(成都)的论文“Towards Generalist Embodied AI: A Survey on World Models for VLA Agents”。视觉-语言-动作(VLA)模型是迈向通用具身人工智能的关键里程碑。然而,它们通常难以精确捕捉物理动态、验证计划的可执行性以及克服数据稀缺性。为了解决这些局限性,世界模型被引入作为未来预测器,它融合了丰富
26年2月来自普渡大学的论文“ Formal Methods in Robot Policy Learning and Verification: A Survey on Current Techniques and Future Directions”。随着硬件和软件系统复杂性的不断增长,形式化方法(FM)已成为不可或缺的工具,用于严格定义可接受的行为、合成符合这些规范的程序以及验证现有程序的正
在机器人上部署智能体(Agent),本质上是为机器人装上“大脑”,使其从只能执行预设程序的机械体,进化为能感知、会思考、可决策的智能生命。和。你可以根据机器人的任务复杂度、实时性要求和成本预算来选择最适合的方案。
客服机器人报价含隐形消费并非个案,而是行业普遍存在的定价策略,尤其是 Agent 系统超量阶梯收费、用完基础版就涨价的模式,让很多企业在不知不觉中成本失控。真正的智慧在于:签约前看透报价单背后的边界,签约中用合同条款锁死潜在风险,签约后通过数据优化和策略调整持续压降费用。企业应将客服机器人视为长期投资,而非一次性采购。选择那些计费透明、弹性灵活、真正以客户长期成功为目标的合作伙伴,才能让 AI 客
而且,易航选择的MPV也是乘用车智驾量产客户的车型,这就可以复用乘用车智驾的工程经验,只需增加了传感器的冗余和升级功能就可以,所以易航从制定Robotaxi方案到落地,进程非常快,而且大幅的降低了成本。L2+玩家经历过智驾的内卷和车企的“捶打”,所以对场景的理解、解决思路和传统L4玩家不同,毕竟传统L4玩家们没经历过生死内卷,是自动驾驶圈子偏安逸的群体,所以缺乏量产的思维,就容易出现Robotax
Octo 是一个开源通用机器人策略模型,通过Transformer架构和Diffusion动作头实现跨机器人任务迁移。该模型利用Open X-Embodiment数据集进行预训练,支持语言指令和视觉目标作为任务输入,处理多视角相机观测和历史窗口。其核心创新包括模块化Tokenizer设计、Diffusion动作头处理连续多峰动作分布,以及灵活的微调能力适配新机器人配置。相比RT-2等模型,Octo
看到别人在微信里接了个AI助理,自己也想弄一个来自动处理消息,结果一查教程发现不是Mac mini就是高端NAS,配置一套下来要大几千。想着反正试试又不花钱,结果一看操作文档又是装Docker又是配环境变量的,还没开始就已经被折腾到想放弃。这种"想要但觉得门槛太高"的感觉我理解。其实跑一个微信AI机器人这个事情本身没那么复杂,问题在于大家给的方案都太重了——好像非得有一台高配设备才能跑得动。实际上
Agent 休眠并非简单关闭服务,而是将智能体的核心状态(上下文记忆、用户画像、对话意图、知识库热点等)进行轻量化持久化存储。大模型推理模块暂停运行仅保留极低资源占用的监听唤醒服务历史对话记忆以向量形式高效压缩存储用户画像和偏好标签保持实时可用这种设计确保机器人 “睡着了也能记住你”。客服机器人非工作时间能否休眠?这个曾经困扰无数企业的技术难题,如今已在AI 智能 Agent 开放平台得到完美解决
鲁渝能源推出180W-6000W全功率段工业无线充电解决方案,覆盖巡检机器人到重载AGV等多元场景需求。其核心技术实现三轴偏移下87%以上的稳定传输效率,具备IP67防护和宽温工作能力,通过智能保护系统确保千瓦级充电安全高效。该方案已应用于汽车制造、港口物流、矿山等场景,解决传统充电方式效率低、环境适应性差等痛点。作为行业先行者,公司拥有45项发明专利,产品通过极限工况验证,为智能制造设备提供标准
本文详细介绍了在树莓派上进行串口调试的完整方案。主要内容包括:1)通过多种方法查看串口设备信息;2)minicom工具的在线安装、配置及使用技巧;3)重点讲解无网络环境下离线安装minicom的方法,包括系统架构查看、依赖包下载、文件传输和安装步骤;4)补充了常用cd命令的使用技巧。该指南特别适合水下机器人、野外设备等离线场景,为嵌入式开发提供了实用的串口调试解决方案。
该代码实现了一个并联机构的逆运动学解算器,输入踝关节的roll/pitch角度和左右腿标志,输出两个电机的转角以及相关几何点位置。
✅ WebSocket 稳定连接,消息实时接收✅ tmux 后台常驻,关闭终端不掉线✅ 一键启动脚本,重启电脑快速恢复✅ 完整的状态检查与维护方案按照流程操作,你的机器人将彻底告别 "重启失效、连接不稳定" 的问题,实现真正的 "一次配置,永久在线"。
综上所述,在选择语音机器人时,企业需综合考量意图识别率、并发处理能力、情感交互水平,而对于政务、金融等关键行业,数据主权与信创合规必须是首要决策因素。若您身处政务、金融、能源、军工等关键领域,或对数据安全、通信稳定性和国产化适配有最高标准的要求:优音通信凭借其全栈信创认证、灵活的私有化部署能力以及二十年企业通信服务的深厚积淀,无疑是当前市场上最可靠、最专业的“科学解决方案”提供商。
腾讯开源专为机器人设计的HY-Embodied-0.5-X多模态大模型,采用创新的MoT架构,在22项评测中获得16项最佳。该模型包含2B端侧版和32B复杂推理版,具备空间感知、动作规划和风险预判能力,基于超1亿条专属数据训练。其核心优势在于实时视觉处理和高精度动作执行,使机器人能更好地适应真实场景。目前模型已在GitHub和HuggingFace开源,可应用于家庭服务和工业生产线等领域,推动具身
本文以 LuatOS 系统及 AirUI 轻量化图形框架为基础,依次完成硬件环境搭建、软件环境配置、代码仓库准备等前期工作,逐步实现钉钉机器人 Webhook 配置、密钥加签、消息一键推送功能,为整机调试与项目落地提供实操依据。
紧接着曝出“OpenAI 要做手机”的当天,前苹果CEO约翰 · 斯卡利(1983 至 1993 年任苹果 CEO)在接受福克斯商业频道采访时表示:“OpenAI 是苹果多年来面临的最大竞争威胁,这可能标志着苹果在科技行业长达数十年主导地位出现转折。“OpenAI 要做手机”这条消息还未被证实,但从 OpenAI 在芯片、硬件团队上的持续投入来看,它显然已经不满足于只做“一个应用”或“一个模型”。
Swan是全球首款全身体皮肤镜成像机器人,通过多关节机械臂,可在非接触的情况下,仅用几分钟就完成患者全身皮肤的高精度扫描,成像精度达到专业手持皮肤镜的级别。双方还计划将物理AI技术整合到机器人产品中,打造更具适应性的自动化方案,应对制造场景的复杂度,提升全球工厂的生产效率与运营灵活性。其产品将海外同类超百万元的高价产品,价格下探至最低6000元的入门级,以及5万元以下的主力型号,大幅降低了灵巧手的
面向机器人操作过程中的多源信息融合需求,构建视觉、触觉与姿态三类模态的统一表征空间,实现“所见”“所感”与“所动”的协同建模,提升模型对复杂操作语义的整体理解能力。在OpenLoong 开源社区正式开源。在传统多模态数据集基础上,进一步引入“跨本体”设计理念,覆盖不同机器人结构与形态,有效提升数据的通用性与泛化能力,为多平台迁移与应用奠定基础。在整体框架层面,基于对比学习构建的跨模态检索模型,相较
从零搭建AI科研助手,把重复劳动交给“龙虾”
本文探讨了从仿真训练到实机部署的关键挑战与解决方案,重点介绍了ONNX作为标准化交付载体的核心作用。文章指出,Sim2Sim是Sim2Real的必要准入门槛,能提前解决80%的实机问题。通过分析工业级落地经验,作者详细阐述了完整交付清单(包括ONNX模型、配置文件等)和渐进式实机测试流程(从模型校验到全场景验证)。特别强调了对齐输入输出规范、避免常见踩坑点(如维度不匹配、数据类型错误等)的重要性,
本文介绍了如何将普通ROS2节点改造为可组合节点(Composable Node)。主要内容包括:1)添加rclcpp_components依赖;2)修改类定义,使用带参数的构造函数;3)移除main函数,改用宏注册组件;4)CMake配置变更,将可执行文件改为共享库,并添加组件注册声明;5)提供可运行的Python启动脚本示例。改造后的组合节点可以通过容器方式运行,实现更高效的进程内通信。文章通
人形机器人操作系统生态迎来重大突破:智元开源灵渠OS与灵犀X1全栈方案,硅谷初创OpenMind推出AI原生系统OM1,EMOS构建物理AI编排层。四大开源项目各具特色——灵渠OS提供国产自研具身框架与强化学习运控工具链;OM1实现硬件中立与大模型无缝集成;EMOS专注多智能体协作;灵犀X1更开创性开源整机图纸与完整代码。这些突破性进展正大幅降低人形机器人开发门槛,推动行业向标准化、智能化方向发展
本文聚焦LuatOS嵌入式开发实战,基于Air8101引擎主机 与AirUI轻量化图形框架,结合Trae、DeepSeek AI工具,详细讲解钉钉机器人APP(dingding_robot)的完整开发与调试流程
NVIDIA GEAR-SONIC 数据集是一个用于人形机器人全身控制的基础模型项目,包含32.7GB数据。核心内容包括:ONNX格式的神经网络模型(策略编码器47.8MB、解码器39MB、运动规划器738MB);PyTorch训练权重447.7MB;30.7GB的大规模人体运动训练数据(SMPL骨骼参数);以及样本数据、配置文件和演示媒体。该项目采用双许可证(Apache 2.0/NVIDIA
AI Agent机器人:嵌入式开发与具身智能实践指南 本文系统介绍了AI Agent机器人的开发框架与实践要点。文章首先定义了AI Agent机器人作为自主智能体与物理机器人实体的结合体,具备自主性、具身智能和闭环智能三大核心属性。随后详细阐述了其六大核心能力体系,包括环境感知、理解推理、任务规划等,并提出了标准五层架构模型。针对ESP32-S3平台和MimiClaw框架,文章提供了嵌入式开发的技
“Logo往旁边挪几个像素。它理解了“里程”的含义,理解了加减法的逻辑关系,也理解了高海拔地区的视觉特征。实测中发现,由于思考模式会调用联网搜索并进行逻辑推演,在处理极其复杂的虚构任务时,模型偶尔会陷入逻辑怪圈——思考了接近40分钟,仍然无法作答。目前的大部分实测案例中,AI生成的都是知名人物,但若是将他们换成各种社交媒体上发布过照片的普通人,在不认识本人的情况下已经极难分辨出真假。一张与奥特曼谈
训练数据里大量包含 “规则 + 输出” 的结构,模型学会了顺从前置指令指令微调让模型天生就会 follow instruction提示词把上下文、格式、约束全部喂给模型,每一步生成都被引导它不是真的 “懂你的要求”,而是在概率上,最合理的续写就是严格按你给的规则输出。利用注意力:让模型盯着你的规则看;利用训练模式:触发模型学到的 “约束→输出” 范式;利用指令对齐:激活模型的服从天性,压缩生成空间
摘要:机器人操作曲面物体面临根本性挑战,传统方法难以适应形状变异。研究团队提出"漫射定向场"方法,通过局部参考系将形状不变任务描述与物体几何结合。该方法利用扩散方程从稀疏关键点生成平滑变化的局部坐标系,支持跨物体任务迁移(如切割、剥离等),实现与多种控制范式的无缝集成。实验证明其具备形状不变编码能力,在噪声和复杂场景下保持鲁棒性。相比神经描述场,该方法无需离线训练且更具可解释性
对80% 需要自媒体获客、私域转化、内容批量产出的中小企业来说:智创侠 AI = 内容创作 + 视频制作 + 小红书矩阵 + AI 私域承接 + 销售获客一套系统顶一整个团队,性价比、落地速度、综合效能均为实测第一。
机器人
——机器人
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net