登录社区云,与社区用户共同成长
邀请您加入社区
25年8月来自西湖大学、浙大、西安交大、未来区块链和隐私计算北京高精尖创新中心和电子科技大学(成都)的论文“Long-VLA: Unleashing Long-Horizon Capability of Vision Language Action Model for Robot Manipulation”。视觉-语言-动作 (VLA) 模型已成为机器人策略学习的基石,利用大规模多模态数据实现稳健
25年8月来自新加坡国立、南洋理工、香港科技大学和上海 AI 实验室的论文“EgoTwin: Dreaming Body and View in First Person”。虽然非自我中心(exocentric)视频合成已取得长足进步,但以自我为中心(egocentric)视频生成仍未得到充分探索,这需要对第一人称视角内容以及佩戴者身体运动引起的相机运动模式进行建模。为了弥补这一差距,本文引入一项
如果不知道自己的sd卡是哪个,可以插拔前后都输入一次lsblk,看看多了哪些东西,我电脑上显示了sdb为sd卡。RDK X5好玩,插拔USB摄像头导致板子重启了,重启之后指示灯只亮绿灯,没有亮红灯,调试串口显示。板子,上电,如果发现红灯和绿灯都亮了,并且SSH也能连上,那就是板子已经好了,下次再也不带电操作了。俗话说,要用魔法打败魔法,Ubuntu的事情,要用Ubuntu解决!: 显示所有块设备的
摘要: "Sim2RealGap"指仿真训练模型迁移到现实时性能下降的现象,源于物理建模偏差、感知信息差异和环境细节缺失。核心影响包括智能体在现实中的失效行为(如机械臂抓取失败)。解决思路分为四类:1)增强仿真真实性(高保真物理建模、域随机化);2)优化模型泛化能力(迁移学习、元学习);3)硬件在环(HIL)实现虚实闭环交互;4)结合少量现实数据微调。实际应用中需多方法协同,如
但是,硬件的设计周期是以“年”为单位的,而AI模型的迭代速度是以“月”来计算的。Dangerous Land是一款第一人称策略游戏,融合探索和动作元素,玩家扮演村庄统治者,管理和扩张领地,招募和升级单位,参与史诗般的战斗,现已发布demo。Beginner AI是一款免费的工具,通过内置的Python Notebook,引导初学者逐步构建线性回归模型,提供易于复制的代码。Luna Call是一款语
实时音视频行业正经历从消费级应用向产业级基础设施的转型。随着AI+、低空经济等新场景兴起,行业对音视频技术提出低延迟、可控性、模块化的新要求。该技术已深度嵌入教育、医疗、智慧城市等场景,成为智能系统的感知与决策中枢。模块化架构支持灵活组合,满足差异化需求;本地化部署保障安全合规;低延迟特性(100-200ms)支撑无人机、机器人等关键应用。未来竞争将聚焦于技术深度与场景适配能力,推动实时音视频从工
过去一年,RAG在企业智能检索领域大热。然而,面对复杂场景,传统RAG局限显现。Graph RAG整合知识图谱,突破检索边界,实现多步推理与可解释回答,成为企业级智能的新引擎。本文系统解读两者的创新与应用落地,让专业读者洞悉下一代AI的技术风向。
检索增强生成(RAG)是一种通过检索相关信息来增强传送至 LLM 的提示词(prompt),进而生成回应的方法。其核心思想是:与其直接向 LLM 发送提示词——而该 LLM 可能并未训练过你的特定数据,不如在提示词中补充相关信息,从而使 LLM 能更准确地回答问题。
以销售数据分析为例,Agentic AI会先理解用户深层需求,动态规划数据采集路径,执行中若发现某数据源API返回格式变化,会自动切换备用接口,最终输出包含趋势预测与策略建议的完整报告。若任务过程中识别出异常,bit-Agent将尝试自主处理,若出现bit-Agent无法处理的异常情况,将暂停任务并请示用户,确保任务的准确性;这两者的区别,体现出IDC对智能体的定义,即智能体是由大语言模型驱动的自
成晖解释道,听起来很深奥,但本质就是充电机器人能够像人的手臂一样,它在眼睛看到充电接口大概位置后,充电枪伸出去,通过触觉感知不断柔和校错,找到准确的充电接口。”成晖透露,未来一段时间内,类似的场站将会出现在更多的停车场,持续通过‘用户共创’的模式,不断推动AI算法持续迭代,让领先的机器人科技服务更多人。当汽车驶入车位后,车主只在手机上点击了几下,一台黑色涂装的充电机器人便开始 “苏醒”:柔韧臂缓缓
而在另一些情况下,则可能导致背叛。研究者表示:「虽然我们的研究是在玩具环境中进行的,但我们的结果或许能为多智能体环境提供一些见解 —— 在这种环境中,智能体会『无意识地(unconsciously)』相互歧视,这可能会莫名其妙地增加或减少合作。这就像科幻小说里的 AI,一旦拥有了「自我」意识的萌芽,即使是微小的暗示,也能改变它的行为模式。通常来说,随着博弈的进行,玩家的贡献会减少:如果贡献的玩家发
该工具能够协助银行细化知识集内容,实现知识集精细化管理与合规回复,如将最新银行政策、敏感问题的规范回复同步至机器人知识库,并可设置“仅依据知识集回答问题”,对于超出知识范围的问题,机器人将引导客户转接人工客服,有效规避合规风险。以往人工整合这些数据需耗费大量时间,而企业微信的智能表格具备“一键导入”功能,可将客户联系信息、群聊数据快速汇总至表格中,并通过AI自动分析总结,例如,呈现出“张女士,月均
本文详细介绍了Coze开源大模型的本地部署教程,重点阐述了开源对开发者和企业的价值:数据安全可控、满足合规需求、降低成本。文章以四步流程(安装Docker、下载Coze、配置模型、启动部署)详细讲解部署过程,仅需双核CPU+4G内存即可运行。采用Apache2.0许可证,支持商用和二次开发,让开发者能够定制专属功能,打造差异化产品,适合对数据安全有要求的企业用户。
2025年10月将举办多场国际学术会议,涵盖能源、人工智能、计算机科学、环境工程等多个领域。EPE2025、AIAC2025等会议将分别在大连、巴黎等地举行,聚焦前沿科技发展。同期还有UEPMR2025(马来西亚)、MSEA2025(大连)等跨学科会议。10月下旬将有30余场会议在武汉、南京、广州等城市召开,涉及智能制造、大数据、电子信息等热点方向。部分会议如ICRTT2025、ICEIPS202
目前,中国许多企业在推进数字化转型的同时,正面临着AI带来的新挑战与机遇。中国充满活力的数字生态系统为AI的全面普及提供了肥沃的土壤,为AI融入人们的日常生活提供了理想的环境。中国国内快速发展的AI产业对人才的需求日益增加,同时,中国政府为实现其远大的AI目标而采取培养一支高技能人才队伍的战略举措,使中国迅速发展成为全球AI人才培养和部署的领军者。Gartner预测,到2028年,60%部署AI技
在城市发展的洪流中,清洁工作是看不见的基石。当国家级的政策导向为科技创新注入强劲动力,头部企业在AI领域的竞赛愈发白热化,我们不禁思考:未来的城市清洁将走向何方?
她认为,正如五亿多年前生物视觉的进化,以前所未有的方式点燃了生命形态与智能的爆炸性增长,赋予机器空间智能,也将为AI带来一次类似的范式飞跃。在她看来,任何缺少空间智能的通用人工智能(AGI)都是不完整的。同时,这也与李飞飞长期关注的医疗健康“环境智能”理念不谋而合——具备空间感知力的AI系统,可以在不侵犯隐私的前提下,默默守护病患安全,辅助医护工作。从google的最新进展,到这次李飞飞的成果展示
作为一台室外巡扫机器人,我依托大模型算法实时感知环境,用智能决策平衡效率与能耗,在无声中守护城市的洁净与低碳。
💥💥💞💞❤️❤️💥💥博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。⛳️行百里者,半于九十。📋📋📋🎁🎁🎁。
随着人工智能技术的快速突破和政策全方位支持,智能经济时代已经不再是遥远的未来,而是正以惊人的速度加速到来。人工智能正在深刻重塑传统产业和社会结构,而实时视频技术,作为人工智能生态中不可或缺的一部分,将在各大行业中扮演越来越重要的角色。智慧城市、智能制造、医疗健康、教育培训等领域的智能化进程,将因实时视频技术的支持而得到全面加速。
在工业机器人巡检、仓储 AGV 搬运、室外无人机导航等场景中,机器人路径规划的核心需求可概括为 “安全、高效、平滑”—— 既要避开障碍物,找到从起点到终点的最短路径;又要保证路径曲线连续光滑,避免机器人因剧烈转向导致的机械损耗或姿态不稳定。传统路径规划算法(如 A*、Dijkstra)虽能快速找到可行路径,但往往输出折线型路径,需额外处理平滑问题;而单纯的平滑算法(如 B 样条)又缺乏高效的全局路
在变电站、配电房等复杂工业场景中,电气设备巡检机器人需在动态环境中实现高效、安全的路径规划。传统全局路径规划算法(如A)难以应对动态障碍物,而局部路径规划算法(如DWA)易陷入局部最优解。本文提出一种融合改进A算法与动态窗口法(DWA)的混合路径规划框架,通过全局路径指引与局部动态调整的协同机制,显著提升巡检机器人在复杂环境中的适应性与鲁棒性。实验结果表明,该算法在巡检效率、避障成功率等指标上较传
本期分享笔者将通过一个包含前端和后端的全栈项目——大模型智能问答网站,带大家进一步巩固LangChain的基础知识。
2023年3月青少年软件编程(Python六级)等级考试试卷包含15道单选题,主要考察Python文件操作、数据处理、类与对象、数据库操作及GUI编程等知识点。试题涉及文本文件读写(如'\n'换行处理)、CSV数据处理、numpy数组创建、matplotlib绘图、类定义与实例化、SQLite数据库查询以及tkinter界面开发等内容。每道题均提供详细解析,帮助考生理解Python在实际应用中的各
本文系统探讨了热-痛觉模拟系统的损伤自检测技术及其算法进展,重点分析了动态阈值优化算法、心理触觉映射模型和神经关联模型等关键技术。研究显示,柔性电子伤害感受器和多模态传感器融合可有效模拟生物痛觉特性,而脉冲神经网络(SNN)和多模态融合算法能实现类脑痛觉决策。国内在光热电传感材料、多模态融合架构等方面取得突破,但面临灵敏度-特异性平衡、跨模态干扰等技术挑战。未来需结合神经形态芯片集成、个性化校准模
本期分享系统介绍了如何通过微调提升Agent性能这一大模型面试几乎必问的关键问题,推荐大家从高效微调和强化学习微调两个角度进行回答,同时扩展了3个热点问题,涵盖了通过微调提升Agent性能的全部内容。
随着企业数字化进程的加速,客户服务已成为企业降本增效和提升竞争力的核心环节。据全球领先的技术研究与咨询公司Gartner最新报告指出,与传统人工客服相比,部署一套成熟的智能客服系统可帮助企业节省高达30% 的运营成本,同时将客服效率提升50% 以上。另据IDC(国际数据公司) 预测,到2025年,全球超过60% 的企业将把人工智能驱动的客户互动平台作为首选方案,对话式AI的市场规模将突破百亿美元大
25年8月来自清华、BIGAI 和南洋理工的论文"GWM: Towards Scalable Gaussian World Models for Robotic Manipulation"。由于现实世界交互效率低下,在已学习的世界模型中训练机器人策略正成为一种趋势。现有的基于图像世界模型和策略已取得一定成效,但缺乏鲁棒的几何信息,即使基于互联网规模的视频源进行预训练,也需要对三维世界有一致的空间和
大语言模型赋能未来工厂:制造业智能化变革新路径 摘要:随着制造业数字化转型加速,大语言模型正成为推动未来工厂变革的核心驱动力。本文探讨了大语言模型如何赋能工业机器人实现复杂任务理解、自适应决策与持续学习进化,并深入分析了其在生产流程智能化(精准需求预测、智能排产调度、实时质量检测、预测性设备维护)和供应链协同创新(需求驱动规划、库存智能优化)等关键环节的应用价值。研究表明,大语言模型通过打破信息孤
🛠️ 创建了一个基于 Dify 的聊天机器人✍️ 编写了有效的 Prompt 提示词🔁 测试并优化了对话逻辑🌐 将其发布为 Web 嵌入组件或 API 服务这不仅是“Hello World”,更是你迈向AI 原生应用开发的第一步!
想象一下,未来编写软件不再需要逐行敲代码,而是像对一位超级智能的“数字员工”描述需求,它就能自动分析、设计、编码、测试,最终交付可运行的软件。这并非科幻,而是“基于大语言模型(LLM)的代码生成代理”正在带来的革命。传统的代码生成技术,无论是早期的程序合成(依赖难以编写的严格形式化规约),还是数据驱动的深度学习模型(常生成有语法/语义错误、功能有限的片段),都难以独立完成复杂的软件开发任务。LLM
这篇综述系统探讨了多模态融合与视觉语言模型(VLM)在机器人视觉中的应用,涵盖语义理解、三维目标检测、具身导航和机器人操作等任务。文章比较了传统方法与大模型驱动的多模态融合技术,分析了主流数据集与评测基准,并指出跨模态对齐、轻量化部署和任务导向融合是关键研究方向。未来将注重结构化空间建模、可解释性与认知型VLM架构发展,推动机器人实现更自主、高效的智能交互。
端到端优化:从前端的声音采集、降噪、回声消除,到网络的传输、抖动消除,再到后端的语音识别(ASR)、自然语言理解(NLU)、智能体决策、语音合成(TTS),整个链路需要高度优化。对比:单纯的文本输入是静态和抽象的,而语音流包含了丰富的信息(语速、语调、停顿、背景音),智能体可以据此做出更精准的判断。客服质检:智能体自动监听海量的客服通话流,自动质检,筛选出不合格或有风险的对话,效率远高于人工抽检。
摘要:作者成功利用MuseBot和Playwright MCP实现了AI自动购买12306火车票的全过程。通过分解任务步骤,AI完成了从登录、查询车次到提交候补订单的完整流程。虽然仍需手动扫码登录,但展示了AI自动化购票的潜力。完整操作视频已发布在B站,未来若实现全自动化登录支付,AI买票将不再是梦想。
8 月 28 日沈抖博士的《智能,生成无限可能》主题演讲为我们分享了智能体经济的崛起,发布了新一代 AI 云基础设施,包括百舸 5.0、千帆 4.0 等新产品,也介绍了 AI Agents 在千行百业成功落地的案例,相信大家对我们正在进入的智能时代也都充满着期待。我们曾见证蒸汽时代的力量,电气时代的光明,信息时代的互联。总的来说,大模型正从聊天陪伴走向解决各类场景需求的应用,我们正站在价值爆发的前
目前,随着年龄的增长,人们越来越注重自身的身体状况。然后通过运动和饮食来强身健体,有的人也会通过艾灸机器人和微高压氧舱调理身体。尤其是艾灸机器人,它比传统艾灸操作简单、无艾烟污染、人为误差低等等。比如七彩喜智能艾灸机器人,是结合传统中医艾灸疗法与现代人工智能技术的创新医疗设备,通过智能化、精准化的方式提升艾灸疗效和用户体验。
无需编程,只需4步,10分钟用Dify搭建智能客服!文末附进阶技巧:数据分析优化、多轮对话设计及人工接管配置,助你打造高效客服助手。
当英伟达展示物理AI蓝图时,中国企业的缝纫机器人已走进服装厂流水线——技术革命的终局评判者,永远是账本上的油墨与车间的金属碎屑。
三年了,大模型热潮一点没有退却,通用人工智能(AGI)的曙光似乎已在地平线上闪现,各大科技巨头间的竞赛日趋白热化,从文本到视频,多模态大模型的进化速度令人既兴奋又不安。世界一方面为 AI 在医疗、科研等领域展现的巨大潜力而欢呼,另一方面,关于其失控风险、大规模失业和社会伦理的忧虑也从未如此真切。在这样的时代背景下,被誉为“人工智能教父”的杰弗里·杰弗里·辛顿(Dr. Geoffrey Hinton
在当代关于人工智能的讨论中,常见的两种极端声音,一种是担忧“AI 将取代人类”,另一种是乐观地将其视为“全新的智能生命”。然而,如果我们从更深的认知视角去审视,人工智能既不是人类的替代物,也还未成为独立的主体。真正的未来,不在于我们担心“AI 是否像人”,而在于我们如何与这种异质性共处,并在差异的张力中,共同开拓新的认知进化道路。人类的认知往往是分割的:语言是语言,图像是图像,数学是数学,感官是感
DORA-RS是一款面向AI时代的机器人中间件,采用Rust语言开发,性能比ROS2快10-17倍。其核心优势包括:支持Python、Rust等多种语言降低开发门槛;采用数据流架构实现端边云协同;深度集成AI模型处理多模态数据。DORA-RS已构建覆盖芯片、传感器到整机的全链路生态,并与多所高校及企业开展合作。作为开源项目,DORA-RS正推动机器人开发从小众走向大众。
机器人
——机器人
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net