logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

1.55亿 vs 30亿:理想和小鹏,在车端模型这件事上背道而驰

但具体能跑多大模型,尚未公开。MindVLA-o1在3月GTC发布后,OTA 8.5在5月上线,但核心更新是手机遥控泊车等功能增强,而非MindVLA-o1的架构级上车。GeoX的做法是把几何感知做成一个独立的、通用的底座,可供轨迹预测、占据预测、未来帧预测等多类下游任务调用。理想的端到端+VLM双系统架构中,VLM部分(约22亿参数)和端到端快系统是分开的,两者并不对应同一个统计维度。这是理想6

文章图片
具身智能企业的最大威胁,OpenClaw只是开了个头……

它巧妙地利用了现有多模态大模型(如 GPT-4o、Claude 3.5 Sonnet)强大的理解能力,将人类模糊的自然语言指令,翻译成底层机器人可以执行的模块化技能(Skills)。如果说网友们的"赛博养虾"还停留在极客的玩具阶段,那么学术界和产业界的严肃探索,则向我们展示了这种 Agentic(智能体化)架构的终极形态。OpenClaw 的出现,并不是让机器人突然"长出"了运动能力,而是充当了一

文章图片
#microsoft
高德纳的惊叹——Claude解决哈密尔顿环分解问题

针对结构规整、无通用构造范式的组合数学问题(特殊图分解、离散构造、凯莱图相关问题),大模型具备自主提炼数学框架、发现人类易忽略规律的能力,可替代部分人类数学家的创造性推导工作,将数学猜想、逻辑推理、代码实验、试错修正形成闭环,先建模再编程验证,再从结果提炼规律,这种模式适配大量离散数学、算法设计类难题,突破了传统。,用于难题的思路探索、框架构建、特例验证,尤其适合卡壳已久、无明确方向的开放问题,借

文章图片
#算法
microGPT代码详解:200行纯Python无库实现GPT训练与推理

但是不要小看这两百行,由于高度浓缩,蕴含的信息量非常大,相当于把反向传播、计算图、自动微分,注意力机制(著名论文《All you need is attention》),optimizer(这里是Adam,不是SGD),(交叉熵)损失函数,残差连接,层归一化,Tokenizer ,词嵌入,KV cache等等重要概念一网打尽(参考。state_dict 是模型的“参数档案”,专门存储模型训练过程中

文章图片
仅2美元?浙大高飞团队用生成式世界模型造出500场景无人机训练数据集

这一"先选类别再生成描述"的两步策略,是为了规避直接提示大语言模型生成场景时出现的类别偏斜问题——研究人员发现,直接提示时模型会过度生成某些类别(如医疗相关场景)。有了文本描述后,系统通过GPT Images 2.0生成对应的参考图像,再将文本和图像一并输入Marble 1.1 Plus,生成高保真的3DGS场景。在当前的论文版本中,研究团队主要聚焦于数据集的构建流水线和统计分析,将其定位为训练下

文章图片
#无人机
李飞飞团队新作:首个闭合感知‑行动回路的具身空间智能基准

团队在GPT‑5、Gemini 3.1等SOTA MLLM,以及3D增强模型(VGGT+Gemini、GT 3D+Gemini)上做了零样本评测,配合人类基线,得到五个结论。不再给模型预设视角,智能体必须自主选择感知(转头/俯仰)、移动(前后左右)、操作(拾取/放置/倒水),并按序执行,才能收集到解题证据。任务全部聚焦被动观测无法解决的问题:遮挡计数、镜面虚实、容积比较、稳定性预测、封闭空间变化、

文章图片
盘点|李飞飞团队2026上半年研究:具身智能的五个关键落子

这种表示方法隐式地包含了物体的分割、材质和接触关系,且不依赖于特定的机器人形态,从而能够利用海量不同来源的机器人交互数据进行预训练。这种方法在不增加总帧数的情况下,增加了输入样本在时间维度上的复杂性,从而减少了模型训练所需的迭代次数。然而,长期作为基准的ImageNet-1K已难以满足现代模型对数据规模和多样性的需求,且存在模型在基准上过拟合的问题。尽管在实现完全开放环境下的通用智能体仍面临长时程

文章图片
盘点|李飞飞团队2026上半年研究:具身智能的五个关键落子

这种表示方法隐式地包含了物体的分割、材质和接触关系,且不依赖于特定的机器人形态,从而能够利用海量不同来源的机器人交互数据进行预训练。这种方法在不增加总帧数的情况下,增加了输入样本在时间维度上的复杂性,从而减少了模型训练所需的迭代次数。然而,长期作为基准的ImageNet-1K已难以满足现代模型对数据规模和多样性的需求,且存在模型在基准上过拟合的问题。尽管在实现完全开放环境下的通用智能体仍面临长时程

文章图片
独家 | 61 家具身智能公司 IPO 最新进展,总估值超1.7万亿!

除已上市的6家企业外,还另有递表4家、A股排队1家、辅导/筹备5家。已驶入“安全区”的上岸者、终点线前冲刺的排队者、刚站上起跑线的递表新贵,以及正从水下浮出的庞大预备队。据多方渠道统计,目前正在港股排队上市(含已上市)的机器人相关企业已有50余家,加上A股排队的8家,缺少实打实的营收、成熟的落地场景与清晰的盈利路径,依靠行业风口堆砌的估值泡沫,终有消解之时。更值得注意的是,智元、银河通用、星海图、

文章图片
清华提出WorldFly:首个耦合世界模型与VLA的无人机导航方案

依托双分支耦合流匹配架构,它解决了世界模型与VLA融合过程中的延迟、脱节难题,搭配专属城市峡谷评测基准,为低空复杂环境导航提供了可行方案。楼宇林立形成“城市峡谷”,遮挡频发、视角急剧切换成为常态,传统VLA模型仅依靠历史画面直接输出动作,如同“走一步看一步”,缺乏对未来场景的预判能力,在陌生环境与长距离导航任务中极易失效。与此同时,自动驾驶、视频生成领域的世界模型已证明其场景预测价值,但过往世界模

文章图片
#无人机
    共 473 条
  • 1
  • 2
  • 3
  • 48
  • 请选择