logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习三大分类

教会一个智能体(比如机器人、游戏AI、推荐系统)通过和,学会在某个中完成特定任务的最佳策略。智能体要找到一个,这个策略告诉它在每个状态下该做什么动作,使得。就像玩游戏要通关得分最高,投资要长期收益最大。当你在教一只狗狗学新动作(比如坐下)。

#人工智能
深入浅出图神经网络和图联邦学习

深入浅出解析图神经网络(Graph Neural Networks, GNNs)和图联邦学习(Federated Graph Learning, FGL)

#神经网络#人工智能
NLP语言模型训练里的特殊向量

在第 ( t ) 个时间步,只能看到 ( y_1, y_2, \ldots, y_{t-1} ) 这些前面的 token,不能看到未来的信息。,但它们出现在不同类型的 NLP 模型中,并承担不同的功能。在 Transformer 类模型中,DEC token 也。用于文本生成、机器翻译、问答任务(如 GPT、T5)。依赖“过去的输出”来预测下一个词,典型的自回归结构。,但它们的使用方式略有不同,取

#自然语言处理#语言模型#人工智能
Google世界模型

能够“做最精准的梦,并从梦中学习”的AI,才最有可能成为智能的巅峰。世界模型,或许真如“Attention”一样,成为解锁AGI的终极钥匙。马尔可夫过程、LTL目标、有界智能体、状态转换、提取算法)及其深远意义(AGI路径、世界模型的核心地位、行为反推模型、经验时代的到来)想象你想知道AI对“从客厅走到厨房成功率多高”的判断(这就是环境规则的一部分)。你想训练一个能在复杂迷宫里找到宝藏的AI(智能

#人工智能
SimVG论文精读

在RefCOCO和RefCOCO +遵循train / validation / test A / test B的拆分,RefCOCOg只拆分了train / validation集合。The blue and red bounding boxes are correct and incorrect comprehension respectively, while the green boxes

文章图片
#人工智能#深度学习
模型压缩技术从零到一

模型压缩是深度学习中的重要技术,旨在减小模型尺寸和计算需求,特别适合在移动设备或嵌入式系统上部署。本文将简要介绍几种主要方法,帮助您理解其基本原理和应用场景。剪枝:通过移除不重要的权重或神经元减小模型尺寸。量化:将浮点数权重转换为低精度格式(如8位整数)以加速推理。知识蒸馏:训练小型模型模仿大型模型的行为,保持性能。低秩分解:将权重矩阵分解为较小矩阵,减少参数数量。轻量级模型设计:从头设计高效架构

#人工智能#深度学习
π0流匹配模型-VLA

在数学和物理中,“流”描述了一个点随着时间连续运动所划出的轨迹。在流匹配中,我们把一个数据点(比如,一个代表动作的向量)想象成空间中的一个点。这个点会随着一个虚构的“时间”参数t从 0 流向 1。t=0时,这个点是简单的噪声。t=1时,这个点变成了我们想要的干净数据(正确的动作)。中间的所有状态x_t就构成了这个数据点从噪声“流动”成干净数据的一条连续轨迹。整个数据集的这种“流动”所形成的轨迹场,

#人工智能
π0流匹配模型-VLA

在数学和物理中,“流”描述了一个点随着时间连续运动所划出的轨迹。在流匹配中,我们把一个数据点(比如,一个代表动作的向量)想象成空间中的一个点。这个点会随着一个虚构的“时间”参数t从 0 流向 1。t=0时,这个点是简单的噪声。t=1时,这个点变成了我们想要的干净数据(正确的动作)。中间的所有状态x_t就构成了这个数据点从噪声“流动”成干净数据的一条连续轨迹。整个数据集的这种“流动”所形成的轨迹场,

#人工智能
纯视觉方案还无法完全替代激光雷达(LiDAR)

摄像头是队里的“观察员”:眼神好(光线好时),能详细描述看到的物体(颜色、形状、路牌文字),但天黑、下雨、起雾就看不清楚,尤其不擅长准确判断远距离物体到底离多远。激光雷达是队里的“测绘员”:不管白天黑夜,都能拿出一把超快的激光尺,精准测量周围每个点的距离,画出精确的3D地图。但他对颜色、文字不敏感,也看不清物体表面的细节纹理。毫米波雷达是队里的“预警员”:能在恶劣天气下探测到大致的物体和速度,但看

#人工智能
视觉语言导航与目标导航

目标导航(Object Navigation)是VLN的进阶任务,要求机器人在陌生3D环境中,基于目标描述(如坐标、图片或自然语言)自主探索并规划路径,无需显式逐步指令。VLN(Visual-Language Navigation)是一种指令跟随任务,要求机器人根据自然语言指令(如“去客厅拿遥控器”)在未知环境中执行导航。:累积历史观测信息,辅助决策。:导航技术被视为具身智能(embodied A

#人工智能
    共 85 条
  • 1
  • 2
  • 3
  • 9
  • 请选择