logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

自动驾驶世界模型-范式02-BEV&规划-04:HERMES: A Unified Self-Driving World Model for Simultaneous 3D Scene Underst

Xin Zhou1∗, Dingkang Liang1∗†, Sifan Tu1\mathrm { T u ^ { 1 } }Tu1 , Xiwu Chen3, Yikang Ding2†\mathrm { D i n g ^ { 2 \dagger } }Ding2† , Dingyuan Zhang1, Feiyang Tan3\mathrm { T a n ^ { 3 } }Tan3 , H

#自动驾驶#3d#人工智能
自动驾驶世界模型-范式02-BEV&规划-03:BEVWorld: A Multimodal World Simulator for Autonomous Driving via Scene-Leve

Yumeng Zhang Shi Gong Kaixin Xiong Xiaoqing Ye† Xiaofan Li Xiao Tan Fan Wang Jizhou Huang† * Hua Wu Haifeng Wang Baidu Inc., China {zhangyumeng04,gongshi,yexiaoqing,huangjizhou01}@baidu.comWorld model

#自动驾驶#人工智能#机器学习
自动驾驶世界模型-范式02-BEV&规划-02:Driving in the Occupancy World: Vision-Centric 4D Occupancy Forecasting and

Yu Yang 1*, Jianbiao Mei 1*, Yukai Ma 1, Siliang Du2†\mathbf { D } \mathbf { u } ^ { 2 \dag }Du2† , Wenqing Chen 2, Yijie Qian 1, Yuxiang Feng 1, Yong Liu 1†1Zhejiang University 2Huawei Technologies{y

#自动驾驶#人工智能#机器学习
自动驾驶世界模型-范式01-视频生成-01:DrivingWorld: Constructing World Model for Autonomous Driving via Video GPT

Xiaotao Hu1,2\mathrm { { H u ^ { 1 , 2 } } }Hu1,2 * Wei Yin2∗†\mathrm { Y i n ^ { 2 } \ast \dagger }Yin2∗† Mingkai Jia1,2 Junyuan Deng1,2 Xiaoyang Guo2 Qian Zhang2 Xiaoxiao Long1 ‡ Ping Tan11 The Hong

#自动驾驶
自动驾驶世界模型-范式01-视频生成-02:Driving into the Future: Multiview Visual Forecasting and Planning with

1∗ Lue Fan1∗ Hongxin Li⁡1∗\operatorname { L i } ^ { 1 * }Li1∗ Yuntao Chen2B Zhaoxiang Zhang1,2B 1CASIA 2CAIR, HKISI, CAS Project Page: https://drive-wm.github.ioCode: https://github.com/BraveGroup/Dri

#人工智能
UMM01:统一多模态理解与生成模型:进展、挑战与机遇

Unified Multimodal Understanding and Generation Models: Advances, Challenges, and OpportunitiesXinjie Zhang*, JintaoGuo*, Shanshan Zhao*, Minghao Fu, Lunhao Duan, Jiakui Hu, Yong Xien Chng, Guo-Hua Wa

#人工智能
地平线 XJ3 算法工具链 版本发布及Filezilla使用教程

大家好,考虑到部分开发者使用网盘下载会出现断流的现象,现更新使用tftp方式进行下载,大家下载filezilla客户端,配置好接口便可以最快的速度获取地平线的开发工具,老版本的开发套件依旧保修原有的下载渠道,欢迎大家使用。J5 开发资料传送门:https://developer.horizon.ai/forumDetail/118363912788935318。下载当前文件夹下所有文件:ftp >

文章图片
#物联网
深度学习及LLM/VLM目标检测算法发展史调研报告

骨干网络演进从手工设计到神经架构搜索(NAS)从纯CNN到CNN-Transformer混合架构特征融合创新FPN:自顶向下的特征金字塔PANet:双向特征融合BiFPN:加权双向特征金字塔NAS-FPN:神经架构搜索的特征融合检测头设计耦合头 → 解耦头锚点机制 → 无锚点设计单尺度 → 多尺度预测传统分类器 → 动态分类器目标检测技术在过去十年中经历了从传统方法到深度学习,从封闭集到开放世界的

#深度学习#目标检测#算法
Loss/损失函数04:InfoNCE(Information Noise-Contrastive Estimation)【对比学习损失】【用于Embedding模型(BiEncoder双塔结构)】

交叉熵损失:是分类任务的标准损失函数,通过 Softmax 将 logits 转换为概率分布,并最小化预测与真实标签之间的差异。它适用于监督学习任务。InfoNCE:是一种自监督学习中的损失函数,通过区分正负样本对的相似度来学习数据表示。它避免了 Softmax 计算的昂贵成本,适用于对比学习任务。构建一个类似于多类对比任务的框架,在其中正样本是“正确类别”,负样本是“错误类别”。在优化过程中平衡

#学习#人工智能
RL(强化学习)-训练开源库01:VeRL

(Volcano Engine Reinforcement Learning)是字节跳动 Seed 团队开源的强化学习训练框架,专为大规模语言模型(LLM)的后训练设计,特别适用于强化学习与人类反馈(RLHF)任务。该框架采用了混合控制器(HybridFlow)编程模型,旨在提供灵活、高效且适用于生产环境的训练能力。

#人工智能
    共 566 条
  • 1
  • 2
  • 3
  • 57
  • 请选择