logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Git08-代码Review01:GitLab 中接入 AI Code Review 完整指南

本文目标是为一个示例项目接入自动化 AI Code Review,效果是:GitLab 官方说明,Merge request pipelines 可以在创建或更新 MR 时运行专门的 CI/CD 任务;CI/CD 任务由仓库根目录的配置。(GitLab 文档)为了避免和你的真实项目混淆,本文统一使用这些示例名称:最终链路是:开发者提交 MR → GitLab MR Pipeline 触发 → Ru

#人工智能#gitlab#代码复审
激光雷达(LiDAR)-高速运动的影响02:畸变【对一帧内所有点去畸变:①GPS&IMU(打时间戳)、激光脉冲(打时间戳)⮕时间戳同步⮕坐标系变换(将点从运动中的传感器坐标系转换到固定的世界坐标系)】

报告日期: 2026年2月19日研究员: 您的专属AI研究助手主题: 高速运动汽车激光雷达(LiDAR)系统信号回波与接收效率深度分析高速运动的真正挑战并非源于单次脉冲的飞行时间,而是源于LiDAR完成一整帧扫描(例如,0.1秒)期间车辆的持续运动。LiDAR系统在一帧内会发射数万到数百万个激光脉冲,由于每个脉冲发射时车辆的位置和姿态(位姿)都略有不同,如果直接将这些在不同位姿下采集到的点云数据拼

#人工智能#自动驾驶
自动驾驶-数据集01:KITTI 数据集(详细版)【传感器配置:相机、激光雷达、GPS/IMU】【数据主要组成:多模态传感器数据、精细的地面真值标注、精确的传感器校准参数(不同传感器数据的桥梁)】

KITTI数据集由德国卡尔斯鲁厄理工学院(KIT)与丰田美国技术研究院(TTI-C)共同创建,自发布以来,已成为评估和推进计算机视觉与自动驾驶感知算法(尤其是3D目标检测、视觉里程计和语义分割等)的黄金标准 [[1]][[2]][[3]]。合作开发的成果 [[4]][[5]][[6]]。该项目的目标是建立一个具有挑战性的真实世界场景基准,以支持和推动自动驾驶相关感知技术的发展,这些技术涵盖了立体视

#自动驾驶#人工智能
4个大语言模型训练中的典型开源数据集

随着最近这些年来基于统计机器学习的自然语言处理的算法的发展,以及信息检索研究的需求,特别是近年来深度学习和预训练语言模型的研究以及国内国外许多大模型的开源,研究人员们构建了多种大规模开源数据集,涵盖了网页、图片、论文、百科等多个领域。在构建大语言模型时,数据的质量和多样性对于提高模型的性能至关重要‘同时,为了推动大模型的语言的研究和应用,学术界和工业界也开放了多个针对大语言模型的开源数据集,本篇文

文章图片
#语言模型#人工智能#自然语言处理
Loss/损失函数05:Triplet Loss(三元组损失)详解【拉近类内距离、拉远类间距离】【应用场景:人脸识别、图像检索、行人重识别、签名验证、语音识别】

相似的图像(如同一个人的不同照片)在特征空间中距离很近不相似的图像(如不同人的照片)在特征空间中距离很远传统的分类损失(如交叉熵)需要预先知道所有类别,但在人脸识别中,我们可能会遇到训练时没见过的新人脸。Triplet Loss通过学习一个嵌入空间(Embedding Space),使得相似样本靠近,不相似样本远离,从而解决这个问题。三元组结构目标DapαDanDapαDan损失函数L∥fa−fp

#人工智能
SlimPajama:CerebrasAI开源最新可商用的高质量大语言模型训练数据集,含6270亿个tokens!

TOGETHER发布的RedPajama数据集包含1.21万亿的tokens。通过过滤重复数据和低质量数据集之后,SlimPajama去除了原始RedPajama的49.6的字节数,将1.21万亿的tokens降低到6270亿的tokens。SlimPajama数据产生的过程如下,首先从RedPajama中去除短的、低质量的文档。在去除标点符号、空白符号、换行符和制表符之后,将短于200个字符的文

文章图片
#语言模型#人工智能#自然语言处理
时间序列预测方法:传统统计方法、机器学习方法、深度学习方法、Transformer、大语言模型方法、多模态方法

【代码】时间序列预测方法:传统统计方法、机器学习方法、深度学习方法、Transformer、大语言模型方法、多模态方法。

#深度学习#机器学习#transformer
Git08-代码Review01:GitLab 中接入 AI Code Review 完整指南

本文目标是为一个示例项目接入自动化 AI Code Review,效果是:GitLab 官方说明,Merge request pipelines 可以在创建或更新 MR 时运行专门的 CI/CD 任务;CI/CD 任务由仓库根目录的配置。(GitLab 文档)为了避免和你的真实项目混淆,本文统一使用这些示例名称:最终链路是:开发者提交 MR → GitLab MR Pipeline 触发 → Ru

#人工智能#gitlab#代码复审
    共 693 条
  • 1
  • 2
  • 3
  • 70
  • 请选择