logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

动态物体滤除算法

这类方法的基本假设是:如果一个激光点的光路穿过了另一个激光点,那么另一个激光点就是动态点。这个假设逻辑上完全说得通,但实现起来有两个问题:其一,入射角接近90度时的误杀问题,如下图所示,红色箭头指向的旧点因为与新点(五角星)光路很接近,会被误杀掉,考虑到一帧激光点云本身的角度误差、测距误差、光斑影响等,这种误杀会更严重。

#算法#计算机视觉#机器学习
二分图最大匹配算法:匈牙利、KM

二分图最大匹配:匈牙利算法二分图最大权匹配:KM算法

文章图片
#算法#图论
多模态视频理解领域 Benchmark 与 Leaderboard 整理

本文系统梳理了多模态视频理解领域的核心基准测试(Benchmark)和排行榜(Leaderboard),为研究者提供评估模型性能的参考框架。重点介绍了7个具有代表性的Benchmark,包括MMBench-Video、Video-MMMU等,涵盖通用视频理解、教育知识获取、3D空间推理等多样化任务。同时整理了4个主要Leaderboard,如OpenCompass司南榜单和SuperCLUE中文评

#算法#人工智能#计算机视觉 +1
Tuning and evaluation of Legged-Locomotion

实验摘要: 通过对比不同地形训练效果(障碍地形、楼梯地形及混合地形),发现:1)单一地形顺序训练会导致智能体遗忘先前学习内容;2)混合地形训练能有效缓解遗忘效应,综合表现更优(如实验3障碍躲避成功率93.75%、上下楼梯成功率100%/83.3%);3)训练场景与目标场景越接近,训练效率越高。实验表明混合训练策略在多地形适应性上显著优于顺序训练。

文章图片
#人工智能#机器人#机器学习
大模型基础:Foundamentals of LLM

摘要: 自回归生成模型(如GPT)通过逐步预测序列元素(文字、像素等)实现内容生成,核心是Transformer解码器的掩码自注意力机制。其优势在于生成连贯性强,但受限于逐词生成的顺序性。为提升效率,LLM引入past_key_values缓存历史注意力计算结果(key/value),将计算复杂度从O(n²)降至O(n)。该技术与扩散模型形成互补(离散vs连续数据生成),共同推动生成式AI发展。

#机器学习#人工智能#算法 +2
SLAM基础:旋转向量与四元数

旋转的表示:旋转向量与四元数

文章图片
#线性代数#矩阵
到底了