
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
世界模型新作LeWorldModel全面解读(一)
LeCun团队提出的LeWorldModel(LeWM)是一个简洁高效的世界模型框架,其核心创新在于SIGReg正则化方法。该模型采用JEPA架构,包含共享参数的Encoder和Predictor模块,通过预测下一帧的潜在表示而非原始像素来学习环境动态。笔者在原始论文的基础上,结合个人理解尽可能对其进行深入浅出的系统性讲解。
相机标定与PnP解算
本文介绍了计算机视觉中的相机成像模型与相关数学基础。主要内容包括:线性代数中的矩阵乘法公式、右手坐标系的定义及常见应用;空间位姿描述的三种方法(欧拉角、旋转矩阵、旋转向量);相机成像的四大坐标系(世界、相机、图像、像素)及其转换关系,推导出完整的针孔相机模型公式;最后简要说明图像畸变的两种类型(径向和切向)及其成因,并提及常用的畸变系数表示。这些知识为理解计算机视觉中的三维重建、目标跟踪等任务奠定

到底了







