logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AVM 环视拼接方法介绍

关于车辆的全景环视系统网上已经有很多的资料,然而几乎没有可供参考的代码,这一点对入门的新人来说非常不友好。全景环视系统,又称AVM。在自动驾驶领域,AVM属于自动泊车系统的一部分,是一种实用性极高、可大幅提升用户体验和驾驶安全性的功能。AVM汽车环视影像系统如图所示,由安装在前保险杠、后备箱、后视镜上的四个外置鱼眼相机构成。该系统包含的算子按照先后顺序:去畸变、四路鱼眼相机联合标定、投影变换、鸟瞰

文章图片
#人工智能#计算机视觉#自动驾驶
Sigma File Manager:为Windows和Linux用户打造的现代文件管理器,超越传统的文件管理系统

SigmaFileManager是一款跨平台开源文件管理器,支持Windows和Linux系统。它采用现代化界面设计,提供文件预览、快速搜索、云同步等实用功能,并支持个性化主题定制。该软件通过直观的操作界面和丰富的扩展插件,显著提升文件管理效率。作为免费开源项目,SigmaFileManager持续优化更新,致力于为用户提供更便捷的文件管理体验。

文章图片
#linux#运维#服务器
Google Glog 使用

Glog是Google的一个C++开源日志系统,轻巧灵活,入门简单,而且功能也比较完善。

#c++
NumPy 使用笔记

NumPy是一个强大的开源库,用于表示矩阵,它基本实现了MATLAB的矩阵操作。

文章图片
#矩阵#python
Sora 物理悖谬的几何解释

龙年伊始,Sora横空出世,举世震惊。Sora声称“作为世界模拟的视频生成模型”,豪气干云。有人悲观预言很多传统领域可能被颠覆,其中最为岌岌可危的可能是计算机图形学,短视频和影视娱乐行业。依随OpenAI透露出更多技术细节,很多Sora生成的物理悖谬的视频流传于网络。这里笔者依据现代数学特别是整体微分几何领域的一些观点来解释目前Sora技术路线中的缺陷,希望能够抛砖引玉,为广大AI研究和工程人员拓

文章图片
#人工智能#深度学习
DreamCar: moving-forward 场景中的3D汽车重建(高质量生成)

自驾行业通常雇用专业艺术家来制作精美的3D汽车模型。然而,制作大规模的数字资产成本高昂。由于已经有许多包含大量汽车图像的数据集,我们专注于从这些数据集中重建高质量的3D汽车模型。然而,这些数据集只包含前行场景中汽车的一侧图像。我们尝试使用现有的生成模型提供更多的监督信息,但由于这些模型是在合成数据集上训练的,而不是专门针对汽车的数据集,因此难以在汽车上泛化。此外,在处理野外图像时,由于相机姿态估计

文章图片
#深度学习#计算机视觉
Hugging Face 使用笔记

Hugging Face Hub和 Github 类似,都是Hub(社区)。Hugging Face可以说的上是机器学习界的Github。hugging face在NLP领域最出名,其提供的模型大多都是基于Transformer的。

文章图片
#深度学习
NViST 运行笔记

文章标题:NViST: In the Wild New View Synthesis from a Single Image with Transformers 创建环境进入环境安装torch torchvision torchaudio安装其它依赖2. 数据下载与预处理2.1. 获取下载地址和密码点击链接 https://docs.google.com/forms/d/e/1FAIpQLSfU9

文章图片
#深度学习#人工智能
常用聚类算法分析

聚类(Clustering)是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离。

文章图片
#聚类#算法#机器学习
多视图立体匹配 MVSNet 网络解析

作者提出MVSNet,基于多视图图像的深度估计网络。在网络中,首先在2D图像上进行特征提取得到特征图,然后通过可微分的单应变换,基于参考视图的相机视锥体构建3D代价体。然后使用3D卷积对代价体进行正则化,回归得到初始的深度图;初始的深度图通过参考图像优化得到最后的深度图。MVSNet可以灵活地处理任意数量视图,因为基于方差的代价指标可将多个特征代价提融合为一个特征代价体。MVSNet在大规模室内数

文章图片
#人工智能#自动驾驶#深度学习
    共 192 条
  • 1
  • 2
  • 3
  • 20
  • 请选择