yangyc的学习日常个人主页

@weixin_52088842

yangyc的学习日常

2023-09-20 10:43:45 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

内容整理二：Vision Transformer(VIT)

ViT 的伟大之处不在于它提出了多么复杂的公式，而在于它用极简的暴力美学证明了一件事：计算机视觉和自然语言处理的底层架构是可以统一的。只要数据和算力足够，通用的 Transformer 架构完全可以舍弃特定领域的归纳偏置。它直接为后来这几年的多模态大模型（如 CLIP、Sora、GPT-4V 等）铺平了底层架构的道路，标志着大模型“大基建时代”的全面到来。备注：当然上面的内容，一眼可以看出来是LL

#transformer #深度学习 #人工智能

内容整理二：Vision Transformer(VIT)

#transformer #深度学习 #人工智能

RealsenseD455 内容整理（一）

首先从硬件部分开始梳理，先清楚四个摄像头分别是什么。红外投影仪(IR Projector):发射红外光，生成特定的红外光图案，如点阵或条纹，并且可以与红外摄像头配合，通过分析反射光计算物体的深度和形状。同时捕捉左右视角的图像，通过视差计算深度信息。接收左右红外相机的图像数据，通过计算左右图像之间的视差（即像素点的位移）来推断出每个像素点的深度值。同时捕捉彩色图像，与深度图像进行配准，生成RGBD图

#嵌入式硬件 #计算机视觉

到底了