logo
publist
写文章

简介

【QQ群64104075 / WeChat whaosoft】 1. 物联网IOT arduino esp8266 stm 等 2. 视觉相关-瑕疵检测-和测量设备等 3. 数字孪生 4. 车联网IOV V2X

擅长的技术栈

可提供的服务

暂无可提供的服务

多模态预训练大模型~

一般来说的深度神经网络在大规模数据集上进行训练,例如广泛使用的残差网络,是在ImageNet数据集上使用分类任务进行预训练的。相比之下,多模态预训练大模型通常是在大规模训练数据集上进行训练。通常,这些数据没有标注标签,因为规模太大而无法标注。另一方面,参数需要达到一定的规模。如图3所示,多模态数据、大型模型和计算能力紧密相连。总之,在计算能力的支持下,多模态预训练通常表示在无监督方式下使用大量多模

#人工智能
FFNet

这里提出了一个名为FFNet的极简架构,并展现了FFNet架构和一系列基于FFNet架构设计的网络模型的结果。实验表明:FFNet不仅降低了推理时间和计算成本,其内的各种操作算子对各种模型推理硬件也非常友好,这使得语义分割在算力有限的设备上部署变得更加容易。语义分割(Semantic Segmentation)现有的一些先进架构(如HRNet)的设计所引起的高复杂性对一系列模型加速工具并不友好,导

#人工智能
OpenVINO相关

现在,英特尔至强处理器所采用的 AVX-512 指令集(Advanced Vector Extensions,AVX),在 SIMD 的基本想法上,已经经过 20 多年的优化与发展,其寄存器已由最初的 64 位升级到了 512 位,且具备两个 512 位的 FMA (融合乘加运算指令)单元,这意味着应用程序可同时执行 32 次双精度、64 次单精度浮点运算,或操作八个 64 位和十六个 32 位整

#openvino#人工智能
让视频搜索更精准~多模态搜索算法

然而,这种方法的问题在于 LMF 对输入的模态特征维数敏感,而特征降维势必对效果产生影响,因此我们引入基于 Fusion Transformer 的融合方法,通过输入各个模态的原始模态表征并基于 attention 的方式进行充分的融合交互,进一步提升效果。视频帧的表征与封面模态的应用方式相同,如何做好 query - 视频帧之间的跨模态匹配十分重要,早期的匹配方案是先得到单模态的表征模型,然后基

#人工智能
Ultra-Fast-Lane-Detection-V2最新车道线检测算法

基于这一观察结果,我们提出了一种新颖、简单、有效的范式,旨在实现超快的速度和解决有挑战性场景的问题。在anchor-driven表示的帮助下,我们将车道检测任务重新表述为有序分类问题,以获得车道线的坐标。在四个车道检测数据集上的广泛实验表明,我们的方法可以在速度和准确性方面达到最先进的性能。在实际应用中,由于下游任务对检测速度要求较高,在车辆计算设备有限的情况下,车道检测算法被快速执行来提供实时的

#人工智能#计算机视觉
嵌入式分享合集174

滤波器是一个电路,其去除或“过滤掉”频率分量的特定范围。换句话说,它将信号的频谱分离为将要通过的频率分量和将被阻隔的频率分量。如果您对频域分析没有太多经验,您可能仍然不确定这些频率成分是什么,以及它们如何在不能同时具有多个电压值的信号中共存。让我们看一个有助于澄清这个概念的简短例子。假设我们有一个由完美的5kHz正弦波组成的音频信号。我们知道时域中的正弦波是什么样的,在频域中我们只能看到5kHz的

#嵌入式硬件
IOC-golang 的 AOP

我真感觉啊 go越来越往java方向走了.... 其实go在java和c之间也尴尬 不过语言就是个工具 AOP 与 IOC 的关系AOP (面向切面编程)是一种编程设计思想,旨在通过拦截业务过程的切面,实现特定模块化的能力,降低业务逻辑之间的耦合度。这一思路在众多知名项目中都有实践。例如 Spring 的切点 PointCut 、 gRPC的拦截器 Interceptor 、Dubbo 的过滤器

#golang
ELIC图像压缩算法

此时解码器由于缺少对应 “特征编码 -重构图片” 对应的映射关系, 两个相邻编码值之间也不存在任何关联, 模型也无从知道位置 2 编码值的重构结果应该介于位置 1 和 3 编码值之间, 输出结果就会出现模糊或乱码。针对 MSE-optimized 模型在 bpp 较小时出现的模糊问题, 在损失函数中引入 LPIPS 损失,该损失更加注重肉眼主观视觉效果, 最终在 bpp 变化不大的情况下解压图片的

#嵌入式硬件
Stable Video 3D( sv3d )

Stable Video 3D 模型的架构如下图 2 所示,它基于 Stable Video Diffusion 架构构建而成,包含一个具有多个层的 UNet,其中每一层又包含一个带有 Conv3D 层的残差块序列,以及两个带有注意力层(空间和时间)的 transformer 块。而在动态轨道上,方位角可以不等距,每个视图的仰角也可以不同。表 1 和表 3 显示了 Stable Video 3D

#人工智能
自动驾驶の泊车算法

我以为测试结果会很差,结果还是有点出乎意料的,虽然有的时候会出现无解,但是只要初始线段给的好一点就不会出问题,优化的速度也挺快平均时间大概是0.3s, 路径的质量的评价我觉得主要是看平滑度和曲率大小,只要曲率不会超过车辆最小转弯半径就可以了, 这里我设置的曲率最大是0.155, 列了几组测试图,第一个是直线段参考线和优化后的路径图,第二幅是对应的曲率和航向。路径点的间隔不能小,否则优化时间和质量都

#人工智能
    共 288 条
  • 1
  • 2
  • 3
  • 29
  • 请选择