logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

TensorFlow基础之模型建立与训练:线性回归、MLP多层感知机、卷积神经网络

模型建立与训练:简单的线性回归MLP多层感知机数据获取、预处理模型搭建训练与评估卷积神经网络高效建模Keras Sequential高效建模Functional API建模经典网络调用高效训练当模型建立完成后,通过 tf.keras.Model 的 compile 方法配置训练过程:使用 tf.keras.Model 的 fit 方法训练模型:使用 tf.keras.Model.evaluate

#tensorflow
无监督对比学习之MOCO 《Momentum Contrast for Unsupervised Visual Representation Learning》

无监督学习如果可以建立一种通用的无监督模型,经过海量无标签数据的学习后,可以习得一个强大的特征提取器,在面对新的任务,尤其是医疗影像等小样本任务时,也能提取到较好的特征。这就是无监督学习的意义。对比学习对比学习的概念很早就有了,它是无监督学习的一种方法,但真正成为热门方向是在2020年的2月份,Hinton组的Ting Chen提出了SimCLR,用该框架训练出的表示以7%的提升刷爆了之前的SOT

#深度学习#神经网络
gazebo仿真 街区 机器人 记录

1. 下载model库下载https://github.com/osrf/gazebo_models,解压重命名为models。移动到~/.gazebo文件夹中2. world模型https://github.com/KalanaRatnayake/Multi-robot-mapping/tree/c7dfc4e2d8d809e49038b3792b7c045429c039e03. rossour

#自动驾驶#人工智能#机器学习
注意力之细粒度图像分类Recurrent-Attention-CNN

循环注意力卷积神经网络(RA-CNN)发布时间:2017年细粒度图像分类概念细粒度图像分类与传统图像分类而言,细粒度图像分类中所需要进行分类的图像中的可判别区域(discriminative parts)往往只是在图像中很小的一块区域内。在传统的图像分类网络中,无论图像中的重要判别区域占整个图像的比重有多大,都只会对整张图片一视同仁的提取特征。因此,在一些判别区域占图像比重较小的一些图片,进行同样

#神经网络#深度学习
CUDA学习之全局内存--part1

文章目录4.1 CUDA内存模型概述执行模型中,核的配置,决定了程序执行效率,但是程序的执行效率不只由线程束,线程块等执行结构决定,内存也严重的影响了性能。4.1 CUDA内存模型概述

CUDA学习之全局内存--part2

文章目录4.3 内存访问模式4.3.1 对齐与合并访问读取粒度为何是32字节访问方式决定读取粒度对齐内存访问与合并内存访问4.3.2 全局内存读取内存加载访问模式1. 缓存加载(启用一级缓存)2. 没有缓存的加载 (禁用一级缓存)3. 非对齐读取示例禁用一级缓存对全局内存加载性能有何影响4. 只读缓存4.3.3 全局内存写入4.3.4 结构体数组与数组结构体AoS示例SoA示例4.3.5 性能调整

深度学习--优化器

深度学习-优化器基本框架非自适应学习率SGDMomentumNesterov自适应学习率AdagradAdadeltaAdamAdamaxNadam小结这里是引用https://blog.csdn.net/u012759136/article/details/52302426/?ops_request_misc=&request_id=&biz_id=102&utm_ter

#深度学习#神经网络
ubuntu20 ros kobuki全纪录

安装ros noetic安装kobuki双目相机建图安装ros noeticsudo sh -c '. /etc/lsb-release && echo "deb http://mirrors.tuna.tsinghua.edu.cn/ros/ubuntu/ $DISTRIB_CODENAME main" > /etc/apt/sources.list.d/ros-lates

#自动驾驶#ubuntu#linux
flash attention1和2

虽然non-matmul FLOPs仅占总FLOPs的一小部分,但它们的执行时间较长,这是因为GPU有专用的矩阵乘法计算单元,其吞吐量高达非矩阵乘法吞吐量的16倍。这个过程使用更多的flop,由于减少HBM访问,重新计算也加快了反向传播的速度。,为了减少对HBM的读写,FlashAttention将参与计算的矩阵进行分块送进SRAM,减少了HBM访存,来提高整体读写速度。,将QK划分成块后,只能计

文章图片
#深度学习#人工智能
3d bounding box 标注工具

3d bounding box 标注工具3d-bat / 257starpoint-cloud-annotation-tool /266starSUSTechPoints /131starLabelHub3d-bat / 257starhttps://github.com/walzimmer/3d-batgithub写明了标注流程方法。支持 PCD 点云渲染和基本立方体标注功能的标注工具.http

#自动驾驶#深度学习#机器学习
    共 27 条
  • 1
  • 2
  • 3
  • 请选择