logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Facebook ATC弱网环境搭建

本文记录如何利用facebook ATC使用搭建一个弱网环境,与前一篇Dash net(网速控制,可变)类似,但是这个弱网环境不能动态变化,相比DASH_NET好处在可以连接多个设备,分别控制网速工具简介ATC是FaceBook开源的移动网络测试工具Augmented Traffic Control(ATC),能够方便的让我们模拟各种网络环境进行测试。ATC有两个最吸引人的特点:...

CenterNet: Keypoint Triplets for Object Detection论文详解

《CenterNet: Keypoint Triplets for Object Detection》发表于CVPR2019代码地址:https://github.com/Duankaiwen/CenterNet它是之前一篇《CornerNet: Detecting Objects as Paired Keypoints》文章的改进版,与CornerNet相同的是它们都是one-stage的方..

#机器学习
git merge 与 git rebase的区别

前言其实这个问题困扰我有一段时间,相信也有人和我一样有这个困扰,网上已有很多这种解释了,但是要么就是无图,要么就是解释的很乱,没太看懂,经过自己对git的使用,加上向同事请教,算是理解了这个问题,所以写下来分享一下,我尽量详细说明merge与rebase的区别假设我们有如下图一所示仓库,该仓库有master和develop两个分支,且develop是在(3.added merge.tx

#git
100行代码实现最简单的基于FFMPEG+SDL的视频播放器(SDL1.x)

最近发现雷博的文章有写打不开了,但是他的文章真的很受用,所以转载一下,一是方便自己学习,二是方便大家共享简介FFMPEG工程浩大,可以参考的书籍又不是很多,因此很多刚学习FFMPEG的人常常感觉到无从下手。我刚接触FFMPEG的时候也感觉不知从何学起。因此我把自己做项目过程中实现的一个非常简单的视频播放器(大约100行代码)源代码传上来,以作备忘,同时方便新手学习FFMPEG。该播放器虽然简

《X3D: Expanding Architectures for Efficient Video Recognition》论文详解

论文地址:https://arxiv.org/abs/2004.04730代码地址:https://github.com/facebookresearch/SlowFast该篇文章也是Facebook的作品,为什么说也,因为它是slowfast之后出的,而且可以理解为是slowfast思路上的改进版本,代码仓库和slowfast是一个仓库。文章说它的启发来自于之前2D高效网络,将扩展(expand

PixelLink: Detecting Scene Text via Instance Segmentation算法详解

PixelLink: Detecting Scene Text via Instance Segmentation,该文章发表在AAAI2018上,代码地址:https://github.com/ZJULearning/pixel_link该篇文章灵感来自于图像分割算法和之前CVPR2017的SegLink,看过SegLink和EAST这两篇文章的话,这篇文章其实很容易理解。在介绍文章思想之前..

Record something about DL

这篇文章算是DL实践杂谈吧,主要是想把自己模型调优和复现算法遇到的一些坑总结一下(里面的一行字可能是我当时花费了一周甚至更长时间得到的总结),希望能对读者有所帮助。一、熟悉数据模型是数据的浓缩版----Andrew NG的二八定律,即80%的数据+20%的=更好的AI​对于新上手的一任务来说,需要熟悉你的数据。拿检测任务来说,可以写个可视化代码查看标注是否合理,查看一下待检测物体的大小分布情况(例

#算法#机器学习#人工智能
CTC算法详解

和其它文章初衷一样,网上解释很多,还有原文,但是讲的不是很明白,在看完几篇参考博客后特此记录简介先拿语音识别任务来说,如果现在有一个包含剪辑语音和对应的文本,我们不知道如何将语音片段与文本进行对应,这样对于训练一个语音识别器增加了难度。为了解决上述问题,我们可以先制定一个规则,例如“一个字符对于是个语言片段输入”。对于不同的人来说,他们说话的语速也不一样,这样导致了上述的定义规则不可行。另一...

#机器学习
OCR EAST: An Efficient and Accurate Scene Text Detector 自然场景下的文字识别算法详解

最近研究OCR,有篇比较好的算法文章引起我的注意,《EAST: An Efficient and Accurate Scene Text Detector》,该文发表在2017年CVPR上。代码地址:https://github.com/argman/EAST,这是原作者参与的一份tensorflow版本代码,网上还有其他的实现。下面根据原文的结构和上述提供的代码详细的解读一下该算法一、网络架..

#机器学习
音频变时不变调处理(SoundTouch WSOLA)

现在已有一些博客写这相关的内容,但是真的写的看完和没看一样,我最近也研究了一下相关内容,为自己记个笔记,同时也分享出来,和大家一起讨论变时不变调时音频处理里的一个小方向,但又没那么简单,算法有很多,我就以soundtouch库为例来展开聊一下。soundtouch是一个音频处理开源库,其官网(http://soundtouch.surina.net),该库支持在windows、GNU、a...

    共 15 条
  • 1
  • 2
  • 请选择