USST_Coder 个人主页

@yan31415

USST_Coder

2023-05-31 16:35:25 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习面试

BAT机器学习面试1000题系列整理：July、元超、立娜、德伟、贾茹、王剑、AntZ、孟莹等众人。本系列大部分题目来源于公开网络，取之分享，用之分享，且在撰写答案过程中若引用他人解析则必注明原作者及来源链接。另，不少答案得到寒小阳、管博士、张雨石、王赟、褚博士等七月在线名师审校。说明：本系列作为国内首个AI题库，首...

C++性能优化系列——3D高斯核卷积计算(九)3D高斯卷积OpenMP Task优化内存访问

本篇基于 C++性能优化系列——3D高斯核卷积计算(八)3D高斯卷积中的代码实现的计算逻辑，通过OepnMP的Task特性，优化Z维度卷积计算中内存性能瓶颈。（本篇只优化内存访问问题，不保证总执行时间会提升）。代码实现void GaussSmoothCPU3DBase_Task(float* pSrc, int iDim[3], float* pKernel, int kernelSize[3],

二维图像处理中的可分离卷积核

本文参考书籍《Opencv算法精解》，作者：张平可分离卷积核的定义如果一个卷积核至少由两个尺寸比它小的卷积核full卷积而成，并且在计算过程中在所有边界处均进行扩充零的操作，且满足 &n...

root用户 ssh远程登录提示access denied

ssh远程登录提示Access denied，如下图所示：需要修改SSH服务配置文件sshd_config来解决这个问题。文件路径为 /etc/ssh/sshd_config ，默认文件内容如下图：图中红框内容修改为 PermitRootLogin yes，如下图所示：修改好配置文件并保存，service ssh restart 重启SSH服务，ssh可以成功登陆，如下图：...

#ssh #linux

Nsight Compute与nvprof metrics 对照

NVIDIA 计算能力7.5及以上的GPU设备不再支持nvprof工具进行性能剖析，提示使用Nsight Compute作为替代品，如下图所示。Nsight Compute Cli（命令行）剖析的参数与nvprof不一样，当按照nvprof的参数抓取数据时，因为参数不识别，无法抓取希望得到的指标，如下图所示；同时，Nsight Compute Cli参数成千上万，虽然可以将这些参数全部专区，但是会

C++性能优化系列——矩阵转置(八)IPP转置API性能测试

本篇记录Intel 高性能计算函数库IPP中的转置函数ippiTranspose_8u_C1R的执行情况，方便性能优化系列篇中转置实现做性能对比。函数说明解释来自IPP2018发布文档。Intel® Integrated Performance Primitives Developer Reference, Volume 2: Image Processing函数APIIPPAPI(IppStat

到底了