
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文基于yolo的稳定版本v5进行实验,完成了滑动验证码空缺位置的识别任务,在少量的数据集上取得了比较不错的效果。本文不涉及算法原理讲解,仅侧重于实践应用。

本文使用了纯数学计算的方法计算识别了轨迹中的弯道位置,整体思路较为简单,不过最终效果十分可观,本算法已经在百万级用户的平台稳定运行,在实现过程中对GPS漂移、连续弯道、回旋弯道进行了处理。不过弯道数据仅供页面展示,不能用于准确判断。经过上文的算法,我们可以通过GPS坐标信息计算地理平面上的弯道数据,对于弯道的定义是三点的夹角值满足范围即可。整体思路简单,实现难度低,不依赖其它库,对一些基本的异常进

由于业务的增长,传统的基于磁盘的文件存储需要迁移到阿里云OSS对象存储中。我们的业务主要是涉及GPS轨迹小文件,大致有1TB,文件数量5千万。在使用阿里云ossimport工具的过程中有些基本概念不明确,导致了一些操作失误,特写下本文记录实战过程中的一些问题。

Ocr文字识别其中的一大关键就是两张图片相似与否的判断,所以我们希望寻找一种或多种算法来计算图片的相似度。本文将对于项目中使用的比对算法进行介绍,并将其联合运用进行初步文字识别。算法清单 像素点对比重心对比投影对比分块对比前提知识 计算机处理图片并不像人这样可以直观的理解处理,在计算机中的图像可以看成一个矩阵,矩阵中的元素是一个颜色值,这...
最新原创改造OpenVoice,实现实时音频克隆,实时变声器。本文基于官方示例改造,实现了实时采集麦克风音频进行语音克隆的功能。在阅读项目论文理论后,少量修改了官方源码,取得了不错的实测效果。

项目需要在Gateway中获取请求参数,原生提供了request.getQueryParams()方法获取请求参数,但是只能获得url上的param,对于form body中的参数获取不到。找了很多方法,网上普遍都是通过自定义Filter缓存Body中的内容,然后再获取缓存的Body,此处的缓存实现方法各异,有些还存在内存泄漏问题。本文使用官方自带的缓存过滤器实现,然后整合url参数和body参数
Github目前最火的点赞超10k的OpenVoice音频克隆项目部署入门。本文介绍了OpenVoice的基本概念,并描述了本地部署OpenVoice的步骤与一些常见错误。将可能用到的资源重新上传,方便无法过墙的伙伴。OpenVoice是一种多功能的即时声音克隆方法,它只需要参考发言者的一小段音频片段,就可以复制他们的声音并用多种语言生成语音。快来成为第一波吃螃蟹的人吧!!!

Springboot默认支持一路redis,项目中有需求用到redis多数据源。本文仅基于Springboot进行多数据源配置,不依赖其它JAR包支持,理论可配置无限多的redis连接。