logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

两种方法去除页眉页脚:基于OCR识别后的文本/基于图片切割

两种方法去除页眉页脚前言1.基于转换为图片后的页眉页脚高度定位识别切割2.基于OCR识别后的文本去除前言如何去掉PDF或者WORD的页眉或者页脚?由于需求涉及文本比对,页眉页脚会影响比对准确率,当前试过两种可以有效去除页眉页脚的方法,供大家参考思路和方法。1.基于转换为图片后的页眉页脚高度定位识别切割核心思路:首先将文档每一页转为图片,基于opencv的方法将图片二值化(即能分开空白区域和黑色文字

#python
【Kaggle】【机器学习项目】【决策树与随机森林】机器学习入门之机器学习模型训练验证基本步骤

机器学习小白总结笔记Kaggle入门机器学习题目链接:https://www.kaggle.com/learn/intro-to-machine-learning最基本的应用流程:1.提取X,y数据y其实就是想预测的特征(比如房价),X就是其他的你认为对预测y最有用的特征(比如面积,窗户数,厕所数等)2.train_test_split将数据集划分成训练集train_X,train_y和测试(验证

#机器学习
【Kaggle】【机器学习项目】【决策树与随机森林】机器学习入门之机器学习模型训练验证基本步骤

机器学习小白总结笔记Kaggle入门机器学习题目链接:https://www.kaggle.com/learn/intro-to-machine-learning最基本的应用流程:1.提取X,y数据y其实就是想预测的特征(比如房价),X就是其他的你认为对预测y最有用的特征(比如面积,窗户数,厕所数等)2.train_test_split将数据集划分成训练集train_X,train_y和测试(验证

#机器学习
【已解决】Chrome 出现Your Connection is not private 问题

【已解决】Chrome 出现Your Connection is not private 问题鼠标点击聚焦错误页面上,键盘依次按下 thisisunsafe 即可ps: 可以输入 badidea 或者 thisisunsafe 忽略错误,就是在 Chrome 的错误页面,点页面空白处一下让键盘焦点处于页面内,然后依次按下 thisisunsafe,(没错就像GTA输秘籍一样)页面就会自动刷新了。.

#chrome
14 Iterator迭代器(行为模式)

14 Iterator(行为模式)  提供按顺序访问聚合对象的元素的方法,而不公开其底层表示形式。也称为cursor动机聚合对象(如列表)应该提供一种访问其元素而不公开其内部结构的方法。迭代器模式的关键思想是负责访问和遍历列表对象,并将其放入迭代器对象中。将遍历机制与List对象允许我们为不同的遍历策略定义迭代器,而无需在List接口中枚举它们。...

Windows和Linux平台上实现Word转PDF

Windows和Linux平台上实现Word转PDF前言Windows平台Word转PDFLinux平台Word转PDF参考文献前言调研后发现网上有很多解决办法,Windows平台上word和PDF可以完美的转换,但大部分业务是要求在Linux上运行的,基于Windows的方法无法移植到Linux上运行,现有的Linux上的Word文档转换为PDF的方法验证后大多数存在PDF和Word格式不一致的

#linux
补充内容-小白实现博客《这一篇就够了 python语音识别指南终极版》

利用下面的博客教程实现语音识别:《这一篇就够了 python语音识别指南终极版》链接:https://blog.csdn.net/j2IaYU7Y/article/details/79878310首先感谢这篇文章

#语音识别#python
到底了