
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
color=rgba(0, 0, 0, 0.9)]有一个需求就是有几十上百个发票需要把关键信息:发票号、发票日期、发票金额、名称等信息提取出来,汇总到excel里面。我的需求很简单,就是把pdf里面的发票或指定尺寸的发票图片信息提取出来,自动保存到本地。整体的思路是,通过代码把pdf文件转为标准格式的图片(convert_pdf_to_image方法),然后通过定位关键信息的位置,然后通过dddd

图片通道挑选:由于图片的背景具有一些噪声,因此需要对图片进行适当处理。由于图片是将像素分为红绿蓝三个通道,像素的值以正整数(值在0-255之间,可以简单理解为像素值越大越"亮")的方式进行存储,因此可以将图片的三个通道像素值分别计算平均数,取平均数较小的通道(平均数越小说明越"暗",浅色的噪声就越少)进行处理。图片标注:将图片以图片内容进行命名,方便后续处理。例如:图片内容是6970,则将图片命名

python控制打印机批量打印文件

授人以鱼不如授人以渔,经常看见论坛有人发贴求原创力文档下载,正好最近在学python,就用python写了个原创力文档下载工具。

阿巴阿巴AI”是基于RWKV的本地轻量级聊天AI,无需网络完全本地运行,无需显卡纯CPU也可以运行,也就是说配置低的电脑也可以本地运行聊天AI了。下载的所有文件放在model文件夹内,并修改main.py第12行代码,将’rwkv-4-world-430m’修改为自己下载的模型文件夹。电脑配置高的可以去(https://huggingface.co/RWKV) 下载更大更好的模型,运行效果会更好。
