charling____ 个人主页

@charling____

charling____

2022-11-25 17:34:01 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

python pdf转word的两种方法

第一种方法：多线程处理优点：可以同时处理多个文件，速度非常快。缺点：只能识别文字信息，对于图片等非文本内容无法识别；另外，pdf文档中避免出现 ‘\n’ 等转义字符，否则可能会出现一些识别歧义。使用情景：文件量大，且只对文本信息有要求的情况import osfrom configparser import ConfigParserfrom io import StringIOfrom io imp

#python

python-docx 设置中文字体失败的解决办法

在尝试pdf转word的过程中，需要将从pdf文件中读取到的文本内容写入word文档中，但是自动配置的字体格式往往不太美观，因此需要我们手动设置自己喜欢的字体格式。而文本内容又分为中文跟英文，可以分别设置不同的字体。这是源码：def remove_control_characters(content):mpa = dict.fromkeys(range(32))return content.tra

#python

vscode 连接远程服务器进行python文件 debug（小白版）

所以每次调试一定要有的东西和操作就是：1、（基本）激活虚拟环境＋安装debugpy；2、launch.json文件，并且里面的内容要指定当前文件的根目录；3、启动debugpy调试服务器，命令python -m debugpy --listen 0.0.0.0:5678 --wait-for-client aaa.py；4、选择相应文件进行debug。

#vscode #python #ide

Python pandas将excel的数据按月份分组求平均

先观察一下要处理的数据是怎样的，原始文件是有五组分隔开的数据，第一行是表示组名，第二行是列标签，第三行开始才是真正的数据。很容易就会想到使用pandas来处理这个文件了。首先读取文件并创建一个dataframe对象import pandas as pddf = pd.read_excel('use_nofillvalue(1).xlsx')查看df的内容，可以看到列标签很多都是Unamed，是因为

#python

到底了