
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
python关于正则表达处理数据提高运行效率
最近开发了一个工具,读取900M甚至更大的文本,文本的每一行都要进行正则表达式的判断和处理,刚开始的时候,运行工具,发现处理数据非常慢,甚至要半个钟到一个钟才能遍历完所有数据,速度慢的难以接受,然后我开始进行排查到底是什么地方占用的时间长,再进行优化,我发现有两行代码的时间有明显的时间占用,这两行也就是匹配正则表达式而已,呃呃呃,这个要怎么搞???查了半天,看的云里雾里,貌似很复杂的样子,弄了..
Python各种包下载路径:https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud
https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud
stepup.py 打包
#! /usr/bin/env python# -*- coding: utf-8 -*-from cx_Freeze import setup, Executableimport sys#base = 'Console'# base = 'ConsoleKeepPath'base = "Win32GUI"# base = 'Win32Service'executables .
python中使用subprocess.Popen中的返回值总结:
#!/usr/bin/python# -*- coding: UTF-8 -*-import sysimport subprocessimport traceback#author by zhangheng#timestamp 2018/06/08#gennlife hive script datagroup# 打开文件try: fo = open("zhangh...
到底了







