logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

selenium运行出现DNS警告:Faild to read DnsConfig.

最近需要开发一个爬虫工具,使用的是selenium做的。最终需要打包成exe。打包的过程是非常痛苦的,因为你不知道什么时候会出现什么样不同的错误或警告。这不,一个DNS的警告直接给我干蒙了,我寻思我selenium的爬虫跟DNS有什么关系啊。反正就莫名其妙,但是呢你得解决,虽然不影响使用,但是输出的警告混杂日志输出,难免有那么一些不好看,而且后期排查错误也不好排查。

文章图片
#python#爬虫#selenium
对句子分词,找到对应词的腾讯词向量模型并使用Python进行faiss检索

下载腾讯的词向量、停用词、代码部分代码思想、输出结果。句子相似检索,faiss检索。Python简单使用faiss检索相关向量。词转向量。word2vec

#python#全文检索
linux离线移植python环境,启动报错(ModuleNotFoundError: No module named ‘encodings‘;<no Python frame>)

Fatal Python error: init_fs_encoding: failed to get the Python codec of the filesystem encodingPython runtime state: core initializedModuleNotFoundError: No module named 'encodings'Current thread 0x00

#linux#python
使用jieba、pyhanlp工具实现关键字词句的提取

​关键字提取简单来说关键字提取就是从一段文本中将最能体现总体思想的词或句抽取出来。关键字可以帮助我们快速了解文本想要表达的内容,尤其是在很长的文献、作文、专利等篇幅巨大、内容居多的场景中可以发挥出不错的效果。关键词的提取具有如下方法:TF-IDF、TextRank、jieba、pyhanlp关于jieba和pyhanlp分词的实现可以看这篇博客:知识图谱 — jieba、pyhanlp、smoot

#python#知识图谱#自然语言处理
百度飞桨paddleocr训练rec模型记录

paddleocrocr百度飞桨模型训练ocr训练rec识别模型训练

#python
百度飞桨paddleocr训练rec模型记录

paddleocrocr百度飞桨模型训练ocr训练rec识别模型训练

#python
基于apache-jena的知识问答

​这篇文章主要写如何使用Python对apache-jena进行交互查询。具体三元组数据建立、转换、导入内容请看:知识问答三元组数据准备阶段。本文在知识问答三元组数据准备阶段的基础上,接着往下写。注:本文案例代码使用https://github.com/zhangtao-seu/Jay_KG中的代码定义实体​

#python#知识图谱
python使用flask搭建web服务

python搭建web服务。flask库的使用

#python#flask
Python读取word文档,No module named ‘exceptions‘报错解决

Python读取word文档 moduleNotFoundError:No module named 'exceptions'

#python
hive插入动态分区数据时,return code 2报错解决

如果上面语句没有解决,可以看下yarm配置,考虑是否是语句占用内存超过配置最大内存等等。大概率是因为没有开启允许动态分区或单次动态分区个数太小了。

#hive#数据仓库#sql
    共 38 条
  • 1
  • 2
  • 3
  • 4
  • 请选择