
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
最近需要开发一个爬虫工具,使用的是selenium做的。最终需要打包成exe。打包的过程是非常痛苦的,因为你不知道什么时候会出现什么样不同的错误或警告。这不,一个DNS的警告直接给我干蒙了,我寻思我selenium的爬虫跟DNS有什么关系啊。反正就莫名其妙,但是呢你得解决,虽然不影响使用,但是输出的警告混杂日志输出,难免有那么一些不好看,而且后期排查错误也不好排查。

下载腾讯的词向量、停用词、代码部分代码思想、输出结果。句子相似检索,faiss检索。Python简单使用faiss检索相关向量。词转向量。word2vec
Fatal Python error: init_fs_encoding: failed to get the Python codec of the filesystem encodingPython runtime state: core initializedModuleNotFoundError: No module named 'encodings'Current thread 0x00
关键字提取简单来说关键字提取就是从一段文本中将最能体现总体思想的词或句抽取出来。关键字可以帮助我们快速了解文本想要表达的内容,尤其是在很长的文献、作文、专利等篇幅巨大、内容居多的场景中可以发挥出不错的效果。关键词的提取具有如下方法:TF-IDF、TextRank、jieba、pyhanlp关于jieba和pyhanlp分词的实现可以看这篇博客:知识图谱 — jieba、pyhanlp、smoot
paddleocrocr百度飞桨模型训练ocr训练rec识别模型训练
paddleocrocr百度飞桨模型训练ocr训练rec识别模型训练
这篇文章主要写如何使用Python对apache-jena进行交互查询。具体三元组数据建立、转换、导入内容请看:知识问答三元组数据准备阶段。本文在知识问答三元组数据准备阶段的基础上,接着往下写。注:本文案例代码使用https://github.com/zhangtao-seu/Jay_KG中的代码定义实体
python搭建web服务。flask库的使用
Python读取word文档 moduleNotFoundError:No module named 'exceptions'
如果上面语句没有解决,可以看下yarm配置,考虑是否是语句占用内存超过配置最大内存等等。大概率是因为没有开启允许动态分区或单次动态分区个数太小了。