logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ansj分词方式详细解析

ToAnalysis 精准分词精准分词是Ansj分词的店长推荐款它在易用性,稳定性.准确性.以及分词效率上.都取得了一个不错的平衡.如果你初次尝试Ansj如果你想开箱即用.那么就用这个分词方式是不会错的.DicAnalysis用户自定义词典优先策略的分词用户自定义词典优先策略的分词,如果你的用户自定义词典足够好,或者你的需求对用户自定义词典的要求比较高,那么强烈建

pytorch练习(1)

import torchimport torch.nn as nnimport torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super(Net, self).__init__()# 1 input image channel, 6 output channels, 5x5 square convolution# k

#pytorch#深度学习#机器学习
cv2 和 freetype 安装

cv2 安装pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simpleopencv-python 指定清华的源速度快freetype 安装pipinstallfreetype-py注意带个py后缀FreeType库是一个完全免费(开源)的、高质量的且可移植的字体引擎,它提供统一的接口来访问多种字体格式文件,包括TrueType,OpenType, Ty

#深度学习#python#opencv
2万汉字编码大全

一,一,4e00丁,丁,4e01丂,丂,4e02七,七,4e03丄,丄,4e04丅,丅,4e05丆,丆,4e06万,万,4e07丈,丈,4e08三,三,4e09上,上,4e0a下,下,4e0b丌,丌,4e0c不,不,4e0d与,与,4e0e丏,丏,4e0f丐,丐,4e10丑,丑,4e11丒,丒,4e12专,专,4e13

文本标签提取算法

目前想到方法1,现有分词系统提出关键词,比如ansj,hannlp,word等2,基于tfidf 算权重3,基于textrank算法,部分分词系统采取textrank 算法4,基于语言模型,ngram 算下热度5,基于聚类打标签,比如基于lda6,基于语义和知识库知识对于内容分析 总结当前主要任务是段文本如何打标签准备,还需要很多实验要验证效果

linux 下Unable to load library 'tesseract': Native library (linux-x86-64/libtesseract.so

inux上部署tess4j项目在windows上项目是可以正常运行的,部署到Linux上后,运行报异常,异常内容为:Unable to load library 'tesseract': Native library (linux-x86-64/libtesseract)这个报错的原因就是项目无法加载库资源文件 libtesseract(在linux上是.so文件,windows是.dll文件)解

医疗AI实践与思考汇总

深度学习技术在许多医学问题上取得成功:医学图像分类和分割:CNN文本中信息抽取、疾病预测:CNN、RNN、transformer病患语音识别和机器翻译:RNN、Seq2Seq体征检测和疾病风险评估:RNN、MLP、transformer新药研发:GCN手术智能辅助诊疗(电子病历/文献分析)人工智能利用机器学习和自然语言处理技术自动抓取病历中的临床变量,智能化融汇多元异构的医疗数据,结构化病历、文献

#人工智能#transformer#深度学习
pandas 选取指定列

1,按照位置:import pandas as pddata = pd.read_csv()data = data.iloc[:, 0:3] # 按位置取某几列2,按照指定列名:import pandas as pddf=pd.read_excel("职位明细329.xlsx")df1 = df[['用户ID','职位ID']]

#python
到底了