logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

用tensorflow DataSet高效加载变长文本输入

DataSet是tensorflow 1.3版本推出的一个high-level的api,在1.3版本还只是处于测试阶段,1.4版本已经正式推出。在网上搜了一遍,发现关于使用DataSet加载文本的资料比较少,官方举的例子只是csv格式的,要求csv文件中所有样本必须具有相同的维度,也就是padding必须在写入csv文件之前做掉,这会增加文件的大小。经过一番折腾试验,这里给出一个DataSet+T

#tensorflow
tensorflow使用range_input_producer多线程读取数据

先放关键代码:i = tf.train.range_input_producer(NUM_EXPOCHES, num_epochs=1, shuffle=False).dequeue()inputs = tf.slice(array, [i * BATCH_SIZE], [BATCH_SIZE])原理解析:第一行会产生一个队列,队列包含0到NUM_EXPOCHES-1的元素,如果num_

Anaconda安装与使用

linux中python默认的安装路径是需要root权限的,因此如果需要安装新的包也需要root权限,而我们在使用python的时候经常需要安装各种包,每次都找管理员要权限非常麻烦。使用Anaconda就可以避免需要root权限的麻烦,Anaconda相当于把python安装到当前用户home路径下。Anaconda官网下载Anaconda2-4.3.1-Linux-x86_64.sh运行

lightgbm_predict4j:LightGBM在线预测的java实现

LightGBM是微软推出的一款开源boosting工具,现在已经成为各类机器学习竞赛常用的一大利器。不过由于LightGBM是c++编写的,并且其预测功能的主要使用方式是命令行调用处理批量数据,比较难用于在线实时预测。lightgbm_predict4j是针对其预测代码用java重新实现的一个小工具,在用LightGBM离线生成模型之后,可以用lightgbm_predict4j加载模型,然后在

#java
到底了