简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
DataSet是tensorflow 1.3版本推出的一个high-level的api,在1.3版本还只是处于测试阶段,1.4版本已经正式推出。在网上搜了一遍,发现关于使用DataSet加载文本的资料比较少,官方举的例子只是csv格式的,要求csv文件中所有样本必须具有相同的维度,也就是padding必须在写入csv文件之前做掉,这会增加文件的大小。经过一番折腾试验,这里给出一个DataSet+T
先放关键代码:i = tf.train.range_input_producer(NUM_EXPOCHES, num_epochs=1, shuffle=False).dequeue()inputs = tf.slice(array, [i * BATCH_SIZE], [BATCH_SIZE])原理解析:第一行会产生一个队列,队列包含0到NUM_EXPOCHES-1的元素,如果num_
linux中python默认的安装路径是需要root权限的,因此如果需要安装新的包也需要root权限,而我们在使用python的时候经常需要安装各种包,每次都找管理员要权限非常麻烦。使用Anaconda就可以避免需要root权限的麻烦,Anaconda相当于把python安装到当前用户home路径下。Anaconda官网下载Anaconda2-4.3.1-Linux-x86_64.sh运行
LightGBM是微软推出的一款开源boosting工具,现在已经成为各类机器学习竞赛常用的一大利器。不过由于LightGBM是c++编写的,并且其预测功能的主要使用方式是命令行调用处理批量数据,比较难用于在线实时预测。lightgbm_predict4j是针对其预测代码用java重新实现的一个小工具,在用LightGBM离线生成模型之后,可以用lightgbm_predict4j加载模型,然后在