lyg5623 个人主页

@lyg5623

lyg5623

2023-09-08 16:40:46 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

用tensorflow DataSet高效加载变长文本输入

DataSet是tensorflow 1.3版本推出的一个high-level的api，在1.3版本还只是处于测试阶段，1.4版本已经正式推出。在网上搜了一遍，发现关于使用DataSet加载文本的资料比较少，官方举的例子只是csv格式的，要求csv文件中所有样本必须具有相同的维度，也就是padding必须在写入csv文件之前做掉，这会增加文件的大小。经过一番折腾试验，这里给出一个DataSet+T

#tensorflow

tensorflow使用range_input_producer多线程读取数据

先放关键代码：i = tf.train.range_input_producer(NUM_EXPOCHES, num_epochs=1, shuffle=False).dequeue()inputs = tf.slice(array, [i * BATCH_SIZE], [BATCH_SIZE])原理解析：第一行会产生一个队列，队列包含0到NUM_EXPOCHES-1的元素，如果num_

Anaconda安装与使用

linux中python默认的安装路径是需要root权限的，因此如果需要安装新的包也需要root权限，而我们在使用python的时候经常需要安装各种包，每次都找管理员要权限非常麻烦。使用Anaconda就可以避免需要root权限的麻烦，Anaconda相当于把python安装到当前用户home路径下。Anaconda官网下载Anaconda2-4.3.1-Linux-x86_64.sh运行

lightgbm_predict4j：LightGBM在线预测的java实现

LightGBM是微软推出的一款开源boosting工具，现在已经成为各类机器学习竞赛常用的一大利器。不过由于LightGBM是c++编写的，并且其预测功能的主要使用方式是命令行调用处理批量数据，比较难用于在线实时预测。lightgbm_predict4j是针对其预测代码用java重新实现的一个小工具，在用LightGBM离线生成模型之后，可以用lightgbm_predict4j加载模型，然后在

#java

到底了