logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

sqlite编程心得

1. 应用场景SQLite(sqlite3)数据库是个文件,又有数据库操作的接口,所以某些场景用起来特别方便。就我的使用感受, sqlite3特别适合应用于单进程来操作数据,缓存中间数据,并且数据库大小有上限,建议1G之内。在内部,SQLite由以下几个组件组成:内核、SQL编译器、后端以及附件。SQLite通过利用虚拟机和虚拟数据库引擎(VDBE),使调试、修改和扩展SQLi

#sqlite
Docker in Docker(dind) Jenkins实践

Docker in Docker(dind) image用于jenkins做build,在image里面装好第三方,然后jenkins有docker插件如Yet Another Docker Plugin(https://wiki.jenkins.io/display/JENKINS/Yet+Another+Docker+Plugin),管理这些image, 可以在一台机器上起多个docker i

#jenkins
Stanford CoreNLP生成CoNLL数据格式

Stanford CoreNLP + Java 8:https://stanfordnlp.github.io/CoreNLP/index.html斯坦福大学CoreNLP提供了一套人类语言技术工具。它可以给出词的基本形式,词类,是否是公司名称,人名等,规范日期,时间和数量,根据短语和句法依赖标记句子的结构,指出哪些名词短语是指相同的实体,表示情感,提取实体提及的特定或开放的类关系,得到人

解决几乎任何机器学习问题(完整翻译)

解决几乎任何机器学习问题(完整翻译)英文原文:Approaching (Almost) Any Machine Learning ProblemKaggle团队| 07.21.2016Kaggle大师Abhishek Thakur最初在2016年7月18日在这里发表了这篇文章。一个数据科学家每天处理大量的数据。有人说,超过60-70%的时间花在了数据清理,数据转移和

#机器学习#pandas
mysql自动分区自动清理

1. 概述mysql分区表功能特别有用,其中一个应用就是保存固定时间的数据信息,自动分区自动purge,不用担心数据量越积累越多。比较实用的一个实现方式是表一天一个分区,保持固定天数的数据。2. 完整的SQL以数据库log为例,里面有一个表tb_log, 按天分区,始终保存最新的30天的数据。存储过程sp_create_log_partition和sp_drop_log_par

#mysql
perl解析XML的性能比较

perl XML模块perl解析XML实现方式有很多模块。下面总结一些。模块说明XML::Simple用于读写 XML 的普通 API,最好与 XML 格式的配置文件一起使用XML::LibXMLgnome libxml2 库的 Perl 接口,用于高性能的 DOM 处理XML::Parser用于 James Cl

#perl#xml
到底了