logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用python,生成符合zipf分布的数据集

  zipf分布:(齐夫定律)可以表述为:在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。所以,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,而出现频率第二位的单词则是出现频率第四位的单词的2倍。这个定律被作为任何与幂定律概率分布有关的事物的参考。遵循该定律的现象:   1.单词出现的频率   2.网页访问的概率其公式为:P(r) = C /...

#python
LinnOS: Predictability on Unpredictable Flash Storage with a Light Neural Network文章解读

背景现有SSD特点优点:读/写速度越来越快缺点:内部的逻辑越发复杂,导致延迟高。(GC、buffer flush、wearing leveling、read repair等导致了延迟高,都是FTL的一些模块)三种处理SSD不可预测性延迟的方法白盒方法:重构device内部代码。结果:不能掩饰SSD的不可预测性。影响:很难修改底层,同时开销很大(除非供应商支持这种操作)。灰盒方法:将部分设备级别的修

#机器学习
Divide and Conquer题解

第一题You are interested in analyzing some hard-to-obtain data from two separate databases. Each database contains n numerical values, so there are 2n values total and you may assume that no two values..

YCSB workload工作负载参数设置

YCSB作为一个工作负载测试工具,参数设置很重要,通过设置不同的read,update或者是insert比例得到的测试时间是不同的。主要是通过以下命令来加载workloada工作负载文件测试具体数据库性能:bin/ycsb load DBname -s -P workloads/workloada下面我提下YCSB工作负载参数具体的设置和说明,这里是(YCSB/workloads/w...

centos libvirtd升级的两种方法

linux系统突然宕机,找不到原因。于是查看/var/log/messages里面记录的系统log发现以下错误,虽然可能不是宕机的原因但是还是需要解决的:Failed to start Virtualization daemon.localhost systemd: Unit libvirtd.service entered failed state.localhost systemd:...

paddlepaddle报错解决

1.如果出现ImportError: No module named IPython报错。解决方式:pip3 install ipython2.如果paddle的site-packages\paddle\utils\plot.py文件报错,出现NameError: name 'basestring' is not defined主要是因为使用的是python3,但是basestring只...

#paddle
到底了