logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《大数据之路-阿里巴巴大数据实践》读书笔记

ps:这本书主讲阿里的大数据体系架构方案,从底层到高层阐述,目前对我来说此书的难度较大,不是很懂,大部分为对原书的引用归纳总结,我会给出相应的大牛的关于此书的读书笔记的传送门供参考。以下为大牛关于本书的读书笔记供参考:读书笔记传送门https://www.jianshu.com/p/69dbf35713ad此书下载传送门http://www.java1234.com/a/javabook/yun/

随机森林的优缺点

随机森林是一个用随机方式建立的,包含多个决策树的分类器。其输出的类别是由各个树输出的类别的众数而定。随机性主要体现在两个方面:(1)训练每棵树时,从全部训练样本(样本数为N)中选取一个可能有重复的大小同样为N的数据集进行训练(即bootstrap取样);(2)在每个节点,随机选取所有特征的一个子集,用来计算最佳分割方式。优点1、 在当前的很多数据集上,相对其他算法有着很大的...

抽取式文本摘要实现

1、介绍     1、本文自动文本摘要实现的依据就是词频统计     2、文章是由句子组成的,文章的信息都包含在句子中,有些句子包含的信息多,有些句子包含的信息少。     3、句子的信息量用"关键词"来衡量。如果包含的关键词越多,就说明这个句子越重要。     4、"自动摘要"就是要找出那些包含信息最多的句子,也就是包含关键字最多的句子     5、而通过统计句子中关键...

tf.summary.scalar()和tf.summary.histogram

用法:1、tf.summary.scalar用来显示标量信息,其格式为:tf.summary.scalar(tags, values, collections=None, name=None)例如:tf.summary.scalar('mean', mean)一般在画loss,accuary时会用到这个函数。2、tf.summar...

nltk.sent_tokenize() nltk.word_tokenize()利用分句子,分词,

分词nltk.sent_tokenize(text) #按句子分割nltk.word_tokenize(sentence) #分词nltk的分词是句子级别的,所以对于一篇文档首先要将文章按句子进行分割,然后句子进行分词:http://www.pythontip.com/blog/post/10012/...

python查看数据维度,查看数据类型type,dtype查看数据类型,ndim查看维度,

查看数据类型type,dtype查看数据类型,ndim查看维度type(X_train)X_train.dtype)X_train.ndim查看维度:print(X_train.shape)还可以用:print(np.shape(X_test))实际上都是利用了Numpy...

xgboost的原理,损失函数,优化,

不经感叹大佬真多,本文转自https://www.jianshu.com/p/7467e616f227xgboostd多颗树的损失子树cart树,并且叶子节点为分数,不是类别,所有多棵树损失和容易优化,速度快分步提升,先优化一棵树,后面逐渐加入子树损失f,逐步优化目录2、xgboost3、训练xgboost4、加法训练5、模型正则化项6、见证奇迹的时刻...

语言模型,word2vec,Negative Sample(负采样) Hierarchical Softmax(层次softmax)

目录1.语言模型:2.最早的语言模型的问题:3.N-gram(统计词频)4.词向量(利用神经网络)4.1word2vec4.2、两种训练模式4.3、两种加速方法refrence:1.语言模型:更多语言模型参考https://www.cnblogs.com/rucwxb/p/10277217.html,(ELMo,BERT)2.最早的语言模型的...

tensorflow交叉熵损失函数

目录1.四个交叉熵函数2.具体tensorflow中实现2.1.softmax_cross_entropy_with_logits2.2.sigmoid_cross_entropy_with_logits2.3. sparse_softmax_cross_entropy_with_logits2.4. weighted_cross_entropy_with_lo...

keras序列化模型 to json文件,保存模型和加载模型

此处为to json格式,后续发to YAML格式首先保存模型结构,模型参数数据#!/usr/bin/env python# -*- coding:utf-8 -*-# Author: Jia ShiLin'''#模型的权重保存在HDF5中#模型的结构保存在JSON文件或者YAML文件中''''''#Keras提供了to_json()生成模型JSON描述,并将...

    共 53 条
  • 1
  • 2
  • 3
  • 6
  • 请选择