贾世林jiashilin 个人主页

@qq_35290785

贾世林jiashilin

2022-12-02 13:10:20 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

《大数据之路-阿里巴巴大数据实践》读书笔记

ps：这本书主讲阿里的大数据体系架构方案，从底层到高层阐述，目前对我来说此书的难度较大，不是很懂，大部分为对原书的引用归纳总结，我会给出相应的大牛的关于此书的读书笔记的传送门供参考。以下为大牛关于本书的读书笔记供参考：读书笔记传送门https://www.jianshu.com/p/69dbf35713ad此书下载传送门http://www.java1234.com/a/javabook/yun/

随机森林的优缺点

随机森林是一个用随机方式建立的，包含多个决策树的分类器。其输出的类别是由各个树输出的类别的众数而定。随机性主要体现在两个方面：（1）训练每棵树时，从全部训练样本（样本数为N）中选取一个可能有重复的大小同样为N的数据集进行训练（即bootstrap取样）；（2）在每个节点，随机选取所有特征的一个子集，用来计算最佳分割方式。优点1、在当前的很多数据集上，相对其他算法有着很大的...

抽取式文本摘要实现

1、介绍　　　　　1、本文自动文本摘要实现的依据就是词频统计　　　　　2、文章是由句子组成的，文章的信息都包含在句子中，有些句子包含的信息多，有些句子包含的信息少。　　　　　3、句子的信息量用"关键词"来衡量。如果包含的关键词越多，就说明这个句子越重要。　　　　　4、"自动摘要"就是要找出那些包含信息最多的句子，也就是包含关键字最多的句子　　　　　5、而通过统计句子中关键...

tf.summary.scalar()和tf.summary.histogram

用法:1、tf.summary.scalar用来显示标量信息，其格式为：tf.summary.scalar(tags, values, collections=None, name=None)例如：tf.summary.scalar('mean', mean)一般在画loss,accuary时会用到这个函数。2、tf.summar...

nltk.sent_tokenize() nltk.word_tokenize()利用分句子，分词，

分词nltk.sent_tokenize(text) #按句子分割nltk.word_tokenize(sentence) #分词nltk的分词是句子级别的，所以对于一篇文档首先要将文章按句子进行分割，然后句子进行分词：http://www.pythontip.com/blog/post/10012/...

python查看数据维度，查看数据类型type，dtype查看数据类型，ndim查看维度，

查看数据类型type，dtype查看数据类型，ndim查看维度type(X_train)X_train.dtype)X_train.ndim查看维度：print(X_train.shape)还可以用：print(np.shape(X_test))实际上都是利用了Numpy...

xgboost的原理，损失函数，优化，

不经感叹大佬真多，本文转自https://www.jianshu.com/p/7467e616f227xgboostd多颗树的损失子树cart树，并且叶子节点为分数，不是类别，所有多棵树损失和容易优化，速度快分步提升，先优化一棵树，后面逐渐加入子树损失f,逐步优化目录2、xgboost3、训练xgboost4、加法训练5、模型正则化项6、见证奇迹的时刻...

语言模型,word2vec,Negative Sample(负采样) Hierarchical Softmax(层次softmax)

目录1.语言模型:2.最早的语言模型的问题:3.N-gram(统计词频)4.词向量(利用神经网络)4.1word2vec4.2、两种训练模式4.3、两种加速方法refrence:1.语言模型:更多语言模型参考https://www.cnblogs.com/rucwxb/p/10277217.html,(ELMo,BERT)2.最早的语言模型的...

455. 分发饼干python

#!/usr/bin/env python# -*- coding:utf-8 -*-# Author: Jia ShiLindef findContentChildren(g, s):count = 0g.sort()s.sort()t=0for i in range(len(s)):for j in range(t...

Keras中的序贯模型

#!/usr/bin/env python# -*- coding:utf-8 -*-# Author: Jia ShiLin'''徐贯模型把网络表示层网络层的管道或列表，'''from keras import Model, Inputfrom keras.layers import TimeDistributedfrom keras.models importSeque...

共 49 条

请选择