logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

主题模型LDA基础及公式推导

1.背景(1)gamma函数产生针对上述问题,欧拉将有限多项式的观察推广到无穷级数欧拉发现了gamma函数性质(2)LDA诞生①blei以PLSA为基础,加上贝叶斯先验,诞生了LDA算法。LDA初始的论文使用变分EM方法训练(Variational Inference)。该方法较为复杂,而且最后训练出的 topic主题非全局最优分布,而是局部最优分布。后期发明了 Collapsed Gibbs S

#机器学习#数据挖掘#自然语言处理 +2
主题模型LDA基础及公式推导

1.背景(1)gamma函数产生针对上述问题,欧拉将有限多项式的观察推广到无穷级数欧拉发现了gamma函数性质(2)LDA诞生①blei以PLSA为基础,加上贝叶斯先验,诞生了LDA算法。LDA初始的论文使用变分EM方法训练(Variational Inference)。该方法较为复杂,而且最后训练出的 topic主题非全局最优分布,而是局部最优分布。后期发明了 Collapsed Gibbs S

#机器学习#数据挖掘#自然语言处理 +2
(1)大数据和应用场景介绍

1.大数据基本特征(1)传统数据与大数据的区别:Volume :从数据量上来说,传统数据规模相对较小,最大维持在GB-TB,而大数据领域中我们需要处理的数据集规模基本都是在TB、乃至PB级别以上;Variety:速度方面,从两个方面来说,第一、从数据的增长速度来说,随着互联网以及物理网的带动,数据量增长非常迅猛;第二、从数据的处理速度上来说,现实场景中我们需要更低延时的高效分析,例如一些秒级别、毫

文章图片
#hadoop#大数据#sql
ensp与虚拟机搭建测试环境

搭建ensp和主机网络互联测试环境,保证可以互相ping通

文章图片
#网络#网络安全
JavaWeb(一)Tomacat环境搭建和Servlet介绍

1.Tomcat结构Web 应⽤服务器:Tomcat、Jboos、Weblogic、Jetty(1)首先在官⽹下载压缩⽂件https://tomcat.apache.org/download-90.cgi(2)然后压缩后可以看到目录结构2.IDE会集成Tomcat(如IDEA)(1)首先创建Java Web工程3.Servlet(1)什么是ServletServlet 是 Java Web 开发的

#java#tomcat#servlet +1
JavaWeb(七)JDBC简介

1.JDBCJava DataBase Connectivity 是⼀个独⽴于特定数据库的管理系统,通⽤的 SQL 数据库存取和操作的公共接⼝。它定义了⼀组标准,为访问不同数据库提供了统⼀的途径。2.JDBC体系(1)JDBC接口包括两个层面⾯向应⽤的 API,供程序员调⽤⾯向数据库的 API,供⼚商开发数据库的驱动程序①JDBC API提供者:Java 官⽅内容:供开发者调⽤的接⼝②Driver

#数据库#java#mysql +1
Calcite原理和代码讲解(一)

1.Calcite介绍(1)简介Apache Calcite 是面向 Hadoop 新的查询引擎,它提供了标准的 SQL 语言、多种查询优化和连接各种数据源的能力。Calcite 的目标是“ one size fits all (一种方案适应所有需求场景)”,希望能为不同计算平台和数据源提供统一的查询引擎,并以类似传统数据库的访问方式(SQL 和高级查询优化)来访问Hadoop 上的数据。Calc

文章图片
#hadoop#sql#spark +1
到底了