logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

主题模型LDA基础及公式推导

1.背景(1)gamma函数产生针对上述问题,欧拉将有限多项式的观察推广到无穷级数欧拉发现了gamma函数性质(2)LDA诞生①blei以PLSA为基础,加上贝叶斯先验,诞生了LDA算法。LDA初始的论文使用变分EM方法训练(Variational Inference)。该方法较为复杂,而且最后训练出的 topic主题非全局最优分布,而是局部最优分布。后期发明了 Collapsed Gibbs S

#机器学习#数据挖掘#自然语言处理 +2
主题模型LDA基础及公式推导

1.背景(1)gamma函数产生针对上述问题,欧拉将有限多项式的观察推广到无穷级数欧拉发现了gamma函数性质(2)LDA诞生①blei以PLSA为基础,加上贝叶斯先验,诞生了LDA算法。LDA初始的论文使用变分EM方法训练(Variational Inference)。该方法较为复杂,而且最后训练出的 topic主题非全局最优分布,而是局部最优分布。后期发明了 Collapsed Gibbs S

#机器学习#数据挖掘#自然语言处理 +2
(1)大数据和应用场景介绍

1.大数据基本特征(1)传统数据与大数据的区别:Volume :从数据量上来说,传统数据规模相对较小,最大维持在GB-TB,而大数据领域中我们需要处理的数据集规模基本都是在TB、乃至PB级别以上;Variety:速度方面,从两个方面来说,第一、从数据的增长速度来说,随着互联网以及物理网的带动,数据量增长非常迅猛;第二、从数据的处理速度上来说,现实场景中我们需要更低延时的高效分析,例如一些秒级别、毫

文章图片
#hadoop#大数据#sql
ensp与虚拟机搭建测试环境

搭建ensp和主机网络互联测试环境,保证可以互相ping通

文章图片
#网络#网络安全
(3)Kafka消费者工作机制详解

1.消费方式(pull vs push)传统Push模式虽然实时性高,但是容易造成consumer来不及处理消息,导致拒绝服务及网络拥塞。consumer采用pull(拉)模式从broker读取数据,这样可以控制消费速度。pull缺点:如果kafka没有数据,消费者可能会限于获取空数据的循环中。因此可以设置timeout参数,如果没有数据可供消费,consumer会等待一段时间再返回拿。2.消费时

文章图片
#kafka#分布式#中间件
(5)Kafka原理和高可用介绍

1.Kafka介绍(1)基本概念Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者的所有动作流数据。 这种动作如:活动数据:网站用户行为数据,例如PV(页面浏览量),UV(用户访问量)运营数据: 监控系统性能指标(cpu利用率、负载,内存使用率,磁盘利用率,IO性能)这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决,特性如下:海量数据不可变实时处理对于像Hadoop的一

文章图片
#kafka#big data#hadoop
JavaWeb(一)Tomacat环境搭建和Servlet介绍

1.Tomcat结构Web 应⽤服务器:Tomcat、Jboos、Weblogic、Jetty(1)首先在官⽹下载压缩⽂件https://tomcat.apache.org/download-90.cgi(2)然后压缩后可以看到目录结构2.IDE会集成Tomcat(如IDEA)(1)首先创建Java Web工程3.Servlet(1)什么是ServletServlet 是 Java Web 开发的

#java#tomcat#servlet +1
JavaWeb(七)JDBC简介

1.JDBCJava DataBase Connectivity 是⼀个独⽴于特定数据库的管理系统,通⽤的 SQL 数据库存取和操作的公共接⼝。它定义了⼀组标准,为访问不同数据库提供了统⼀的途径。2.JDBC体系(1)JDBC接口包括两个层面⾯向应⽤的 API,供程序员调⽤⾯向数据库的 API,供⼚商开发数据库的驱动程序①JDBC API提供者:Java 官⽅内容:供开发者调⽤的接⼝②Driver

#数据库#java#mysql +1
Git生产环境上commit提交多次解决办法

1.模拟测试环境:创建Test分支做测试,模拟commit提交多次(1)现在远程仓库上有两个分支,我们将使用Test(2)现在需要在本地也创建一个Test分支方便对应上(因为公司项目一般有上十分支,有些只是临时的开发完就删除)checkout不能直接创建(Test是本地分支名,fork_origin/Test是远程仓库别名+远程分支名)应该直接创建分支:git branch -m Test(3)现

文章图片
#git#gitlab#github +1
    共 11 条
  • 1
  • 2
  • 请选择