李元乐个人主页

@hugolyl

李元乐

2022-11-11 13:54:30 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

数据挖掘---分类算法之朴素贝叶斯算法

贝叶斯分类是一种统计学分类方法，在分类问题中表现出良好的性能。很明显朴素贝叶斯基于贝叶斯定理，下面来简单复习下贝叶斯定理。在说之前我们来看下条件概率的计算，所谓"条件概率"（Conditional probability），就是指在事件B发生的情况下，事件A发生的概率，用P(A|B)来表示。现在需要计算在事件B发生的情况下，事件A发生的概率。有了这个之后，我们可以对对条

数据挖掘---分类算法之神经网络算法BPN实践

有了上篇的基本理论之后，我们可以尝试去代码实现基本的一个BPN算法。具体的算法代码，后面给出。就像前面说过的，有几个东西需要调节注意的，学习率和惯性因，初始权值和阈值，收敛误差界值Emin。这几个问题其实是很多类似算法都遇到的问题，细节这里不多说。除了自己代码实现外，还有很多工具可以帮助我们实现和理解神经网络算法，现在举例说明下。 1

#神经网络 #算法

数据挖掘---分类算法之支持向量机SVM

这篇来说说支持向量机，说实在的，这个是我的最爱，一直比较看好这个算法，而且也是花了不少时间在这个上面，下面一起来复习下。基于统计学习理论的支持向量机算法是现代智能技术中的重要方面，研究从观测数据（样本）出发寻找规律，利用这些规律对未来数据或无法观测的数据进行预测。与传统统计学相比，统计学习理论（Statistical Learning Theory，SLT）是一种专门

#支持向量机

数据分析---最小二乘法和梯度下降法

最近在整理数据优化方面的知识，看的多了最小二乘法和梯度下降法之类的词语经常出现，很多算法都有用到类似方法，或者很多算法看起来和这些似曾相识，比如BP神经网络，支持向量机，等等分类回归方法。可见这最小二乘法和梯度下降法是很基础的方法，很值得好好复习下，不然很多东西剪不断，理还乱。首先科普下，这两个基本的慨念，怕自己忘记了。最小二乘法（又称最小平方法）是一种数学优

#最小二乘法 #算法

数据存储---内存列式数据库KDB+(Q)文档

Kx systems公司的创始人之一Arthur Whitney在2003年研发了列式数据库KDB和它的操作语言Q。官网：www.kx.com主要Feature:内存内的数据库：理解KDB的一种方式就是KDB是一个内存数据库，但拥有磁盘可持久化能力。解释性语言：开发周期更短,q语言要做到简洁，高效和富表达性。(当然学习曲线也不是一般般滴说)列表是有顺序的：不同于数据

数据处理---Java数据处理之消息队列

前面说了RMI，这是一个同步分布式调用的必备手段；但是为了实现异步的分布式处理，不得不说到的就是消息队列了。对任何架构或应用来说，消息队列都是一个至关重要的组件，它具有多方面的优点:1. 解耦性消息队列在处理过程提供了中间插入了一个隐含的、基于数据的接口层。这样就可以把不同的系统边界隔离开来，每个系统做专门的事情，提供独立的服务，需要调用的时候传输给第三方。这允许你独立的扩展或修改两边的处

#activemq

数据挖据---机器学习平台之H2O架构/接口/实践

上一章介绍了H2O的使用，这次来学习学习H2O架构接口和实践。1，H2O架构关于H2O架构，很多资料也有说明，这里我们一起来看看官网上的介绍。最上面的是客户层，即接口交互层，H2O支持JavaScript，R，Python，Excel，Tableau，Flow等多种形式的外部交互。下面那个可以理解为H2O的关键引擎层，JVM Components，每个JVM进程被分为三层:语言，算法，核心架构，负

#深度学习 #机器学习 #hadoop +1

数据挖掘---分类算法之SOFM算法

生物学研究表明，在人脑感觉通道上，神经元的组织原理是有序排列的，输入模式接近，对应的兴奋神经元也相近。大脑皮层中神经元这种相应特点不是先天形成的，而是后天的学习自组织形成的。对于某一图形或某一频率的特定兴奋过程是自组织特征映射网中竞争机制的生物学基础。神经元的有序排列以及对外界信息的连续映像在自组织特征映射网中也有反映，当外界输入不同的样本时，网络中哪个位置的神经元兴奋在训练开始时时随机的。

数据挖掘---分类算法之神经网络算法BPN

有段时间没有写了，觉得很有必要继续加油写下去。一直有想梳理下主要的机器学习算法了，做一个从各个主流算法到新兴的算法，都做一番回顾，理论结合代码实践，做一个复习，毕竟温故而知新。顺便说下，什么机器学习，数据挖掘，人工智能，这几个词语很多，也很容易用的模糊了，边界不是很清晰，我也不想做过多的解读与区分，免得弄巧成拙，或者班门弄斧。还是埋头实践吧。后面的几篇主要从这么几个类别来整理：

#机器学习 #数据挖掘

数据检索---ElasticSerach

ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是第二流行的企业搜索引擎。设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。我们建立一个网站或应用程序，并要添加搜索功能，令我们受打击的是：搜索工作是

共 12 条

请选择