
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
最近做数据处理的时候经常用到oracle,遇到挺多问题,其中一个就是如题,刷完数据也不报错,但是数据库就是没数据,排查半天,简直被坑惨。总结可以从下面几个方面排查问题:1 字段大小是否合适在数据库建表的时候,经常需要用到 varchar2 类型,因为 varchar2 类型的每个字符都是占两个字节,所以如果定义的时候是 varchar2(100),那么就表示只能存储不超过50个字符的记录。to_s
线性回归和逻辑回归作为机器学习领域的基础模型,简单却也经典。机器学习领域一般有两种任务:分类和回归。分类通常是判断未知样本属于哪一类,例如0和1,好和坏,大和小等等,而回归不仅仅是判断是是什么,还要判断是多少的任务。一、线性回归线性回归是常见的机器学习模型,也是很多人学习机器学习的第一个模型,并且因为线性回归的数学原理比较简单,可以帮助初学者把机器学习和数学原理比较清晰的结合理解。1.1 平面拟合
前言一直以来都想写一些关于Neo4j APOC工具包的使用笔记,不过一直比较忙,最近又需要用到里面的一些东西,决定开始关于APOC笔记的第一步。个人看来,掌握了apoc的使用,cypher水平至少可以提高一倍,开发效率也可以快很多(个人愚见)。下面的笔记都是以linux下的Neo4j 服务器版为准。官网地址:https://neo4j.com/docs/labs/apoc/current/...
一、KNN原理K近邻法(k-nearest neighbors,KNN)是一种应用比较多的机器学习算法模型,其核心思想就是未知的对象总是和距离自己最近的群体类似。简单地说就是一个人如果经常和好人走的近,那么我们可以认为(大概率)他是好人,如果他经常和坏人混迹在一起,那么我们就会认为他更可能是坏人,在推荐领域,KNN 可以用来为消费行为相似的人推荐商品。现在还有一个不确定的问题,就是距离最近的群体怎
一、KNN原理K近邻法(k-nearest neighbors,KNN)是一种应用比较多的机器学习算法模型,其核心思想就是未知的对象总是和距离自己最近的群体类似。简单地说就是一个人如果经常和好人走的近,那么我们可以认为(大概率)他是好人,如果他经常和坏人混迹在一起,那么我们就会认为他更可能是坏人,在推荐领域,KNN 可以用来为消费行为相似的人推荐商品。现在还有一个不确定的问题,就是距离最近的群体怎
本篇文章我们继续介绍另一种聚类算法——Birch模型,相对于K-means和DBSCAN,Birch的应用并没有那么广泛,不过它也有一些独特的优势,Birch算法比较适合于数据量大,类别数K也比较多的情况,它运行速度很快,只需要单遍扫描数据集就能进行聚类,这在数据量日益庞大的今天是一个比较大的优势。一、原理Birch(Balanced Iterative Reducing and Clusteri
在机器学习领域,除以LR、DT、SVM等为代表的有监督算法外,还有另外一类特殊的存在——无监督算法,其中最为经典就是聚类算法了。聚类算法因为其不需要先验标签,因此在很多领域应用都较为广泛。聚类算法主要有:K-means、DBSCAN、Birch、Spectral clustering、OPTICS等,在本篇文章以及接下来的几篇文章中我们会依次介绍这些算法。1.K-means原理K-means的实现
OPTICS聚类算法是基于密度的聚类算法,全称是Ordering points to identify the clustering structure。提到基于密度的聚类算法,应该很快会想到前面介绍的DBSCAN聚类算法,事实上,OPTICS也是为了优化DBSCAN而出现的。一、原理在DBSCAN算法中,有两个比较重要的参数:邻域半径eps和核心对象的最小邻域样本数min_samples,选择不
机器学习常用的不仅仅是各种模型,还有数据分析、数据处理和可视化等,python、R等语言也提供了很多有用的工具包。一、pandaspandas在数据分析中的作用无需多数。下文的pd表示pandas库,df表示实际中的DataFrame实例。1. df.pivotpivot是pandas中的数据透视表操作,实际上就是针对某列的行转列操作,参数如下:pivot(self, index=None, co
一、KNN原理K近邻法(k-nearest neighbors,KNN)是一种应用比较多的机器学习算法模型,其核心思想就是未知的对象总是和距离自己最近的群体类似。简单地说就是一个人如果经常和好人走的近,那么我们可以认为(大概率)他是好人,如果他经常和坏人混迹在一起,那么我们就会认为他更可能是坏人,在推荐领域,KNN 可以用来为消费行为相似的人推荐商品。现在还有一个不确定的问题,就是距离最近的群体怎