
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
1.推荐系统与spark做推荐系统的同学,一般都会用到spark。spark的用途相当广泛,可以用来做效果数据分析,更是构建特征与离线训练集的不二人选,同时spark streaming也是做实时数据的常用解决方案,mllib包与ml包里面也实现了很多常用的算法,是针对大数据集分布式算法最常用的算法框架。因此能熟练掌握spark的使用算是做推荐系统的基本功。2.ALS算法spark mllib/m
1.标准Kmeans经典的标准kmeans算法无需多言,每个无监督学习的开场白一般都是标准kmeans算法。具体的原理不再多言,可以参考之前的文章:https://blog.csdn.net/bitcarmanlee/article/details/52092288标准的kmeans的优缺点,上面的文章也有详细介绍,再详细说一说kmeans++对于初始中心点的优化kmeans++中心点初始...
1.ConcurrentModificationException有如下代码处理ArrayList@Testpublic void test1() {List<Integer> list = new ArrayList<>();list.add(1);list.add(2);list.add(3);list.add(4);for(int num: list
1.查看当前目录中文件个数ls -l |grep -c "^-"上面的命令中,ls -l显示出来的格式为-rw-r--r--1 wangleistaff1.4K Aug 12 20:13 ? extends T 与 ? super T.md-rw-r--r--1 wangleistaff6.7K Aug 12 19:34 Comparable 与 Comparator 比较.md-rw-r--r-
0.前言深度学习中最常见的是各种向量还有矩阵运算,经常会涉及到求导操作。因此准确理解向量矩阵的求导操作就显得非常重要,对我们推导计算过程以及代码书写核对有非常大的帮助。神经网络中最常见的操作为向量,矩阵乘法,在求导的时候经常需要用到链式法则,链式法则在计算过程中会稍微麻烦,下面我们来详细推导一下,推导过程全程简单明了,稍微有点数学基础的同学都能看明白。1.标量对标量的链式求导假设x, y,...
0.前言随着深度模型的普及,线上越来越多的模型换成了深度模型,与此对应的线上模型的部署与调用方式也会发生变化。下面我们就来介绍一下分别用python代码与java代码调用训练好的模型。1.模型训练首先我们训练一个简单的模型 y=3x+0.1y = 3x + 0.1y=3x+0.1#!/usr/bin/env python# encoding: utf-8"""@author: wanglei@ti
最近有个python小项目,有一堆文件需要处理。所以将文件位置写入配置文件中,顺便写了一个解析配置文件的类,仅供大家参考,需要的同学请拿走#!/usr/bin/env python#coding:utf-8#-----------------------------------------------------# author: wanglei# date: 20160
当我们需要针对mysql的表名或者字段名需要修改的时候,这个时候就需要用到mysql的alter命令。为了方便起见,首先我们新建一张用户表。create table user(`id` INT NOT NULL AUTO_INCREMENT,`court_id` INT NOT NULL DEFAULT 1,`user_id` INT NOT NULL DEFAULT 0,PR...
项目github地址:bitcarmanlee easy-algorithm-interview-and-practice欢迎大家star,留言,一起学习进步去重获取唯一值是常见的需求,下面我们看看pandas里面如何实现去重。直接看代码import pandas as pddef test():df = pd.DataFrame({"c1": [1, 1, 2, 3, 1], "c2": [10







