logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据项目(三)————电商模块四(五)

1、广告点击流量实时统计模块网站 / app,通常会给一些第三方的客户,打一些广告;也是一些互联网公司的核心收入来源;广告在网站 / app某个广告位打出去,在用户来使用网站 / app的时候,广告会显示出来;此时,有些用户可能就会去点击那个广告。广告被点击以后,实际上,我们就是要针对这种用户行为(广告点击行为),实时数据,进行实时的大数据计算和统计。每次点击一个广告以后,通常来说,网...

Python数据分析与挖掘(一)

1、数据处理1.1 模块的使用Pandas的使用#!/usr/bin/python# -*-coding:utf-8-*-# __author__ = 'ShenJun'import pandas as pda'''series:系列数据'''a=pda.Series([8,9,2,1])'''结果:08192231dt...

大数据项目(三)————电商模块二(三)

1、模块二介绍——页面单跳转化率页面单跳转化率,计算出来以后,还是蛮有用的,蛮有价值的。产品经理,可以根据这个指标,去尝试分析,整个网站,产品,各个页面的表现怎么样,是不是需要去优化产品的布局;吸引用户最终可以进入最后的支付页面;数据分析师,可以基于咱们的这个数据,做更深一步的计算和分析企业管理层,可以看到整个公司的网站,各个页面的之间的跳转的表现,如何?心里有数,可以适当调整...

Python数据分析与挖掘(二)

1、KNN算法#!/usr/bin/python# -*-coding:utf-8-*-# __author__ = 'ShenJun'import numpy as npimport operatordef knn(k,testdata,traindata,labels):''':param k:表示到最近的k个点,即以最近的k个点的距离来对测试数据所属...

大数据项目(四)————用户画像

1、用户画像概述用来勾画用户(用户背景、特征、性格标签、行为场景等)和联系用户需求与产品设计的,旨在通过从海量用户行为数据中炼银挖金,尽可能全面细致的抽出一个用户的信息全貌,从而帮助解决如何把数据转为商业价值的问题。1.1 用户画像数据来源用户画像数据来源中连个最终要的数据就是用户属性以及物品属性,有了这两个,我们就可以从用户-用户、用户-电影、电影-电影三方面展开相应的相似度计算...

大数据项目(三)————电商模块四(五)

1、广告点击流量实时统计模块网站 / app,通常会给一些第三方的客户,打一些广告;也是一些互联网公司的核心收入来源;广告在网站 / app某个广告位打出去,在用户来使用网站 / app的时候,广告会显示出来;此时,有些用户可能就会去点击那个广告。广告被点击以后,实际上,我们就是要针对这种用户行为(广告点击行为),实时数据,进行实时的大数据计算和统计。每次点击一个广告以后,通常来说,网...

大数据项目(三)————电商模块二(三)

1、模块二介绍——页面单跳转化率页面单跳转化率,计算出来以后,还是蛮有用的,蛮有价值的。产品经理,可以根据这个指标,去尝试分析,整个网站,产品,各个页面的表现怎么样,是不是需要去优化产品的布局;吸引用户最终可以进入最后的支付页面;数据分析师,可以基于咱们的这个数据,做更深一步的计算和分析企业管理层,可以看到整个公司的网站,各个页面的之间的跳转的表现,如何?心里有数,可以适当调整...

大数据项目(三)————电商项目介绍(一)

1、项目介绍本项目主要用于互联网电商企业中,使用Spark技术开发的大数据统计分析平台,对电商网站的各种用户行为(访问行为、购物行为、广告点击行为等)进行复杂的分析。用统计分析出来的数据,辅助公司中的PM(产品经理)、数据分析师以及管理人员分析现有产品的情况,并根据用户行为分析结果持续改进产品的设计,以及调整公司的战略和业务。最终达到用大数据技术来帮助提升公司的业绩、营业额以及市场占有率的目标..

大数据项目(四)————用户画像

1、用户画像概述用来勾画用户(用户背景、特征、性格标签、行为场景等)和联系用户需求与产品设计的,旨在通过从海量用户行为数据中炼银挖金,尽可能全面细致的抽出一个用户的信息全貌,从而帮助解决如何把数据转为商业价值的问题。1.1 用户画像数据来源用户画像数据来源中连个最终要的数据就是用户属性以及物品属性,有了这两个,我们就可以从用户-用户、用户-电影、电影-电影三方面展开相应的相似度计算...

Python中常用包——sklearn主要模块和基本使用方法

在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。

    共 19 条
  • 1
  • 2
  • 请选择