logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

淘宝用户行为分析(三)(淘宝用户个性化标签)

2013-10-25阿里技术嘉年华 分析需要回答三个问题,用户行为分析也不例外。     前面我们聊了用户行为分析的内容、目的、差异性和流动性。这里再聊聊传播性。    当你想买一个东西的时候,若你是个理性的消费者,你就会考虑7要素:该不该买?给谁买?什么时候买?买什么?在哪买?买多少?怎么选?而在考虑这些要素时,你总是会听到一些声音。这

#大数据#数据挖掘
淘宝用户行为分析(二)(用户个性化标签)

2013-10-25阿里技术嘉年华   上篇博文我们聊了两个问题:用户行为的研究内容和用户的差异性。这里我们再聊聊用户的流动性。    如果把用户比作流动的水,那么企业就是蓄水池,新用户从进水管流入,老用户从出水管流出。企业要灌溉庄稼获取收成,就要有一定的蓄水量,就必须开源节流,开拓新用户的同时,留住老用户。不论是开拓新用户还是留住老用户,都是基于用户的流动性。由此产生

#大数据#数据挖掘
HIVE在腾讯分布式数据仓库实践

摘要:在12月1日“Hadoop生态系统”主题分论坛,腾讯高级工程师赵伟首先介绍了他们的TDW核心架构,HIVE,MapReduce,HDFS及PostgreSQL构成。赵伟分享了最核心的HIVE模块在TDW中的实践经验;HIVE是一个在Hadoop上构建数据仓库的软件,它支持通过类SQL的HQL语言对结构化数据进行操作;实现了基本的SQL功能,可扩充UDF/UDAF、...【CSDN现场报道

#hive#大数据
揭秘淘宝286亿海量图片存储与处理架构

8月27日下午,在IT168系统架构师大会存储与系统架构分论坛上,淘宝网技术委员会主席,淘宝网核心工程师章文嵩向我们详细介绍了淘宝网图片处理与存储系统的架构。章文嵩博士的演讲日程包括了淘宝的整个系统架构、淘宝图片存储系统架构,淘宝网独立开发的TFS集群文件系统,前端CDN系统以及淘宝网在节能服务器方面的应用和探索。LVS创始人,淘宝网技术委员会主席,淘宝网核心工程师章文嵩先生  本文侧

漫谈大数据仓库与挖掘系统:BSP模型(应用于数据挖掘、机器学习的云计算模型)

2013-10-22卡特阿里技术嘉年华本文其它章节:  漫谈大数据仓库与挖掘系统:前言:大数据的价值  【回复071查看】 漫谈大数据仓库与挖掘系统:层次、维度与主题【回复072查看】 漫谈大数据仓库与挖掘系统:ETL的开始—数据的传输和同步【回复073查看】 漫谈大数据仓库与挖掘系统:MapReduce与大规模离线计算系统【回复074查看】 

#大数据#数据挖掘#云计算
Nginx参数配置以及Nginx+tomcat配置集群

开发的应用采用F5负载均衡交换机,F5将请求转发给5台hp unix服务器,每台服务器有多个webserver实例,对外提供web服务和socket等接口服务。之初,曾有个小小的疑问为何不采用开源的apache、Nginx软件负载,F5设备动辄几十万,价格昂贵?自己一个比较幼稚的问题,后续明白:F5是操作于IOS网络模型的传输层,Nginx、apache是基于http反向代理方式,位于ISO模型的

#nginx
HBase性能深度分析

文/刘星HBase作为BigTable的一个开源实现,随着其应用的普及,用户对它的性能数据愈发关注。本文将为您揭开HBase性能测试的一角,邀您一起参与到对云计算模块性能调优的深度思考中。对于BigTable类型的分布式数据库应用来说,用户往往会对其性能状况有

#hbase#测试#集群 +1
漫谈大数据仓库与挖掘系统:BSP模型(应用于数据挖掘、机器学习的云计算模型)

2013-10-22卡特阿里技术嘉年华本文其它章节:  漫谈大数据仓库与挖掘系统:前言:大数据的价值  【回复071查看】 漫谈大数据仓库与挖掘系统:层次、维度与主题【回复072查看】 漫谈大数据仓库与挖掘系统:ETL的开始—数据的传输和同步【回复073查看】 漫谈大数据仓库与挖掘系统:MapReduce与大规模离线计算系统【回复074查看】 

#大数据#数据挖掘#云计算
到底了