logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据挖掘学习笔记(1)

数据挖掘相关概念当被存储在本地时的数据称作数据,当把数据经过加工处理,它们转变成了有用的信息。如果信息经过合理的组合能够产生价值,特别是商业价值,此时就可以称其为知识。数据挖掘的过程就是数据加工处理变成信息,最后转化为知识的过程。 数据挖掘的一些主要工具:商用的MATLAB、IBM Intelligent Miner、SAS Enterprise Miner、SPSS Cl

#数据挖掘
数据挖掘学习笔记(4)

网站日志分析相关知识:W3C扩展日志文件格式常用属性说明表字段名描述客户端IP地址访问服务器的任何客户端的IP地址用户名称访问服务器的用户名称服务名在客户机上运行的Internet服务服务器名称生成日志项的服务器名称服务器IP生成日志项的服务器IP地址服务器端口商户端连接到的

#数据挖掘#大数据
数据挖掘学习笔记(2)

Google中取代GFS、 MapReduce的新技术:Colossus(大石像),Caffeine(咖啡困)。NoSQL指的是非关系型数据库,其最好的代表即为Cassandra(混合型的非关系数据库,类似于Google的BigTable),MongoDB是介于关系数据库和非关系数据库之间的基于分布式文件存储的数据库,由c++语言编写。CAP原理:一致性(Consistency):数据

#数据挖掘
到底了