logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Hadoop数据分析实例:P2P借款人信用风险实时监控模型设计

一提到hadoop相信熟悉IT领域或者经常关注互联网新闻的朋友都应该很熟悉了,当然,这种熟悉可能也只是听着名字耳熟,但并不知道它具体是什么东西,或者用来做什么。这些都不重要,重要的是你知道有hadoop这么个东西就可以了。前段时间码了一些hadoop方面的分享文章,纯属个人的一点小经验,可能有的地方写的不好,将就下吧!今天要分享的这篇是转载的一篇大快搜索公众号上的文章,是关于时下比较热闹的P2..

大数据分布式存储的部署模式:分离式or超融合

数据中心内部系统的核心要求是“稳定可靠”,一是指系统在运行过程中有能力提供连续可靠的服务,长时间无故障运行;二是指当故障发生之后,有能力快速定位,及时排查,故障范围不蔓延。分离式部署的方式,使得系统与云平台系统相独立,避免了计算和存储争抢CPU/内存/网络等物理资源,一旦某一方资源需求骤升导致的另一方资源枯竭,从而影响性能并在整个基础架构中产生的涟漪效应;和在超融合部署方式在集群规模较大后,网..

hadoop大数据基础框架技术详解

一、什么是大数据进入本世纪以来,尤其是2010年之后,随着互联网特别是移动互联网的发展,数据的增长呈爆炸趋势,已经很难估计全世界的电子设备中存储的数据到底有多少,描述数据系统的数据量的计量单位从MB(1MB大约等于一百万字节)、GB(1024MB)、TB(1024GB),一直向上攀升,目前,PB(等于1024TB)级的数据系统已经很常见,随着移动个人数据、社交网站、科学计算、证券交易、网站日志、传

#大数据#hadoop
hanlp中文自然语言处理分词方法介绍

自然语言处理在大数据以及近年来大火的人工智能方面都有着非同寻常的意义。那么,什么是自然语言处理呢?在没有接触到大数据这方面的时候,也只是以前在学习计算机方面知识时听说过自然语言处理。书本上对于自然语言处理的定义或者是描述太多专业化。换一个通俗的说法,自然语言处理就是把我们人类的语言通过一些方式或者技术翻译成机器可以读懂的语言。人类的语言太多,计算机技术起源于外国,所以一直以来自然语言处理基本都是围

基于结构化平均感知机的分词器Java实现

最近高产似母猪,写了个基于AP的中文分词器,在Bakeoff-05的MSR语料上F值有96.11%。最重要的是,只训练了5个迭代;包含语料加载等IO操作在内,整个训练一共才花费23秒。应用裁剪算法去掉模型中80%的特征后,F值才下降不到0.1个百分点,体积控制在11兆。如果训练一百个迭代,F值可达到96.31%,训练时间两分多钟。数据在一台普通的IBM兼容机上得到:本模块已集成到Han...

#中文分词#java
免费大数据分析云平台有哪些

昨天(5月28号)由社科文献出版社初版的《大数据蓝皮书:中国大数据发展报告No.2》正式发布了。以“数化万物 智在融合”为主题的中国国际大数据产业博览会也京举行中。基本可以预见,在接下来的一段时期内关于大数据应用开发又将进入到一个新的阶段。现在市面上围绕大数据的应用开发如火如荼,比如,企业级大数据处理平台开发、政务大数据平台的开发、智慧交通大数据平台开发等。这些大数据处理平台的开发从技术角度上来说

大数据构建智慧城市“新引擎”,加速推进新旧动能转换

7月13日,“大数据携手智慧城市,助力山东新旧动能转换”技术交流分享会——济南站在山东信息通信技术研究院会议室成功举办,此次会议由山东省智慧城市产业技术创新战略联盟、青岛市大数据与云计算行业协会主办、青岛大快搜索计算技术有限公司承办,交流会由青岛市大数据与云计算行业协会常务副秘书长,大快搜索联合创始人薛铮主持。山东省智慧城市联盟秘书长,泰华智慧产业集团副总裁郝敬全、大快搜索大数据应用研究专家高林、

#智慧城市
要成为云架构师需要学什么技能?

随着大数据云计算技术的发展,围绕这一技术也催生了很多的新的职业,比如——云架构师。何为云架构师呢?成为云架构师又需要学习和掌握什么样的技能?提出这样的问题,不免想到了之前在研究学习大快的DKHadoop的时问过的一个问题:学习dkhadoop需要掌握什么基础。这两个问题不免有异曲同工之妙啊!昨天在大快搜索的公共号里查询dkhadoop的资料时看到一篇介绍关于成为云架构师需要什么样能力的文章觉得还不

大快城市智慧停车管理系统架构体系介绍

最近几年随着大数据技术快速发展与应用,智慧城市随即被正式提出。而且,我们也可以深刻感受到“智慧”正在慢慢改变我们的生活方式和城市。要让城市变智慧的地方太多太多,当前我们接触做多的可能就是外出停车,比如很多商场的停车系统,很多商城的停车场都实现了无人值守。这就是得益于智慧城市停车云平台。很多人对智慧停车云的概念不是明白,智慧停车平台就是利用云计算、物联网、大数据处理技术等手段,通过可持续运营的商业服

HanLP中文分词Lucene插件

基于HanLP,支持包括Solr(7.x)在内的任何基于Lucene(7.x)的系统。Maven<dependency><groupId>com.hankcs.nlp</groupId><artifactId>hanlp-lucene-plugin</artifactId>...

    共 13 条
  • 1
  • 2
  • 请选择