
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
1、OCR简介光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。2、OCR应用场景1)针对图片类识别2)文档类识别场景3)拍照表单类场景4)自然场景(比如车牌识别、摄像监控、自动驾驶等)3、OCR流程图像预处理:去噪、灰度化、图像增强等文本检测:滑动
中秋过后,小蔡拿着他的计划和周总讨论。小蔡:“周总,这是我放假期间制定的一份工作计划(见下图),您看是否需要调整?”周总接过计划,看了一会说:“嗯,还不错!接下来你是要做预测,那说说你的思路吧。”小蔡:“我们可以从官方或者市场监测机构买一些全行业的数据,基于这些数据,我们可以对服装行业未来两年的市场规模进行预测,我放假这几天学了一些预测方法。”周总:“那你说一说预测
一、如何做一个好的数据产品经理?PD(指产品经理,下同)本身就是在做牛做马,关系圈异常复杂。数据PD也不例外。而且打交道的人更多。以下是我用PPT绘制的数据产品经理关系圈。如果你也做过 数据产品的产品经理(好拗口),相信也有同感。既然要和这么多人打交道,要推动数据产品的上线,数据产品经理自然有着一定的要求。我的体会如下——也借此去鞭策自己在朝这个方向努力:
随着开源Hapdoop、Map/Reduce、Spark、HDFS、HBASE等技术的商用化,大数据管理技术得到了突飞猛进的发展。一般来说,大数据具有3V特性,即Volume(海量)、Velocity(高速)和Variety(多样)[1]。TPC联合主席、Cisco高级工程师Raghunath Nambiar进一步认为大数据还面临Value(价值)和Veracity(精确)的挑战。如何客观地比较不
Jay Kreps是来自LinkedIn的首席工程师,他表示日志几乎在计算机产生的时候就存在,除了可用在分布式计算或者抽象分布式计算模型内部之外,还有广泛的用途。本文中他讲述的日志的原理和通过把日志用做单独服务来实现数据集成、实时数据处理以及分布式系统设计。文章内容非常干货,值得学习。以下是原文:我在六年前的一个令人兴奋的时刻加入到LinkedIn公司。从那个时候开始我
随着开源Hapdoop、Map/Reduce、Spark、HDFS、HBASE等技术的商用化,大数据管理技术得到了突飞猛进的发展。一般来说,大数据具有3V特性,即Volume(海量)、Velocity(高速)和Variety(多样)[1]。TPC联合主席、Cisco高级工程师Raghunath Nambiar进一步认为大数据还面临Value(价值)和Veracity(精确)的挑战。如何客观地比较不
有关Bluemix的使用以及相关的DEMO示例在本次博文中将不再赘述,如有读者对Bluemix的使用不是很了解的,可以参考如下连接:《15 部最优秀的 Bluemix教程》http://www.ibm.com/developerworks/cn/cloud/library/cl-bestoflbluemix2014/index.html上述教程应该能够带你进入到Bluemix的全新世界
与数据挖掘有关或者有帮助的R包和函数的集合。1、聚类常用的包:fpc,cluster,pvclust,mclust基于划分的方法:kmeans,pam,pamk,clara基于层次的方法:hclust,pvclust,agnes,diana基于模型的方法:mclust基于密度的方法:dbscan基于画图的方法:plotcluste
马云在2012年网商大会上的演讲中说过:“假如我们有了一个数据预报台,就像为企业装上了一个GPS和雷达,企业的出海将会更有把握。”。这里的数据预报台就是下文所述的商业智能。什么是商业智能(Business Intelligence)数据挖掘的最终目的是要实现数据的价值,而商业智能是在企业中实现数据价值的最佳方式之一。商业智能(Business Intelligence,简 称BI)
前言智慧医疗英文简称WIT120,是最近兴起的专有医疗名词,通过打造健康档案区域医疗信息平台,利用最先进的物联网技术,实现患者与医务人员、医疗机构、医疗设备之间的互动,逐步达到信息化。在这个过程中,医疗设备所产生的数据将会是非常庞大的,我们常见的包括血压、血氧数据,体温、流量、鼾声、心率、通气、BMP信息等,除此以外,某些设备自身的信息量也非常重要,包括压力、开关机时间、延时时间、







