数据挖掘的概念
1、数据挖掘的定义
数据挖掘(Data Mining,DM),是从大量的、有噪声的、不完全的、模糊和随机的数据中,提取出隐含在其中的,人们事先不知道的、具有潜在利用价值的信息和知识的过程。
这个定义包含以下几层含义:
数据源必须是真实的、大量的、含噪声的;
发现的是用户感兴趣的知识;
发现的知识是可接受、可理解、可运用;
不要求发现放之四海皆准的知识,仅支持特定的问题。
数据挖掘是从数据中发掘知识的过程,在这个过程中人工智能和数据库技术可以作为挖掘工具,数据可以被看作是土壤,云平台可以看作是承载数据和挖掘算法的基础设施 。在挖掘数据的过程中需要用到一些挖掘工具和方法,如机器学习的方法。当挖掘完毕后,数据挖掘还需要对知识进行可视化和展现。
2、数据挖掘的对象
关系型数据库、事务型数据库、面向对象的数据库
数据仓库、多维数据库
空间数据(如地图信息)
工程数据(如建筑、集成电路信息)
文本多媒体数据(如文本、图像、音频、视频数据)
时间相关的数据(如历史数据或股票交换数据)
万维网(如半结构化的HTML、结构化的XML以及其他网络信息)
3、数据挖掘的研究热点
网站的数据挖掘(Web Site Data Mining) 就是从网站的各类数据中得到有价值的信息。
生物信息或基因(Bioinformatics/Genomics) 对人类生存发展有着非常重要的意义,基因的组合千变万化, 能否找出病人的基因和正常人的基因的不同之处,进而对其加以改变,这就需要数据挖掘技术的支持。
为了提高系统的决策支持能力,像ERP、SCM、HR等一些应用系统也逐渐与数据挖掘集成起来。多种理论与方法的合理整合是大多数研究者采用的有效技术。

Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐