商务智能三大技术核心:数据仓库、在线联机多维分析、数据挖掘

商务智能就是利用数据库存储数据集成数据分析技术,把海量的业务数据转化成为有价值的信息、知识,辅助管理者进行决策

数据记录、描述和识别事物的符号,是按照一定规则排列、组合的物理符号,通过有意义的组合来表达现实世界中某种实体特征,是客观事物的属性、数量、位置及其相互关系的抽象表示

知识就是对信息内容进行的提炼、比较、挖掘、分析、判断、推论概括的结果。是通过实践、研究、联系调查获得的关于事物的事实和状态的认识,是对科学、艺术技术的理解。

智慧是指富有洞察力的知识。人类的智慧表现在了解多方面知识后,可预见一些事情的发生并主动采取行动。

智能智慧与能力的简称,是知识与智力的总和,知识是智能行为的基础。

数据仓库主要用来存储和管理数据,数据仓库的数据来自于运营层。

在线多维数据分析是把运营的这些数据转化成信息,支持各级决策人员复杂的查询和在线分析处理,并以直观易懂的图形图标的形式把结果展现出来。

联机分析处理:基于对大量的业务数据包括历史业务数据进行分析之后制定的决策分析。就是从数据库中获取信息并加以利用。

原始数据/操作型数据:面向应用;详细的;为日常工作服务;在访问瞬间是准确的;可更新;重复运行;处理需求预先可知非冗余性;对性能要求高;一次访问一个单元;静态结构:可变的内容;访问频繁

导出数据/分析数据:面向主题;综合的或提炼的;为管理者服务;代表过去的数据、快照;不更新(修改);启发式运行;处理需求事先不知道;总是存在冗余;对性能要求宽松一次访问一个集合;结构灵活;访问很少不多;

事物处理环境下:操作频率高,操作过程重复,每次处理时间短。在操作过程中大量使用插入、删除、更新等操作,因此系统要保证数据的插入、删除、更新操作不能有异常,同时响应时间要短,在设计业务数据库时进行范式设计也是为了此,联机事物处理是这种环境下的典型应用。

分析型处理环境下:用户的行为模式与事物处理环境下完全不同,用户很少有数据插入、删除、更新等操作,但同一时刻要读取大量的数据,并且每次操作的流程也是不确定的,每次分析操作过程持续时间较长,在此过程中会大量的消耗系统资源

根据分析型环境中对数据的要求,人们构建了一种从数据组织结构、数据的内容到数据操作上都不同于传统业务数据库的数据库,叫做数据仓库。

数据仓库之父:William H.Inmon

数据仓库定义:数据仓库是一个面向主题的、集成的、随时间变化的、非易失的、用于战略决策的数据集合。

A data warehouse is a subject oriented, integrated, non-volative, and time variant collection of data in support of management's decisions.                                             ----W.H. Inmon

数据仓库的特点面向主题的、集成的、相对稳定的、反映历史变化的。主要用于支持管理和决策。

  • 面向主题:数据仓库的数据是按照一定的主题域进行组织的,所谓主题,就是在分析的时候所关注的对象。
    • 特点:各个主题有独立的完整的一致的信息内容,便于在此基础上作分析处理。主题之间有重叠的内容,反映主题间的联系,但是是逻辑上的重叠,不是物理上,而且重叠仅在细节层,各主题的综合方式不同。
  • 数据集成:对原有分散的数据库数据经过系统加工,整理得到的消除源数据中的不一致性。
  • 反映历史变化:数据仓库中的数据主要用来决策分析使用,正确决策的结果应该是项目进一步靠近,而非相反。
  • 相对稳定:数据仓库中存储的是历史数据,因此进入到数据仓库中的数据就不再修改其数值。

数据仓库与OLTP数据库对比:

 

 

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐