OLAP多维数据分析在企业决策管理中的应用

2023-03-01

一、背景

随着企业信息系统的建设, 企业积累的数据资产越来越多。如何有效的利用这些数据辅助企业管理和决策, 是企业管理者关心的问题。目前各中大型企业均在建立数据仓库, 而OLAP作为多维数据分析的重要技术, 在企业管理和决策中扮演了重要的角色。

二、OLAP介绍及框架设计

OLAP多维数据分析是基于数据立方体, 允许业务人员及分析人员从不同的维度对数据进行分析, 提供对数据的上卷、下钻、切片、切块、旋转等多种分析方式, 从更为全面的角度来分析数据实体。相比传统的报表, OLAP支持复杂的分析操作, 让分析及决策人员能够全方位的了解信息, 并快速的做出决策。一般而言OLAP有三种不同的组成形式: (1) MOLAP (Multidimensional OLAP) , 这种形式下的OLAP存储采用多维数组, 与传统的关系结构不同, 数据库在保存MOLAP时需要进行单独的处理; (2) ROLAP (Relational OLAP) , 这种形式下的OLAP存储采用传统的关系型表格, 并不需要数据库做额外的格式转换; (3) HOLAP (Hybrid OLAP) , 这种形式下的OLAP存储采用关系型结构以及多维数据结构, 结合了两种不同存储结构的优点, 在底层数据中使用关系型结构存储来提高效率, 而在分析层采用多维数据进行灵活的分析。

本文针对企业做的架构设计如图1所示, 该架构分为三层:存储层、计算层、OLAP分析层。存储层采用Hadoop架构, 数据存储在HDFS上并使用Hive作为数据仓库的实现技术;计算层使用Yarn架构, 调用Spark进行指标计算;OLAP分析层生成数据立方体, 并提供对外API供给上层应用调用。

三、多维数据立方体构建及应用

与传统的关系型表不一样, 多维数据立方体是一种多维矩阵, 允许分析人员从不同的视角来考察数据。多维矩阵在二维关系数据上进行多维度的扩展, 并不仅限于三个维度, 而可以从多个维度来对数据进行操作。传统的关系型表格只能从两个维度来统计分析数据, 而作为关系型表格扩展的多维数据允许从不同的维度来切分数据, 并进行统计分析。同时由于颗粒度的不同, 多维数据立方需要分析人员从最低粒度的数据按照不同的维度轴进行汇总分析, 同时也允许分析人员从高层次的汇总数据不断的下钻到细粒度的数据。因此多维立方体为分析人员提供了灵活并且强大的分析工具, 有利于从不同的角度来分析业务, 挖掘业务的价值。

OLAP多维数据分析的应用一般分为四个阶段:第一阶段是根据业务需求进行数据建模, 确定业务决策需要的数据源以及建模的方式;第二阶段是进行ETL抽取数据, 建立数据立方;第三阶段是利用OLAP工具进行在线分析;第四阶段是不断的优化分析结果, 为企业经营决策做出支撑。而其中多维立方体的构建是关键。

以本企业石油产品销售为例, 可以从时间、地区、产品等不同维度来考察销量情况, 建立如下图2所示的多维数据立方体, 并进行相关的分析操作。

从图2可以看到, 数据立方体结合了销售产品、时间、区域等三个维度对销量进行多维分析。数据立方体的钻取操作可以在维度的不同层次之间进行切换。从钻取的立方体可以看到, 分析人员可以查看具体月份, 比如4月、5月、6月的销售情况。同理, 如果要以销售区域为维度来分析数据, 也可以对直辖地区进行钻取。而上卷操作是对底层数据进行汇总操作, 比如将4月、5月、6月等具体月份的销量汇总为第一季度、第二季度、第三季度等更高时间级别的销量。而切片分析则可以对维度中具体某个值的情况进行分析。以上图为例, 从产品维度可以选择石油产品作为分析的角度来查看该产品的销量, 或者从时间维度选择三季度的时间区域来分析该时间段内的销售情况。而切块分析由多个切面分析组成, 首先选定待分析的维度, 比如某个时间区域, 然后再选择对比分析的维度。比如可以选择产品维度中的燃油和石油销量进行分析。而数据立方体的旋转分析允许分析人员交换不同的维度, 转换行列表来进行分析。

通过对图中立方体的钻取、切片、上卷、旋转等操作可以从多个角度来分析业务的发展情况, 考察不同条件下业务的特征。根据多维度的分析结果, 可以深入探讨地区销售差异的原因, 提供改进的销售策略来提高业绩。

四、总结

企业管理和决策支持需要大量的数据支撑, OLAP技术帮助企业管理者以及业务人员从不同的维度及视角来分析数据, 从而获取数据中蕴藏的信息, 改进业务的发展, 对决策及业务预测进行优化。因此OLAP这种基于数据仓库技术的技术为决策人员提供了强有力的支持工具, 有力地推动了决策管理的科学化以及高效化。

摘要:企业数据的与日剧增, 如何有效的整合企业数据, 如何实现准确并且高效的分析, 是数据仓库在企业管理应用中面临的重要问题。本文基于联机在线分析 (On-Line Analytical Processing, OLAP) 技术, 该技术是基于数据立方体, 从不同维度对企业的数据进行分析, 企业管理人员可以全面的了解企业数据信息, 从而提高企业的决策管理效率。

关键词:OLAP,数据立方体,决策管理

参考文献

[1] 王珊.数据仓库技术与联机分析处理[M].北京:科学出版社, 2013.

[2] 黄梯云.智能决策支持系统[M].北京:电子工业出版社, 2016.

[3] 张闽, 吴顺祥, 黄恩臻, 陈建辉.“基于数据仓库的连锁超市管理决策支持系统”, 中国人工智能进展论文集 (2001) , pp.434-437[M].北京:北京邮电大学出版社, 2013.

[4] 严任远.基于数据仓库的企业OLAP多维模型的设计与实现[J].情报杂志, 2012 (9) :33.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:外源氯对花魔芋产量及球茎葡甘露聚糖含量的影响下一篇:探讨三维模型在城市规划报建中的优势