什么是联机分析处理?
OLAP是一种允许用户同时分析来自多个数据库系统的信息的软件。它是一种允许分析人员从不同的角度提取和查看业务数据的技术。OLAP代表在线分析处理。
分析人员经常需要对数据进行分组、聚合和连接。关系数据库中的这些操作是资源密集型的。使用OLAP数据可以预计算和预聚合,使分析更快。
OLAP数据库被划分为一个或多个数据集。多维数据集的设计使得创建和查看报表变得非常容易。
目录
- 什么是联机分析处理?
- OLAP多维数据集
- OLAP的基本分析操作
- OLAP系统的类型
- ROLAP
- MOLAP
- 混合OLAP
- OLAP的优点
- OLAP的缺点
OLAP多维数据集:
OLAP的核心概念是OLAP多维数据集。OLAP多维数据集是一种为非常快速的数据分析而优化的数据结构。
OLAP多维数据集由称为度量的数字事实组成,度量按维度分类。OLAP多维数据结构也称为超立方体数据结构。
通常,数据操作和分析使用简单的电子表格执行,其中数据值以行和列格式排列。这对于二维数据非常理想。然而,OLAP包含多维数据,数据通常来自不同且不相关的源。使用电子表格不是最佳选择。多维数据集可以逻辑有序地存储和分析多维数据。
它是如何工作的?
数据仓库可以从多个数据源和格式(如文本文件、excel表格、多媒体文件等)中提取信息。
提取的数据被清洗和转换。数据被加载到OLAP服务器(或OLAP多维数据集)中,在其中预先计算信息以进行进一步分析。
OLAP的基本分析操作
OLAP中的四种分析操作是:
- Roll-up
- Drill-down
- Slice and dice
- Pivot (rotate)
1) Roll-up:
Roll-up也称为“整合”或“聚合”。Roll-up 操作可以通过两种方式执行:
- 减少尺寸
- 提升概念层次。概念层次结构是根据事物的顺序或层次对其进行分组的系统。
观察下面的图表
- 在这个例子中,城市新泽西失去了盎格鲁,进入了美国乡村
- 新泽西和洛杉矶的销售数字分别是440和1560。卷起后变成2000
- 在这个聚合过程中,数据是位置层次结构从城市向上移动到乡村。
- 在卷取过程中,至少需要删除一个或多个维度。在本例中,删除了四分之一维度。
2) Drill-down
在drill-down中,数据被分割成更小的部分。它与roll-up过程相反。这可以通过
- 向下移动概念层次结构
- 增加一个维度
考虑上面的图表
- 第一季度钻取到一月、二月和三月。相应的销售也是寄存器。
- 在本例中,添加了维度月份。
3) Slice:
这里,选择一个维度,并创建一个新的子多维数据集。
下图解释了切片操作是如何执行的:
- 时间参数设置为Q1作为过滤器进行切片。
- 将完全创建一个新的多维数据集。
Dice:
这个操作类似于切片。dice的不同之处在于,您选择了两个或多个维度来创建子立方体。
4) Pivot
在Pivot中,旋转数据轴来提供数据的替代表示。
在下面的示例中,主元基于项类型。
OLAP系统的类型
OLAP层次结构
OLAP类型 | 解释 |
关系型OLAP(ROLAP) | ROLAP是一个扩展的RDBMS和多维数据映射,用于执行标准的关系操作。 |
多元化OLAP(MOLAP) | 在多维数据中操作的模型。 |
混合在线分析处理(HOLAP) | 在HOLAP中,聚合的总数存储在多维数据库中,而详细数据存储在关系数据库中。这既提供了ROLAP模型的数据效率,也提供了MOLAP模型的性能。 |
桌面OLAP(DOLAP) | 在Desktop OLAP中,用户从本地数据库或桌面下载部分数据并进行分析。与其他OLAP系统相比,DOLAP的部署成本相对较低,因为它提供的功能很少。 |
Web OLAP(WOLAP) | Web OLAP是通过Web浏览器访问的OLAP系统。WOLAP是一个三层架构。它由三个组件组成:客户机、中间件和数据库服务器。 |
移动OLAP | 移动OLAP帮助用户使用移动设备访问和分析OLAP数据 |
Spatial OLAP | SOLAP是为了方便管理地理信息系统(GIS)中的空间和非空间数据而创建的。 |
ROLAP
ROLAP处理关系数据库中的数据。事实表和维度表存储为关系表。它还允许对数据进行多维分析,是增长最快的OLAP。
ROLAP型号优点:
- 数据效率高。它提供了很高的数据效率,因为查询性能和访问语言都经过了优化,尤其是针对多维数据分析。
- 可伸缩性。这种OLAP系统为管理大量数据提供了可伸缩性,甚至在数据稳步增长的情况下也是如此。
ROLAP型号的缺点:
- 对资源有更高的要求:ROLAP需要很大的人力资源、软件和硬件资源利用率。
- 计算数据有局限性。ROLAP工具使用SQL计算所有聚合数据。但是,对于处理计算没有设置限制。
- 查询性能缓慢:与MOLAP相比,该模型的查询性能较慢
MOLAP
MOLAP使用基于数组的多维存储引擎来显示数据的多维视图。基本上,他们使用OLAP立方体。
HOLAP
HOLAP是ROLAP和MOLAP的混合物。它提供了快速的MOLAP计算和更高的ROLAP可扩展性。HOLAP使用两个数据库。
- 聚合或计算的数据存储在OLAP多维数据集中
- 详细信息存储在关系数据库中。
HOLAP的优点:
- 这种OLAP有助于节省磁盘空间,并且保持紧凑,这有助于避免与访问速度和方便性相关的问题。
- HOLAP使用cube技术,可以为所有类型的数据提供更快的性能。
- ROLAP是即时更新的,HOLAP用户可以访问这个实时即时更新的数据。MOLAP带来数据的清洗和转换,从而提高数据相关性。HOLAP很好的结合它们。
HOLAP的缺点:
- 更高的复杂性:HOLAP系统的主要缺点是它同时支持ROLAP和MOLAP工具和应用程序。因此,这是非常复杂的。
- 隐性重叠:重叠的可能性更高,尤其是在功能上。
OLAP的优点
- OLAP是一个平台,适用于所有类型的业务,包括计划、预算、报告和分析。
- 信息和计算在OLAP多维数据集中是一致的。这是一个至关重要的好处。
- 快速创建和分析“what if”场景。
- 轻松搜索OLAP数据库中的广泛或特定的术语。
- OLAP为业务建模工具、数据挖掘工具和性能报告工具提供了构建块。
- 允许用户通过各种维度、度量和过滤器对立方体数据进行切片和切割。
- 它对分析时间序列很有帮助。
- 使用OLAP很容易找到一些集群和异常值。
- 它是一个功能强大的可视化在线分析过程系统,提供更快的响应时间。
OLAP的缺点
- OLAP要求将数据组织成星型或雪花型模式。这些模式的实现和管理非常复杂。
- 在一个OLAP多维数据集中不可能有大量的维度。
- 事务数据不能通过OLAP系统访问。
- OLAP多维数据集中的任何修改都需要该多维数据集的完整更新。这个过程需要花费大量的时间。
总结:
- OLAP是一种允许分析人员从不同的角度提取和查看业务数据的技术。
- OLAP的核心概念是OLAP多维数据集。
- 各种业务应用程序和其他数据操作都需要使用OLAP Cube。
- OLAP分析操作主要有五种类型:1) Roll-up 2) Drill-down 3) Slice 4) Dice and 5) Pivot
- 三种广泛使用的OLAP系统是MOLAP、ROLAP和HOLAP。
- 桌面OLAP、Web OLAP和移动OLAP是OLAP系统的一些其他类型。
文章说明:
本文翻译自国外技术文章:https://www.guru99.com/online-analytical-processing.html
本文为九五青年博客翻译,如需转载请在下面留言,原文如有版权问题,在下面留言板反馈,我们会第一时间处理