生产厂商:Qlik产品类别:系统工具
Qlik Compose for Data Lakes您最快的分析就绪型数据
自动化分析就绪的数据管道
适用于Data Lakes的Qlik Compose(以前称为Data Lakes的Attunity Compose)使您的数据管道自动化,以创建可用于分析的数据集。通过自动执行数据提取,架构创建和持续更新,组织可以从现有的数据湖投资中更快地实现价值。
通用数据提取
- Qlik Compose for Data Lakes支持最广泛的数据源之一,无论数据是在本地,在云中还是在混合环境中,都可以将数据提取到您的数据湖中。资料包括:
- RDBMS:DB2,MySQL,Oracle,PostgreSQL,SQL Server,Sybase
- 数据仓库:Exadata,IBM Netezza,Pivotal,Teradata,Vertica
- Hadoop:Apache Hadoop,Cloudera,Hortonworks,MapR
- 云:Amazon Web Services,Microsoft Azure,Google Cloud
- 消息系统:Apache Kafka
- 企业应用程序:SAP
- 旧版系统:DB2 z / OS,IMS / DB,RMS,VSAM
- 简单的数据结构和转换
- 直观,指导性的用户界面可帮助您构建,建模和执行数据湖管道。
- 自动为操作数据存储(ODS)和历史数据存储(HDS)生成架构和Hive目录结构,而无需手动编码。
持续更新
- 确信您的ODS和HDS可以准确地代表您的源系统。
- 使用变更数据捕获(CDC)以更少的管理和处理开销实现实时分析。
- 通过并行线程有效地处理初始加载。
- 利用具有事务一致性的基于时间的分区,以确保仅处理在指定时间内完成的事务。
利用最新技术
- 利用Hive SQL和Apache Spark的优势,包括:
- Hive SQL的最新改进包括ACID MERGE操作,该操作可在确保数据完整性的同时有效处理数据的插入,更新和删除。
- 下推处理到Hadoop或Spark引擎。当数据流过管道时,自动生成的转换逻辑将被下推到Hadoop或Spark进行处理。
历史数据存储
- 从完整的历史数据存储(HDS)中导出特定于分析的数据集。
- 当数据更新从源系统到达时,新行将自动附加到HDS。
- 新的HDS记录会自动加上时间戳,从而可以创建趋势分析和其他面向时间的分析数据集市。
- 支持包括Type-2的数据模型,从而减缓了尺寸变化的速度。