‘Pentaho’ 分类的存档

  ETL过程中的主要环节就是数据抽取、数据转换和加工、数据装载。为了实现这些功能,各个ETL工具一般会进行一些功能上的扩充,例如工作流、调度引擎、规则引擎、脚本支持、统计信息等。

  2.1 数据抽取

  数据抽取是从数据源中抽取数据的过程。实际应用中,数据源较多采用的是关系数据库。从[……]

继续阅读

2010年1月29日01:17 | 没有评论
标签:

  摘要:本文主要介绍使用kettle 来建立一个Type 2的Slowly Changing Dimension 以及其中一些细节问题

  1. Kettle 简介

  Kettle 是一个强大的,元数据驱动的ETL工具被设计用来填补商业和IT之前的差距,将你公司的数据变成可增长的利润[……]

继续阅读

2010年1月29日01:04 | 没有评论
标签:

开源ETL项目介绍 之一 Kettle简介
因为项目的需要,需要了解一些开源的ETL工具,选中的ETL工具包括Kettle,CloverETL等。
本文和接下来的几篇文章要介绍一下这些工具的使用和其代码结构。
Kettle简介 Kettle : 该项目(http://www.kettle.be[……]

继续阅读

2010年1月25日02:27 | 没有评论
标签:

ETL中增量更新是一个比较依赖与工具和设计方法的过程,Kettle中主要提供Insert / Update 步骤,Delete 步骤和Database Lookup 步骤来支持增量更新,增量更新的设计方法也是根据应用场景来选取的,虽然本文讨论的是Kettle的实现方式,但也许对其他工具也有一些帮助。[……]

继续阅读

2010年1月21日19:47 | 没有评论
标签:
苏ICP备2021017351号