|
ETL工具太多了,每个数据库/仓库厂商都提供,还有好多三方厂家提供的。Oracle有OWB,DB2有WareHouse Manager。。。,三方比较流行的是Ascential的DataStage。如果采用工具,就得看实际得应用了,如果在整个系统中只有DB2数据库,那么WareHouse Manager当然是首选,她可以利用DB2好多特用的功能,如EEE Load等,但是缺点是需要单独的一台Windows NT服务器,造价倒是不算高,但是Windows平台的稳定性太成问题。如果数据源异常复杂,选用工具还是使用三方的产品比较好,对数据源的广谱支持更好些。
如果提取逻辑非常复杂,任何工具中都需要自己写嵌入代码来实现。
我自己的考虑是自己开发,这样既可以节省掉买ETL服务器和ETL软件的开销(一笔不小的数目),又可以利用各种数据源/数据仓库的特殊功能,况且各种ETL软件都需要一个熟悉使用的过程,DataStage还容易掌握一些,Warehouse Manager稍困难点,但是至少也需要一个星期的时间去摸索。 |
|