|
我在另一个帖子提到过
“现有的ETL工具都支持多种手段实现ETL,而更易维护、更易快速复制开发的手段则必须有一个统一的规范。就像去年我放开团队去开发ETL,结果即便总体规范和思路统一,但实际具体到逐个的mapping,以及session设置、workflow调度,都有很多明显差异,导致后期较难维护。
工具给的规范都是泛泛的,我这里说的标准,可能需要详细到某个细节该怎么处理。如汇总,按照工具的特性,就是在mapping里需要先sort再agg,处理mapping之前的事务,就只能调用统一开发的SP,而不能在session里pre sql里写SQL!这些细节必须规范,而工具的规范不会这么细,而作为团队的大批量开发,你必须细到这个程度,形成标准!!” |
|