楼主: husthxd

[原创] 使用Kettle同步数据

[复制链接]
论坛徽章:
20
ITPUB社区千里马徽章
日期:2013-06-09 10:15:34生肖徽章:猴
日期:2013-12-06 14:15:45生肖徽章:鸡
日期:2013-12-06 14:15:45生肖徽章:狗
日期:2013-12-06 14:15:45生肖徽章:猪
日期:2013-12-06 14:15:45SQL极客
日期:2013-12-09 14:13:35优秀写手
日期:2013-12-18 09:29:13青年奥林匹克运动会-羽毛球
日期:2014-09-23 15:12:43暖羊羊
日期:2015-03-04 14:54:57生肖徽章:羊
日期:2013-12-06 14:15:45
21#
发表于 2013-11-20 17:51 | 只看该作者
我想知道在原库中保留增删改的信息,通过什么方式实现比较好?

触发器?

使用道具 举报

回复
论坛徽章:
168
马上加薪
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:10:582012新春纪念徽章
日期:2012-01-04 11:49:54蜘蛛蛋
日期:2011-12-05 16:08:56ITPUB十周年纪念徽章
日期:2011-11-01 16:19:41设计板块每日发贴之星
日期:2011-07-22 01:01:02ITPUB官方微博粉丝徽章
日期:2011-06-30 12:30:16管理团队成员
日期:2011-05-07 01:45:082011新春纪念徽章
日期:2011-01-25 15:42:562011新春纪念徽章
日期:2011-01-25 15:42:33
22#
 楼主| 发表于 2013-11-20 17:56 | 只看该作者
lihy114 发表于 2013-11-20 17:51
我想知道在原库中保留增删改的信息,通过什么方式实现比较好?

触发器?

用触发器,单表还好,多表的话,运维也是一件麻烦事。
最好是通过etl工具本身来实现。

使用道具 举报

回复
论坛徽章:
20
ITPUB社区千里马徽章
日期:2013-06-09 10:15:34生肖徽章:猴
日期:2013-12-06 14:15:45生肖徽章:鸡
日期:2013-12-06 14:15:45生肖徽章:狗
日期:2013-12-06 14:15:45生肖徽章:猪
日期:2013-12-06 14:15:45SQL极客
日期:2013-12-09 14:13:35优秀写手
日期:2013-12-18 09:29:13青年奥林匹克运动会-羽毛球
日期:2014-09-23 15:12:43暖羊羊
日期:2015-03-04 14:54:57生肖徽章:羊
日期:2013-12-06 14:15:45
23#
发表于 2013-11-20 17:58 | 只看该作者
husthxd 发表于 2013-11-20 17:56
用触发器,单表还好,多表的话,运维也是一件麻烦事。
最好是通过etl工具本身来实现。

etl本事来实现?您的意思是说采用第二种方法,通过将原库和目标库中的数据进行合并再判断?

还是通过etl就能实现对原库的增删改的记录

使用道具 举报

回复
论坛徽章:
168
马上加薪
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:10:582012新春纪念徽章
日期:2012-01-04 11:49:54蜘蛛蛋
日期:2011-12-05 16:08:56ITPUB十周年纪念徽章
日期:2011-11-01 16:19:41设计板块每日发贴之星
日期:2011-07-22 01:01:02ITPUB官方微博粉丝徽章
日期:2011-06-30 12:30:16管理团队成员
日期:2011-05-07 01:45:082011新春纪念徽章
日期:2011-01-25 15:42:562011新春纪念徽章
日期:2011-01-25 15:42:33
24#
 楼主| 发表于 2013-11-21 10:38 | 只看该作者
lihy114 发表于 2013-11-20 17:58
etl本事来实现?您的意思是说采用第二种方法,通过将原库和目标库中的数据进行合并再判断?

还是通过e ...

etl工具不能实现对原库增删改的记录,但etl工具可以做到通过比较原库和目标库区分“增删改”的记录。
文档中有说明。

使用道具 举报

回复
论坛徽章:
20
ITPUB社区千里马徽章
日期:2013-06-09 10:15:34生肖徽章:猴
日期:2013-12-06 14:15:45生肖徽章:鸡
日期:2013-12-06 14:15:45生肖徽章:狗
日期:2013-12-06 14:15:45生肖徽章:猪
日期:2013-12-06 14:15:45SQL极客
日期:2013-12-09 14:13:35优秀写手
日期:2013-12-18 09:29:13青年奥林匹克运动会-羽毛球
日期:2014-09-23 15:12:43暖羊羊
日期:2015-03-04 14:54:57生肖徽章:羊
日期:2013-12-06 14:15:45
25#
发表于 2013-11-21 10:44 | 只看该作者
husthxd 发表于 2013-11-21 10:38
etl工具不能实现对原库增删改的记录,但etl工具可以做到通过比较原库和目标库区分“增删改”的记录。
文 ...

但是如果对于大数据量的话,用kettle来实现对原库和目标库的合并比较比较吃力吧···比如几百万的数据量,这种方法应该不可行吧

使用道具 举报

回复
论坛徽章:
168
马上加薪
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:10:582012新春纪念徽章
日期:2012-01-04 11:49:54蜘蛛蛋
日期:2011-12-05 16:08:56ITPUB十周年纪念徽章
日期:2011-11-01 16:19:41设计板块每日发贴之星
日期:2011-07-22 01:01:02ITPUB官方微博粉丝徽章
日期:2011-06-30 12:30:16管理团队成员
日期:2011-05-07 01:45:082011新春纪念徽章
日期:2011-01-25 15:42:562011新春纪念徽章
日期:2011-01-25 15:42:33
26#
 楼主| 发表于 2013-11-21 10:51 | 只看该作者
lihy114 发表于 2013-11-21 10:44
但是如果对于大数据量的话,用kettle来实现对原库和目标库的合并比较比较吃力吧···比如几百万的数据量 ...

不妨测试下。
我们试过几千万的数据,1个小时内可以完成。
测试的机器是普通pc server,windows系统。

使用道具 举报

回复
论坛徽章:
20
ITPUB社区千里马徽章
日期:2013-06-09 10:15:34生肖徽章:猴
日期:2013-12-06 14:15:45生肖徽章:鸡
日期:2013-12-06 14:15:45生肖徽章:狗
日期:2013-12-06 14:15:45生肖徽章:猪
日期:2013-12-06 14:15:45SQL极客
日期:2013-12-09 14:13:35优秀写手
日期:2013-12-18 09:29:13青年奥林匹克运动会-羽毛球
日期:2014-09-23 15:12:43暖羊羊
日期:2015-03-04 14:54:57生肖徽章:羊
日期:2013-12-06 14:15:45
27#
发表于 2013-11-21 13:30 | 只看该作者
husthxd 发表于 2013-11-21 10:51
不妨测试下。
我们试过几千万的数据,1个小时内可以完成。
测试的机器是普通pc server,windows系统。
...

这个需要根据业务场景来选择了,这两种方法对于小数据量我都试了;大数据量没有测试

使用道具 举报

回复
论坛徽章:
1
优秀写手
日期:2014-04-17 06:00:17
28#
发表于 2014-4-1 17:25 | 只看该作者
楼主请教个问题 合并记录完后的数据存到K1_TEST的表中,第一次是可以但第二次的时候K1_TEST中的表中就会有重复的数据了,就是说每执行一次就先要删除K1_TEST表中的数据后才能再添加?

使用道具 举报

回复
论坛徽章:
168
马上加薪
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:10:582012新春纪念徽章
日期:2012-01-04 11:49:54蜘蛛蛋
日期:2011-12-05 16:08:56ITPUB十周年纪念徽章
日期:2011-11-01 16:19:41设计板块每日发贴之星
日期:2011-07-22 01:01:02ITPUB官方微博粉丝徽章
日期:2011-06-30 12:30:16管理团队成员
日期:2011-05-07 01:45:082011新春纪念徽章
日期:2011-01-25 15:42:562011新春纪念徽章
日期:2011-01-25 15:42:33
29#
 楼主| 发表于 2014-4-2 09:11 | 只看该作者
zhjfit 发表于 2014-4-1 17:25
楼主请教个问题 合并记录完后的数据存到K1_TEST的表中,第一次是可以但第二次的时候K1_TEST中的表中就会有重 ...

K1_TEST算是临时表了,每次都要清除数据。

使用道具 举报

回复
论坛徽章:
1
优秀写手
日期:2014-04-17 06:00:17
30#
发表于 2014-4-2 11:09 | 只看该作者
husthxd 发表于 2014-4-2 09:11
K1_TEST算是临时表了,每次都要清除数据。

那我要每次运行这次转换就清空K1_TEST 要怎么弄?

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表