12
返回列表 发新帖
楼主: onunix

大表和小表进行merge join过程的效率分析

[复制链接]
论坛徽章:
8
2009新春纪念徽章
日期:2009-01-04 14:52:28祖国60周年纪念徽章
日期:2009-10-09 08:28:002010新春纪念徽章
日期:2010-03-01 11:07:24ITPUB9周年纪念徽章
日期:2010-10-08 09:32:25ITPUB十周年纪念徽章
日期:2011-11-01 16:23:262013年新春福章
日期:2013-02-25 14:51:24沸羊羊
日期:2015-03-04 14:51:522015年新春福章
日期:2015-03-06 11:57:31
11#
发表于 2008-8-9 18:35 | 只看该作者
那当然了,超级牛。。。呵呵。。。

使用道具 举报

回复
论坛徽章:
0
12#
发表于 2013-9-25 14:09 | 只看该作者
SMJ合并匹配记录的方法是,设结果集set1,set2内有已排序记录

set:   1 ,1,2,2,3,4,,6

=(做相等的smj)

set2: 2,2,3,3,4,5,6,6

装载排好序的两个结果集中的第一个 lowest col 数据。然后比较大小,

如果相等的话 就做笛卡尔积,然后把结果放到 输出缓存中。

如果假设set1的 lowest col比 set2的lowest col要小的话,那么就把set1的lowet col 数据丢弃掉。然后读取下一个loweset col 数据集(一定比上一个数据大)。

然后比较如果相等的话 就再做笛卡尔积,然后要把结果放到缓存中,如果缓存满了就flush,输出到客户端。

如果这时set2的lowest col 小了,那么久丢弃掉set2的 lowest col,然后要去读取 set2中 的下一个lowest col,然后要做比较。

直到两边的数据都弄完了才行。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表