ITPUB论坛-中国最专业的IT技术社区

 找回密码
 注册
查看: 4201|回复: 3

[每日一题] PL/SQL Challenge 每日一题:2017-5-25 12C新特性: MATCH_RECOGNIZE

[复制链接]
论坛徽章:
482
秀才
日期:2015-09-09 10:33:01秀才
日期:2015-11-23 10:03:12秀才
日期:2015-11-23 10:03:12秀才
日期:2015-11-23 10:03:12秀才
日期:2015-11-23 10:03:12秀才
日期:2015-11-23 10:03:12秀才
日期:2015-11-23 10:03:12状元
日期:2015-11-23 10:04:09举人
日期:2015-11-23 10:04:09秀才
日期:2016-01-06 14:10:21
发表于 2017-6-1 05:27 | 显示全部楼层 |阅读模式


最先答对且答案未经编辑的puber将获得纪念章一枚(答案不可编辑但可发新贴补充或纠正),其他会员如果提供有价值的分析、讨论也可获得纪念章一枚。

每两周的优胜者可获得itpub奖励的技术图书一本。

以往旧题索引:
http://www.itpub.net/forum.php?m ... eid&typeid=1808

原始出处:
http://www.plsqlchallenge.com/

作者:        Kim Berg Hansen

运行环境:SQLPLUS, SERVEROUTPUT已打开
注:本题给出答案时候要求给予简要说明才能得到奖品

注:本题执行环境为12CR1或更高版本

我们有一张表,存储着每天访客的数量:

create table qz_visits (
   visiting_date  date
, visitor_count  integer
)
/

insert into qz_visits values (date '2017-05-01', 100)
/
insert into qz_visits values (date '2017-05-02',  60)
/
insert into qz_visits values (date '2017-05-03', 150)
/
insert into qz_visits values (date '2017-05-04',  55)
/
insert into qz_visits values (date '2017-05-05',  65)
/
insert into qz_visits values (date '2017-05-06',  45)
/
insert into qz_visits values (date '2017-05-07', 110)
/
insert into qz_visits values (date '2017-05-08', 105)
/
insert into qz_visits values (date '2017-05-09',  50)
/
insert into qz_visits values (date '2017-05-10', 125)
/
insert into qz_visits values (date '2017-05-11',  60)
/
commit
/

我们每天恰好存储一行,表中没有任何间隙(没有缺少的日期)。

我们想要查找访客数的“短峰”。“短峰”的定义是这样一个日期,该日期的访客数至少(大于或等于)是前一天的两倍并且至少是后一天的两倍。

哪些选项包含的查询会找出这样的峰值,得到如下结果:

SPIKE_DATE
----------
2017-05-03
2017-05-10

注意:下列格式被用于输出:

alter session set nls_date_format = 'YYYY-MM-DD'
/

(A)
select visiting_date as spike_date
  from (
   select visiting_date
        , lag( visitor_count) over (order by visiting_date) lag_count
        , visitor_count
        , lead(visitor_count) over (order by visiting_date) lead_count
     from qz_visits
  )
where lag_count  <= visitor_count / 2
   and lead_count <= visitor_count / 2
order by spike_date
/

(B)
select visiting_date as spike_date
  from qz_visits
where lag( visitor_count) over (
          order by visiting_date
       ) <= visitor_count / 2
   and lead(visitor_count) over (
          order by visiting_date
       ) <= visitor_count / 2
order by spike_date
/
(C)
select spike_date
  from qz_visits
match_recognize (
   order by visiting_date
   measures
      a_row.visiting_date as spike_date
   pattern ( lag_half a_row lead_half )
   define
      lag_half  as visitor_count <= next(visitor_count) / 2
    , lead_half as visitor_count <= prev(visitor_count) / 2
)
order by spike_date
/

(D)
select spike_date
  from qz_visits
match_recognize (
   order by visiting_date
   measures
      a_row.visiting_date as spike_date
   pattern ( half a_row half )
   define
      half as half.visitor_count <= a_row.visitor_count / 2
)
order by spike_date
/

(E)
select spike_date
  from qz_visits
match_recognize (
   order by visiting_date
   measures
      double.visiting_date as spike_date
   pattern ( a_row double half )
   define
      double as visitor_count >= prev(visitor_count) * 2
    , half   as visitor_count <= prev(visitor_count) / 2
)
order by spike_date
/

(F)
select spike_date
  from qz_visits
match_recognize (
   order by visiting_date
   measures
      double.visiting_date as spike_date
   pattern ( double )
   define
      double as    visitor_count >= prev(visitor_count) * 2
               and visitor_count >= next(visitor_count) * 2
)
order by spike_date
/

论坛徽章:
394
阿斯顿马丁
日期:2014-01-03 13:53:522014年世界杯参赛球队:喀麦隆
日期:2014-07-11 12:10:53马上有对象
日期:2014-04-09 16:19:542014年世界杯参赛球队: 洪都拉斯
日期:2014-06-25 08:25:55itpub13周年纪念徽章
日期:2014-09-28 10:55:55itpub13周年纪念徽章
日期:2014-10-01 15:27:22itpub13周年纪念徽章
日期:2014-10-09 12:04:18马上有钱
日期:2014-10-14 21:37:37马上有钱
日期:2015-01-22 00:39:13喜羊羊
日期:2015-02-20 22:26:07
发表于 2017-6-1 14:25 | 显示全部楼层
这个功能在生产中用到吗

使用道具 举报

回复
论坛徽章:
260
乌索普
日期:2016-07-29 01:46:29白羊座
日期:2016-05-23 11:49:19双鱼座
日期:2016-04-29 17:13:05秀才
日期:2016-04-29 15:03:39秀才
日期:2016-04-29 15:04:10技术图书徽章
日期:2016-04-29 15:04:10秀才
日期:2016-03-28 10:21:13巨蟹座
日期:2016-03-26 21:14:25水瓶座
日期:2016-03-24 22:16:36摩羯座
日期:2016-03-17 15:09:14
发表于 2017-6-1 20:16 | 显示全部楼层
ACEF

A: 利用lag,lead分析函数 OK,
B: 分析函数不能直接应用到WHERE子句中,一般只用着SELECT 子句中
C: match_recognize 正确使用
D: DEFINE 子句中比较当前行的访客数和前一行的访客数以及后一行的访客数,
   要用的NEXT(),PREV()函数
E: 根据pattern匹配模式,double当前行 >= 前一行a_row的两倍
                        half 后一行 <= 当前行/2 所以这样匹配逻辑也是OK的                       
F: double当前行 >= 前一行访客的两倍,并且>=后一行访客的两倍  

使用道具 举报

回复
论坛徽章:
482
秀才
日期:2015-09-09 10:33:01秀才
日期:2015-11-23 10:03:12秀才
日期:2015-11-23 10:03:12秀才
日期:2015-11-23 10:03:12秀才
日期:2015-11-23 10:03:12秀才
日期:2015-11-23 10:03:12秀才
日期:2015-11-23 10:03:12状元
日期:2015-11-23 10:04:09举人
日期:2015-11-23 10:04:09秀才
日期:2016-01-06 14:10:21
 楼主| 发表于 2017-6-2 03:52 | 显示全部楼层
答案ACEF, 3楼得奖。

A: 利用内联视图中的分析函数LAG 和 LEAD ,我们每行得到三个值:前一天、当天和后一天的总数。在外层查询中,很容易就过滤出那些前一天和后一天都不多于当天一半的数据行。
B: 但是,我们不能将分析函数用在WHERE子句。要在分析函数的结果上进行过滤,就得用选项A的办法。这个选项会报错:
ORA-30483: window functions are not allowed here.
C:这个模式匹配子句将一个行定义为LAG_HALF,假如它的总数不多于第二天总数的一半。类似地,一个行被定义为LEAD_HALF,如果它的总数不多于前一天总数的一半。然后要搜索的行模式就是那些前面有一个LAG_HALF并且后面跟着LEAD_HALF的数据行。

D: 这是个诱人的简短定义,但它不是这么运作的。这个选项匹配不到数据,不会返回任何结果。
E: 不同于C选项把A_ROW放在中间,我们也可以从A_ROW开始,然后利用DOUBLE 和 HALF的定义来查找相对于开始行而不是中间行的尖峰。然后measure子句必需输出DOUBLE行的日期来得到想要的结果。
F: 我们要可以跳过E选项的HALF行定义,而是扩展DOUBLE的条件,让它表示一个行至少是前一天和后一天的双倍。于是模式变得很简单,只要查找符合DOUBLE条件的行就行。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

SACC2017购票8.8折优惠进行时

2017中国系统架构师大会(SACC2017)将于10月19-21日在北京新云南皇冠假日酒店震撼来袭。今年,大会以“云智未来”为主题,云集国内外顶级专家,围绕云计算、人工智能、大数据、移动互联网、产业应用等热点领域展开技术探讨与交流。本届大会共设置2大主会场,18个技术专场;邀请来自互联网、金融、制造业、电商等多个领域,100余位技术专家及行业领袖来分享他们的经验;并将吸引4000+人次的系统运维、架构师及IT决策人士参会,为他们提供最具价值的交流平台。
----------------------------------------
优惠时间:2017年8月30日前

活动链接>>
TOP技术积分榜 社区积分榜 徽章 电子杂志 团队 统计 虎吧 老博客 知识索引树 读书频道 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档 | IT博客
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛 | SAP ERP系统
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 网站律师 隐私政策 知识产权声明
京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表