楼主: newkid

PUZZLEUP 2014

[复制链接]
论坛徽章:
520
奥运会纪念徽章:垒球
日期:2008-09-15 01:28:12生肖徽章2007版:鸡
日期:2008-11-17 23:40:58生肖徽章2007版:马
日期:2008-11-18 05:09:48数据库板块每日发贴之星
日期:2008-11-29 01:01:02数据库板块每日发贴之星
日期:2008-12-05 01:01:03生肖徽章2007版:虎
日期:2008-12-10 07:47:462009新春纪念徽章
日期:2009-01-04 14:52:28数据库板块每日发贴之星
日期:2009-02-08 01:01:03生肖徽章2007版:蛇
日期:2009-03-09 22:18:532009日食纪念
日期:2009-07-22 09:30:00
21#
 楼主| 发表于 2014-8-1 02:21 | 只看该作者
答案确实是AAB, 从12位到16位都是:

WITH t AS (
SELECT STR FROM (
SELECT REPLACE(SYS_CONNECT_BY_PATH(c,','),',') str,LEVEL lvl
  FROM (SELECT 'A' c FROM DUAL UNION ALL SELECT 'B' FROM DUAL)
WHERE LEVEL>=10 AND MOD(LEVEL,2)=0
CONNECT BY LEVEL<=16
)
WHERE LENGTH(REPLACE(str,'A'))=lvl/2
      AND INSTR(str,'AAA')>0
      AND INSTR(str,'AAB')>0
      AND INSTR(str,'ABA')>0
      AND INSTR(str,'ABB')>0
      AND INSTR(str,'BAA')>0
      AND INSTR(str,'BAB')>0
      AND INSTR(str,'BBA')>0
      AND INSTR(str,'BBB')>0
)
SELECT * FROM (
SELECT code,COUNT(DISTINCT str) cnt, RANK() OVER(ORDER BY COUNT(DISTINCT str) DESC) rnk
  FROM (
SELECT str,SUBSTR(str,lvl,3) code
  FROM t,(SELECT LEVEL lvl FROM DUAL CONNECT BY LEVEL<30)
WHERE lvl<=INSTR(str,'ABA')-1
)
GROUP BY code
)
WHERE rnk=1;

COD        CNT        RNK
--- ---------- ----------
AAB       4377          1

Elapsed: 00:00:15.86

使用道具 举报

回复
论坛徽章:
169
SQL数据库编程大师
日期:2016-01-13 10:30:43SQL极客
日期:2013-12-09 14:13:35SQL大赛参与纪念
日期:2013-12-06 14:03:45最佳人气徽章
日期:2015-03-19 09:44:03现任管理团队成员
日期:2015-08-26 02:10:00秀才
日期:2015-07-28 09:12:12举人
日期:2015-07-13 15:30:15进士
日期:2015-07-28 09:12:58探花
日期:2015-07-28 09:12:58榜眼
日期:2015-08-18 09:48:03
22#
发表于 2014-8-4 22:15 | 只看该作者
newkid 发表于 2014-8-1 02:21
答案确实是AAB, 从12位到16位都是:

WITH t AS (

  无他意,刚试了下sql,感觉我们这条sql跑的挺快的。

使用道具 举报

回复
论坛徽章:
41
生肖徽章:鼠
日期:2013-12-06 14:15:45生肖徽章:牛
日期:2013-12-06 14:15:45生肖徽章:虎
日期:2013-12-06 14:15:45生肖徽章:兔
日期:2013-12-06 14:15:45生肖徽章:龙
日期:2013-12-06 14:15:45生肖徽章:蛇
日期:2013-12-06 14:15:45生肖徽章:马
日期:2013-12-06 14:15:45生肖徽章:羊
日期:2013-12-06 14:15:45生肖徽章:猴
日期:2013-12-06 14:15:45生肖徽章:鸡
日期:2013-12-06 14:15:45
23#
发表于 2014-8-5 08:24 | 只看该作者
#2 Code Game  。 什么时候出?

使用道具 举报

回复
论坛徽章:
407
紫蛋头
日期:2012-05-21 10:19:41迷宫蛋
日期:2012-06-06 16:02:49奥运会纪念徽章:足球
日期:2012-06-29 15:30:06奥运会纪念徽章:排球
日期:2012-07-10 21:24:24鲜花蛋
日期:2012-07-16 15:24:59奥运会纪念徽章:拳击
日期:2012-08-07 10:54:50奥运会纪念徽章:羽毛球
日期:2012-08-21 15:55:33奥运会纪念徽章:蹦床
日期:2012-08-21 21:09:51奥运会纪念徽章:篮球
日期:2012-08-24 10:29:11奥运会纪念徽章:体操
日期:2012-09-07 16:40:00
24#
发表于 2014-8-5 08:59 | 只看该作者
peter1166 发表于 2014-8-5 08:24
#2 Code Game  。 什么时候出?

2周1题

使用道具 举报

回复
论坛徽章:
484
ITPUB北京香山2007年会纪念徽章
日期:2007-01-24 14:35:02ITPUB北京九华山庄2008年会纪念徽章
日期:2008-01-21 16:50:24ITPUB北京2009年会纪念徽章
日期:2009-02-09 11:42:452010新春纪念徽章
日期:2010-03-01 11:04:552010数据库技术大会纪念徽章
日期:2010-05-13 10:04:272010系统架构师大会纪念
日期:2010-09-04 13:35:54ITPUB9周年纪念徽章
日期:2010-10-08 09:28:512011新春纪念徽章
日期:2011-02-18 11:43:32ITPUB十周年纪念徽章
日期:2011-11-01 16:19:412012新春纪念徽章
日期:2012-01-04 11:49:54
25#
发表于 2014-8-5 09:29 | 只看该作者
试考察最短的文本组合 aaababbbaa ,其包含了八组可能的组合
aaa/aab/aba/bab/abb/bbb/bba/baa

在这个10字符的排列里,A占据了6个,B占据了4个,A和B并不是等概率出现的
这10个字符通过平移字符的方式,其等价变换如下:
aaababbbaa
aababbbaaa
ababbbaaab   --此时a和b等概率出现
babbbaaaba
abbbaaabab
bbbaaababb
bbaaababbb
baaababbba

镜像字符的方式也是可以等价的,例如
aaababbbaa
镜像后,是
aabbbabaaa
这和刚才的第七种变化实际上等价(a和b对调了而已)
bbaaababbb
所以,从概率上来说,只需要考虑上面列的8种情况即可

使用道具 举报

回复
论坛徽章:
484
ITPUB北京香山2007年会纪念徽章
日期:2007-01-24 14:35:02ITPUB北京九华山庄2008年会纪念徽章
日期:2008-01-21 16:50:24ITPUB北京2009年会纪念徽章
日期:2009-02-09 11:42:452010新春纪念徽章
日期:2010-03-01 11:04:552010数据库技术大会纪念徽章
日期:2010-05-13 10:04:272010系统架构师大会纪念
日期:2010-09-04 13:35:54ITPUB9周年纪念徽章
日期:2010-10-08 09:28:512011新春纪念徽章
日期:2011-02-18 11:43:32ITPUB十周年纪念徽章
日期:2011-11-01 16:19:412012新春纪念徽章
日期:2012-01-04 11:49:54
26#
发表于 2014-8-5 09:33 | 只看该作者
本帖最后由 lastwinner 于 2014-8-5 09:33 编辑

各组排列中,在aba之前的组合
aaababbbaa ,aaa、aab
aababbbaaa ,aab
ababbbaaab  ,NULL
babbbaaaba ,所有其他组合
abbbaaabab ,除了bab之外的其他组合
bbbaaababb ,除了bab、abb之外的其他组合
bbaaababbb ,除了bab、abb、bbb之外的其他组合
baaababbba ,baa、aaa、aab

综上,aab出现得最多,多达7次,因此答案是aab。其次是aaa,再次是baa

使用道具 举报

回复
论坛徽章:
484
ITPUB北京香山2007年会纪念徽章
日期:2007-01-24 14:35:02ITPUB北京九华山庄2008年会纪念徽章
日期:2008-01-21 16:50:24ITPUB北京2009年会纪念徽章
日期:2009-02-09 11:42:452010新春纪念徽章
日期:2010-03-01 11:04:552010数据库技术大会纪念徽章
日期:2010-05-13 10:04:272010系统架构师大会纪念
日期:2010-09-04 13:35:54ITPUB9周年纪念徽章
日期:2010-10-08 09:28:512011新春纪念徽章
日期:2011-02-18 11:43:32ITPUB十周年纪念徽章
日期:2011-11-01 16:19:412012新春纪念徽章
日期:2012-01-04 11:49:54
27#
发表于 2014-8-5 14:40 | 只看该作者
本帖最后由 lastwinner 于 2014-8-5 16:18 编辑

上述8组,在镜像后,还寻找在aba之前的
aabbbabaaa ,除baa、aaa
aaabbbabaa ,除baa
baaabbbaba ,所有其他组合
abaaabbbab ,NULL
babaaabbba ,bab
bbabaaabbb ,bba、bab
bbbabaaabb ,bbb、bba、bab
abbbabaaab ,abb、bbb、bba、bab
此时aab仅占3次,bab最多,是7次,其次是bba,6次,再次是bbb,5次



两次总的来看,aab总计10次,依然是最高。
上述推导还不完整,上述只能证明,当字符串都按最小组合出现时,aab最佳。
实际上10字符的组合,共有power(2,10)种,大多数组合里重复的字符串很多,例如aaaaaaabaa,光aaa就有4个。
而上面仅仅是其中的16个组合,尚需证明在其余的组合里,aab的优势最大,这个没法通过数据总体上分布均匀,A和B出现的总次数相等之类的来证明其余的组合里aab优势最大。

使用道具 举报

回复
论坛徽章:
484
ITPUB北京香山2007年会纪念徽章
日期:2007-01-24 14:35:02ITPUB北京九华山庄2008年会纪念徽章
日期:2008-01-21 16:50:24ITPUB北京2009年会纪念徽章
日期:2009-02-09 11:42:452010新春纪念徽章
日期:2010-03-01 11:04:552010数据库技术大会纪念徽章
日期:2010-05-13 10:04:272010系统架构师大会纪念
日期:2010-09-04 13:35:54ITPUB9周年纪念徽章
日期:2010-10-08 09:28:512011新春纪念徽章
日期:2011-02-18 11:43:32ITPUB十周年纪念徽章
日期:2011-11-01 16:19:412012新春纪念徽章
日期:2012-01-04 11:49:54
28#
发表于 2014-8-5 14:48 | 只看该作者
newkid 发表于 2014-8-1 02:21
答案确实是AAB, 从12位到16位都是:

WITH t AS (

你这个条件 WHERE LENGTH(REPLACE(str,'A'))=lvl/2
从逻辑上说是不对的,举个简单的例子,就这三字节的八个组合,从整体上看,A、B的分布是均匀,不能因此就直接不考虑这三字节的组合。当然,我们最小要从4字节的字符串来考虑,否则组合只出现一次,何来先后?

实际上我认为应该通过数学归纳法来证明,假如在4字节的字符串里aab占优,在5字节的字符串里aab也占优,那么证明出6字节的字符串里aab也是占优的,就严密了

考虑字符串的最后两位,只可能是
aa
ab
ba
bb
四种,当字符串长度增加1时,我们可以将其只加到字符串的末尾,于是就有8种情况
aaa
aab
aba
abb
baa
bab
bba
bbb

这八种情况无论是哪种出现,都不改变之前的某组合占优情况,因为除了aba之外的其余7种各出现了一次
因此剩下的事情,就是用sql计算出4字符串和5字符串里,均最占优的组合,就是要求的结果

使用道具 举报

回复
论坛徽章:
520
奥运会纪念徽章:垒球
日期:2008-09-15 01:28:12生肖徽章2007版:鸡
日期:2008-11-17 23:40:58生肖徽章2007版:马
日期:2008-11-18 05:09:48数据库板块每日发贴之星
日期:2008-11-29 01:01:02数据库板块每日发贴之星
日期:2008-12-05 01:01:03生肖徽章2007版:虎
日期:2008-12-10 07:47:462009新春纪念徽章
日期:2009-01-04 14:52:28数据库板块每日发贴之星
日期:2009-02-08 01:01:03生肖徽章2007版:蛇
日期:2009-03-09 22:18:532009日食纪念
日期:2009-07-22 09:30:00
29#
 楼主| 发表于 2014-8-6 00:00 | 只看该作者
lastwinner 发表于 2014-8-5 14:48
你这个条件 WHERE LENGTH(REPLACE(str,'A'))=lvl/2
从逻辑上说是不对的,举个简单的例子,就这三字节的八 ...

那就要看怎么理解题意了。
我的理解是TEXT中一半字符是A, 另外一半是B,所以才有这个WHERE。如果不是这么理解,出现概率就等于废话了。
按题目要求,在“同一个”TEXT中要"同时"包含八种代码。所以最小长度为10。小于10的就不用考虑。

使用道具 举报

回复
论坛徽章:
520
奥运会纪念徽章:垒球
日期:2008-09-15 01:28:12生肖徽章2007版:鸡
日期:2008-11-17 23:40:58生肖徽章2007版:马
日期:2008-11-18 05:09:48数据库板块每日发贴之星
日期:2008-11-29 01:01:02数据库板块每日发贴之星
日期:2008-12-05 01:01:03生肖徽章2007版:虎
日期:2008-12-10 07:47:462009新春纪念徽章
日期:2009-01-04 14:52:28数据库板块每日发贴之星
日期:2009-02-08 01:01:03生肖徽章2007版:蛇
日期:2009-03-09 22:18:532009日食纪念
日期:2009-07-22 09:30:00
30#
 楼主| 发表于 2014-8-6 00:01 | 只看该作者
Naldonado 发表于 2014-8-4 22:15
无他意,刚试了下sql,感觉我们这条sql跑的挺快的。

你们的计划是怎么样的,ORACLE的计划又是怎么样的?

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表