楼主: pipihappy8888

【话题讨论】美剧遭封杀:大数据能否派的上用场?

[复制链接]
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
61#
 楼主| 发表于 2014-5-6 10:40 | 只看该作者
arron刘 发表于 2014-5-6 10:22
这个和技术有半毛钱关系么?

关键问题是怎么在美剧中细数出“高端黑中国”的场景呢?这个问题是否如大海捞针一样深不可测呢?美剧遭封杀,大数据能否派的上用场?美剧中存在大量涉黑的台词,通过大数据分析是否可以完成涉黑台词的屏蔽或者捕获?小编想出了两招,小伙伴们觉得哪种方式好?或者另有高招?本期话题诚邀各位小伙伴们晒晒自己的Idea!

使用道具 举报

回复
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
62#
 楼主| 发表于 2014-5-6 10:40 | 只看该作者
jiangdz5123 发表于 2014-5-5 13:26
不知道该说的啥呢

第一种方式是集大家所长,群众的眼睛是雪亮的,通过发起有奖调查举报活动,征集大家搜索美剧里面中国“高端黑”场景的蛛丝马迹,根据这些线索来删减视频片段。

第二种方式是利用大数据的方式,整理出一批潜在的中国“高端黑”词汇(比如上例中举出的“山西”词汇),借助Hadoop分布式框架,通过MapReduce挖掘出美剧中匹配中国“高端黑”词汇的Script脚本,这样就可以拧出含有“高端黑”场景的片段,然后再进行相应的剪辑。

使用道具 举报

回复
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
63#
 楼主| 发表于 2014-5-6 10:41 | 只看该作者
jieforest 发表于 2014-4-30 15:28
要做到很容易:
对于很多视频格式,字幕文件是单独的文件,而不是像RMVB那样嵌入了视频。而且字幕文件是文 ...

说得不错,从视频文件上入手难度太大,从字幕文件上对字符进行切割比对,利用MapReduce行数做统计查找。

使用道具 举报

回复
论坛徽章:
277
马上加薪
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有车
日期:2014-02-19 11:55:14马上有车
日期:2014-02-18 16:41:112014年新春福章
日期:2014-02-18 16:41:11版主9段
日期:2012-11-25 02:21:03ITPUB年度最佳版主
日期:2014-02-19 10:05:27现任管理团队成员
日期:2011-05-07 01:45:08
64#
发表于 2014-5-6 10:57 | 只看该作者
pipihappy8888 发表于 2014-5-6 10:41
说得不错,从视频文件上入手难度太大,从字幕文件上对字符进行切割比对,利用MapReduce行数做统计查找。

有坛友让我不要把解决方法暴露出来,所以我把解决方法删除了。

使用道具 举报

回复
论坛徽章:
1
2011新春纪念徽章
日期:2011-02-18 11:43:32
65#
发表于 2014-5-7 23:30 | 只看该作者
以前没注意看,不知道现在还有其他方式看历史的吗?

使用道具 举报

回复
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
66#
 楼主| 发表于 2014-5-8 09:10 | 只看该作者
jieforest 发表于 2014-5-6 10:57
有坛友让我不要把解决方法暴露出来,所以我把解决方法删除了。

没必要啊,通过现象看本质,外行看热闹,内行看门道。

使用道具 举报

回复
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
67#
 楼主| 发表于 2014-5-8 09:11 | 只看该作者
pipihappy8888 发表于 2014-5-8 09:10
没必要啊,通过现象看本质,外行看热闹,内行看门道。

关于MapReduce,功能如此强大,能真正领悟的人算得上是高手了。

使用道具 举报

回复
论坛徽章:
0
68#
发表于 2014-5-9 11:50 | 只看该作者
怎么封杀也杀不完的,上有政策,下有对策!

使用道具 举报

回复
论坛徽章:
4
2014年新春福章
日期:2014-02-18 16:41:11马上有车
日期:2014-02-18 16:41:11喜羊羊
日期:2015-03-04 14:49:392015年新春福章
日期:2015-03-06 11:57:31
69#
发表于 2014-5-13 23:01 | 只看该作者
围观

《神盾局》  很好看!  都是帅哥美女~

使用道具 举报

回复
论坛徽章:
249
Jeep
日期:2013-09-04 19:17:57Jeep
日期:2013-10-08 09:46:02Jeep
日期:2013-10-08 16:38:27Jeep
日期:2013-11-22 14:53:46Jeep
日期:2013-11-08 23:59:45Jeep
日期:2013-11-22 17:15:17Jeep
日期:2013-11-22 17:15:17Jeep
日期:2013-11-17 09:59:04季节之章:夏
日期:2015-01-28 14:58:51季节之章:春
日期:2014-12-25 16:20:50
70#
发表于 2014-5-17 22:23 | 只看该作者
围观 围观

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表