楼主: pipihappy8888

【话题讨论】美剧遭封杀:大数据能否派的上用场?

[复制链接]
论坛徽章:
72
红旗
日期:2013-11-12 18:59:02比亚迪
日期:2013-11-07 18:36:27问答徽章
日期:2013-11-03 13:52:25日产
日期:2013-10-26 16:37:40ITPUB社区12周年站庆徽章
日期:2013-10-08 15:00:34ITPUB社区12周年站庆徽章
日期:2013-10-08 14:56:08ITPUB社区12周年站庆徽章
日期:2013-10-08 14:53:15雪佛兰
日期:2013-09-16 18:47:29雪佛兰
日期:2013-08-28 22:47:53日产
日期:2013-08-20 20:09:19
71#
发表于 2014-5-20 21:05 | 只看该作者
第一种方式是集大家所长,群众的眼睛是雪亮的,通过发起有奖调查举报活动,征集大家搜索美剧里面中国“高端黑”场景的蛛丝马迹,根据这些线索来删减视频片段。
这种方式不错,不过就是怕过犹不及,如果删减视频太多的话,视频被没有表达完它自己想表达的意思了,这对观众是一种伤害。

第二种方式是利用大数据的方式,整理出一批潜在的中国“高端黑”词汇(比如上例中举出的“山西”词汇),借助Hadoop分布式框架,通过MapReduce挖掘出美剧中匹配中国“高端黑”词汇
的Script脚本,这样就可以拧出含有“高端黑”场景的片段,然后再进行相应的剪辑。
和第一种异样,方法是不错,不过怕的也是过犹不及,如果匹配的词汇太多的话,我都不知道中文字幕怎么出才好,这个和百度搜索异样,太多的
敏感关键词,搞的人无意中搜索都失败,让人感觉很晦气。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表