原帖由 hyhongyong 于 2011-7-18 15:04 发表 Cassandra对group by这种汇总不支持,但是又需要汇总运算,一般采用什么方法解决这个问题?
使用道具 举报
原帖由 ban_ping 于 2011-7-19 13:50 发表 请问 gpcuster 对neo4j有研究吗?是一个成熟的项目吗?现在能应用到生产环境中吗?
原帖由 gpcuster 于 2011-7-18 14:15 发表 1 都不错,无论是Cassandra或者mongodb,Schema都不是固定的,你可以更加你的应用情况去增加列。 2 对于大文件,你可以采用拆分的办法来处理:比如5G的文件,你可以拆分成10M每一份,然后存储到Cassandra中,这样也能够充分发挥并行的作用。 __________________ 微博:http://weibo.com/gpcuster 论坛:http://bbs.data-works.org 博客:http://blog.data-works.org/
本版积分规则 发表回复 回帖后跳转到最后一页