楼主: ~贝贝~

国内Cassandra领域先驱者"郭鹏"做客ITPUB活动结束,获奖名单公布

[复制链接]
论坛徽章:
0
51#
发表于 2011-7-16 00:41 | 只看该作者
支持。我的数据库技术还不高,希望以后有机会拜读大作《Cassandra实战》!

使用道具 举报

回复
论坛徽章:
0
52#
发表于 2011-7-18 13:59 | 只看该作者
原帖由 kw002007 于 2011-7-13 12:28 发表
Cassandra 是干啥的?

简单来说,就是一个分布式的存储系统。

使用道具 举报

回复
论坛徽章:
0
53#
发表于 2011-7-18 14:05 | 只看该作者
原帖由 bluemoon0083 于 2011-7-13 13:33 发表
Cassandra和其他nosql比较有什么优缺点?
Cassandra最适合于哪些应用或场景?不适合哪些应用或场景?
对于传统数据库DBA是否有必要学习Cassandra或者nosql?如果学的话有什么建议?
Cassandra,nosql市场前景如何?从业人员待遇水平如何?
此技术当前虽然很火,但是否会昙花一现?是否会在短期内被其他技术或理论代替?

不好意思问题比较多

1,2 具体可以参考:http://nosql-database.org/
3 还是有一定的必要的,通过了解NoSQL,能够发现不同产品的优缺点,能够更加全面地去发现问题和解决问题。学习起来可以先看看论文和相关数据,了解理论,再就是实践。
4 nosql的前景很火。我看到过一个图片,可以参考一下附件。
5 NoSQL和云计算是未来发展的趋势。


__________________
微博:http://weibo.com/gpcuster
论坛:http://bbs.data-works.org
博客:http://blog.data-works.org/

[ 本帖最后由 gpcuster 于 2011-7-18 14:36 编辑 ]

indeed-nosql-average-salary.jpg (88.97 KB, 下载次数: 19)

indeed-nosql-average-salary.jpg

使用道具 举报

回复
论坛徽章:
0
54#
发表于 2011-7-18 14:09 | 只看该作者
原帖由 buptdream 于 2011-7-13 14:50 发表
Cassandra与其他数据库的优势在什么地方?目前oracle在内存实时计算方面存在不足,Cassandra能够很好的实现大内存的计算吗?

Cassandra在分布式计算如何保证数据的多并发性和一致性?


--Cassandra与其他数据库的优势在什么地方?目前oracle在内存实时计算方面存在不足,Cassandra能够很好的实现大内存的计算吗?
优势主要还在在于其强大的扩展性。能够存储海量的数据。Cassandra本身不提供计算的功能,但是可以配合MapReduce进行海量的数据分析。


--Cassandra在分布式计算如何保证数据的多并发性和一致性?
Cassandra内部实现的使用,使用了SEDA的架构,保证了高并发的特性。另外通过控制读写的分数来保证数据的一致性。

__________________
微博:http://weibo.com/gpcuster
论坛:http://bbs.data-works.org
博客:http://blog.data-works.org/

使用道具 举报

回复
论坛徽章:
0
55#
发表于 2011-7-18 14:12 | 只看该作者
原帖由 oradbHome 于 2011-7-13 16:04 发表
Cassandra这个名字有什么含义?
它的应用场景是怎么样的?
如果有一个基于数据库的应用,如何迁移到cassndra,有什么限制?


1,2 之前的回答有介绍
3 根据问题的复杂程度可能要重新设计底层的数据模型。毕竟Cassandra不支持Join,Group by等计算的操作,要想办法从设计上面去规避。

__________________
微博:http://weibo.com/gpcuster
论坛:http://bbs.data-works.org
博客:http://blog.data-works.org/

使用道具 举报

回复
论坛徽章:
0
56#
发表于 2011-7-18 14:15 | 只看该作者
原帖由 xiaosanaiq 于 2011-7-13 16:24 发表
目前我在的行业面临的问题:
1、虽然是同一硬件,采集下来的数据列数是变化的,列名也变化。请问Cassandra或者mongodb哪个更适合这样的场景一些?
2、对于图像或整集图片(1-5g之间,通常是2、3g),cassandra有什么应对策略吗?。。


1 都不错,无论是Cassandra或者mongodb,Schema都不是固定的,你可以更加你的应用情况去增加列。
2 对于大文件,你可以采用拆分的办法来处理:比如5G的文件,你可以拆分成10M每一份,然后存储到Cassandra中,这样也能够充分发挥并行的作用。


__________________
微博:http://weibo.com/gpcuster
论坛:http://bbs.data-works.org
博客:http://blog.data-works.org/

使用道具 举报

回复
论坛徽章:
0
57#
发表于 2011-7-18 14:18 | 只看该作者
原帖由 totticarter 于 2011-7-14 00:54 发表
我们公司就是在基于cassandra 0.7.x做开发,支持移动的139社区和一个电子医疗项目,我们自己添加了SQL引擎,支持绝大多数的SQL操作,我一直不明白的是在一个NoSQL的系统上添加了SQL的功能,是不是改变了cassandra这个NoSQL数据库系统的初衷呢?即把非关系型的数据库又改成了关系型的数据了



Cassandra自身也提供一些类似于SQL的接口,比如CQL:http://blog.data-works.org/2010/ ... anguage%EF%BC%89-2/

其实无论是你们自己封装的SQL接口还是官方提供的CQL,都只是把用户的查询转换成了Cassandra的接口,提供的功能还是一模一样的。

__________________
微博:http://weibo.com/gpcuster
论坛:http://bbs.data-works.org
博客:http://blog.data-works.org/

使用道具 举报

回复
论坛徽章:
0
58#
发表于 2011-7-18 14:21 | 只看该作者
原帖由 hanaka 于 2011-7-15 15:40 发表
1、Cassandra等是不是都是开源的啊?开源的东东总觉得服务是个问题?
2、核心数据敢用NoSQL嘛?


1 Cassandra是开源的。开源软件的好处是你可以了解底层的所有细节,并且可以根据自己应用的需求修改底层代码。但是不会有专门的人给你提供服务和技术咨询,除非你花钱

2 其实不管是NoSQL还是SQL,都是软件,都用来保存数据。只是现在SQL的使用更加普遍而已。

__________________
微博:http://weibo.com/gpcuster
论坛:http://bbs.data-works.org
博客:http://blog.data-works.org/

使用道具 举报

回复
论坛徽章:
0
59#
发表于 2011-7-18 14:35 | 只看该作者
原帖由 totticarter 于 2011-7-15 21:14 发表
NoSQL有两个解释,已个是非sql,一个是not only sql,那么我想问一下,不仅仅是sql还包括什么?谢谢



这种东西每一个人都会有自己的理解。
不过大家比较认可的说法如下:
Next Generation Databases mostly addressing some of the points: being non-relational, distributed, open-source and horizontally scalable. The original intention has been modern web-scale databases. The movement began early 2009 and is growing rapidly. Often more characteristics apply as: schema-free, easy replication support, simple API, eventually consistent / BASE (not ACID), a huge data amount, and more. So the misleading term "nosql" (the community now translates it mostly with "not only sql") should be seen as an alias to something like the definition above.

__________________
微博:http://weibo.com/gpcuster
论坛:http://bbs.data-works.org
博客:http://blog.data-works.org/

使用道具 举报

回复
论坛徽章:
0
60#
发表于 2011-7-18 15:04 | 只看该作者
Cassandra对group by这种汇总不支持,但是又需要汇总运算,一般采用什么方法解决这个问题?

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表