200亿条数据,就是20T吧,用ASM好?还是用OCFS好?还是用RAW好? 谢谢
[ 本帖最后由 nntp 于 2006-9-1 00:42 编辑 ]
nntp 回复于:2006-03-08 20:17:42
几个问题要先搞清楚:
1. 20T 是否是历史数据和归档数据?还是天天都要修改,更新和变化?
2. 20T数据中有多少比例的数据是需要经常修改/查询/更新的?
3. 20T数据是纯data数据还是有媒体数据?
4. 这套业务系统以后的数据增长是怎样的? 每天/每个月,每年新增长多少数据,增长速度如何?
这些问题都搞清楚了,你的数据库存储的规划就基本清晰了, 否则操作起来盲人摸象。
按照我的经验,恐怕20T不是全部都需要always online, 所以在数据库逻辑设计上需要把数据分层对待,即便是Oracle ,你要是只有一个层的20T数据,恐怕性能也会糟糕的一塌糊涂.
还有,ASM, OCFS, RAW并不是等价可比的。他们的特性和设计差别很大.
ASM的性能基本上和RAW差不多. 但是管理性上好很多很多。但是牺牲的代价就是引入了系统的复杂性,多了一层东西,问题出现的几率也大很多.
不过有一点我可以肯定就是如果你要放你这20T的数据,OCFS2不应该考虑, 别问我为什么,因为又要解释很多很多东西.
cwinxp 回复于:2006-03-09 09:36:55
谢谢
要同时检索10T到20T数据,怎么弄好?
nntp 回复于:2006-03-09 16:50:14
引用:原帖由 cwinxp 于 2006-3-9 09:36 发表
谢谢
要同时检索10T到20T数据,怎么弄好?
找专业的公司作咨询把,10T-20T的数据同时作检索,已经不能算是常规应用了。
正常情况下,他们会对这样的应用做这些工作:
1. 分析你的数据使用习性,调整数据库结构(包括为针对查询操作做的优化)
2. 建立一个常规的HA集群方案,同时会根据发向这套系统的查询请求的情况,加入负载均衡的考虑
3. 做一个小样测试之后,会根据性能测试的采样结果,调整你的OS和文件系统.(如果你们这里有对Linux比较熟悉的工作人员,这个工作也可以自己做,OTN上有很多性能调整的资料)
4. 还有可能在分析你的待查数据之后,把数据在物理上分开布局
5. 1-4的工作的前提是你的硬件投资是有限的不多的。做了1-4 的研究工作之后,还有一种糟糕的可能就是发现瓶颈还是在硬件上,你们对性能/可用性上的要求和真实你的物理基础能够提供的并不符合。所以需要对硬件作改造.
如果要做好10T-20T的应用,这些工作都比较复杂,需要接触实际的系统和深入的了解应用.
good luck
cwinxp 回复于:2006-03-10 10:19:48
thank you , 这么大的数据,硬件不是问题,搞5个CX700级联的,够用吧
我把5个CX700 按照您说的分出几个RAW等等,然后把10T甚至更大分成一个区给ASM吗?
nntp 回复于:2006-03-10 17:31:38
引用:原帖由 cwinxp 于 2006-3-10 10:19 发表
thank you , 这么大的数据,硬件不是问题,搞5个CX700级联的,够用吧
我把5个CX700 按照您说的分出几个RAW等等,然后把10T甚至更大分成一个区给ASM吗?
硬件好当然好,但是硬件好完全保证不了这套东西能够按照期望的性能和可用性工作。关于怎么样规划,我真地说不来什么,这些工作得认真分析你的应用之后才能得出结论,这么大的数据,搞错了就错了.
上一页12 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 下一页
| 论坛热门帖子: | [lch203] 写得蛮好的linux学习笔记(10-21) [黑马制造] 学习java的30个目标(10-19) [笑傲股林] 做测试半年了,有点迷茫,应该再学些什么提高自己的测试水平和测试能力呢?(10-19) [udp8589] 大家用google的来吱一声? 用百度的~~也来报道下?(10-18) [沂偌掳兆] 本人总结的一些认为C++比较经典的书籍,希望对大家有用(10-18) |
| TAG标签: | 主题 合并 讨论 回复 ocfs2 nntp 系统 RAC 问题 可以 |
注册
个人空间
