周一去客户那里巡检,用errpt一检查,考,NND,一大堆的ssa0 资源不可利用。凭偶的经验看,跟pdisk关系重大。做diag,报SRN:47500.
检查了service guide。让重做阵列或者更换硬盘。有问题的阵列由2块pdisk盘做的raid1。和另外一个由2块pdisk盘做的raid1做成datavg。NND,用migratepv迁移lv到好的raid1上的话,空间不够,只有回去,取盘。
2天后拿着ssa盘重回客户处,做vg备份,数据库备份。之后,什么lspv,lspv -l,看了看,做到对lv情况心中有数。然后做extendvg把自己带来的好盘扩到datavg里,migratepv把有问题的盘的lv迁移到好盘上。reducevg把坏盘删掉,进入smit ssaraid把有问题的阵列删掉,重新建raid1,把数据又迁移回来。把好盘用reducevg从datavg里删掉。至此,系统不再报错。
终于可以安心的回家了。唉,想起路上做汽车大巴脑袋就晕的厉害啊。;(
biml2002 回复于:2004-12-02 21:10:47
都是李XX惹的祸。
wozxz 回复于:2004-12-03 08:23:11
嘿嘿
楼主高人一个!!
banker 回复于:2004-12-03 08:54:40
这种实战的经验贴我们最支持,最喜欢!!!
johnsons 回复于:2004-12-03 09:37:24
我不大明白楼主为什么要这么麻烦迁移数据呢?你直接在raid菜单里面swap坏硬盘不就行了么?
biml2002 回复于:2004-12-03 09:49:46
引用:原帖由 "johnsons"]我不大明白楼主为什么要这么麻烦迁移数据呢?你直接在raid菜单里面swap坏硬盘不就行了么?
发表:
guide里面说的很清楚,有两种可能。
目前不清楚到底是否是硬盘故障,作为公司来讲,如果是软性问题,用硬件来解决,浪费了成本。事实证明是建的raid有问题。而不是硬件问题。为公司节省了一块硬盘哦,好几千块啊。
johnsons 回复于:2004-12-03 09:54:11
引用:原帖由 "biml2002" 发表:
guide里面说的很清楚,有两种可能。
目前不清楚到底是否是硬盘故障,作为公司来讲,如果是软性问题,用硬件来解决,浪费了成本。事实证明是建的raid有问题。而不是硬件问题。为公司节省了一块硬盘哦,好几千块啊..........
但是像你说的这种情况(raid建的有问题),从我维护的经验来看,确实还没有碰到过。概率应该是很小的。其实换回去的硬盘可以做检测啊,如果是好的,照样可以用的。
biml2002 回复于:2004-12-03 10:07:12
建的raid有问题,swap不一定能解决问题的,raid信息不会重建。
biml2002 回复于:2004-12-03 10:10:33
也 不能说概率小,只能说遇到的情况不多而已。
flighttop 回复于:2004-12-04 03:48:56
can you post the procedures how to replace a failed disk on AIX? Thanks!
biml2002 回复于:2004-12-04 09:33:40
guide里面介绍的很详细。你以去看看。有不清楚的地方可以发到论坛上来。
jamesbang2003 回复于:2004-12-05 18:54:52
呵呵,如果是硬盘坏了,不可以rebuild么,用一个软件工具可以看到,只是不知道你们的盘阵是不是sun的,要是的话,呵呵,我有办法。
feiaix 回复于:2004-12-05 19:15:03
NND是什么东西呀?
biml2002 回复于:2004-12-05 20:27:46
引用:原帖由 "jamesbang2003"]呵呵,如果是硬盘坏了,不可以rebuild么,用一个软件工具可以看到,只是不知道你们的盘阵是不是sun的,要是的话,呵呵,我有办法。
| 论坛热门帖子: | [lch203] 写得蛮好的linux学习笔记(10-21) [黑马制造] 学习java的30个目标(10-19) [笑傲股林] 做测试半年了,有点迷茫,应该再学些什么提高自己的测试水平和测试能力呢?(10-19) [udp8589] 大家用google的来吱一声? 用百度的~~也来报道下?(10-18) [沂偌掳兆] 本人总结的一些认为C++比较经典的书籍,希望对大家有用(10-18) |
| TAG标签: | 解决 实例 故障 原创 回复 问题 硬盘 可以 biml2002 如果 |
注册
个人空间
