就是16号晚上6点开始到17号早上7点多才结束的主机迁移。
当前环境有3台主机,1台备机,是1备3,共4个节点。
这四个节点迁移到新的四个节点,主要工作在存储和小机,简单说就是把存储从原来的4个节点挂到新的4个节点。
数据库组的任务就是修改数据库环境,迁移后数据库启动正常,应用正常。
简单的想,就是spfile中相应路径修改一下。
本来计划是凌晨1:40完成,后来到7点多才完成,主要原因有:
1.预先对工作分析得不透,环境检查得不够。
在备用机上本来还有实例在运行,这个处理不在计划内。
2.部分工作没有考虑到
比如使用dblink,必须同步复制到新环境,侦听的配置
3.应用测试的时间没有考虑
因为是热备,测试热备需要花时间,测试时出现问题的处理,这个时间都没有考虑到。
4.额外发现的问题的处理时间
把事情做好,真的是要方方面面考虑到。
很重要的是在事情开始前,把步骤列好,check。确认步骤没有少。
这次7点多离开,12点多又接到电话,可能是归档空间满引起业务停止。
又匆匆赶过去,结果有人通过vpn上去解决了。后来了解到是系统组的人忘记把归档路径的权限设置为oracle了。
这个问题一方面是系统组漏了,另一方面,我当时应该检查alert文件,否则可以提早发现的。
当时系统组一起干活的兄弟,感觉做事也很细心,比较有章法,不过做了13个小时,谁都晕了。
难保不会漏个东西。所以说,在做之前,把东西想周全是最好,另外,如果有变化,先修改计划文档,再动手做,避免做的过程出现问题,导致漏掉其他内容。有点类似oralce的先保存到redo,也有点类似iso9001里面的“写下要做的”。
这里还是觉得iso9001的思路很好:
写下要做的;
按所写的做;
写下所做的。
好的习惯,有时候比技术本身更重要。