十条运维经验,帮你远离故障

  • 时间:
  • 浏览:1

累似 ,Oracle存储级的HA方案:Data Guard。主库提交了一笔订单,结果处在了switchover,这笔订单如此 同步到备库。

如此 卖家损失了另另一个多销售单。这对客户和公司都是 损失。

在操作完后 ,先弄清楚所在的是主库还是备库?当前目录是哪十几个 ?哪个schema?session?时间? 比如,对Oracle来讲:

idle> set sqlprompt 'RAC-node1-primary@10g>>'

RAC-node1-primary@10g>>

当然,你也须要在glogin.sql上端对其设置。

对Linux而言,可通过设置PS1来知道当前目录、登陆用户名和主机信息等。

哪十几个 是破坏性的操作?比如:对 Oracle 而言,有truncate table_name,delete table_name,drop table_name。哪十几个 一段话执行起来轻松简单也惬意极了,但记住:即便数据可被回滚,其代价也是非常大!

对Linux而言,“rm -r” 将删除当前及其子目录的所有数据。有过你你这个 教训的,一般都是给rm起个别名,如 alias rm=’rm -i’。同理,对cp和mv也须要如此 做:

alias cp='cp -i'

alias mv='mv -i'

佛说:“每次创伤都是 一次性性成熟 图片 的句子是什么是什么是什么是什么的句子期是什么”。这是运维人员的真实写照。从四种 生活意义上讲,运维是一份不断犯错、不断积累经验的工作。完后 如此 经历的东西,老会 不定期的我能 痛击。所以有请保护好变更的现场,使得变更有回头的完后 。

运维人员赖于生存的工具只是我报警和监控。

报警须你会能 及时知道系统老会 冒出了哪十几个 异常,以便及时跟进和把故障扼杀于摇篮。

监控须你会能 了解系统的历史性能信息,以历为鉴,须要知兴替和早做优化。

报警和优化是衣宽带水的好兄弟,它们相铺相成、互相有益于。

这有点儿禅的意境,和GNU/Linux的思想不谋而合。

我门 老会 面临各种诱惑:新的系统架构、新的更智能的命令和工具、最新的硬件平台、功能更全的HA软件。。。

我能 在线下安装、测试;为什么在么在会么会搞都行。后后完后 你会在生产环境下使用起来,请三思!!

不能使用系统内置命令一段话,就不会考虑后后 要专门下载安装的软件了。

脚本四种 生活就能完成的功能,就如此 必要专门找另另一个多功能丰厚的软件来做。

linux四种 生活自带的字符界面比哪十几个 复杂性的图形界面要简洁方便。

会计人员在从业完后 ,都是 个职业操守的训练。同理这也应该是运维人员进入行业前首先须要具备的素养。比如:于Oracle而言,我能 跑另另一个多RDA巡检DB的健康情況。

对Linux而言,否是有password aging,隔离外网等。

接手别人的工作要一而再,再而三的确认变更方案。请教人未必见得只是我能力不行的表现。休假前最好各种须要做好的事情,最好不能准备一份文档,指明在哪十几个 情況下为什么在么在会么会做生和熟系哪十几个 人。在别人放假的完后 接手工作,“能拖则拖”,我我其实须要执行,须要不厌其烦的跟原运维者确认各个操作细节。

1)做另另一个多变更的完后 ,会先提前一两周发送邮件并电话手机通知相关人;

2)在测试机上写好脚本,召集我门 review操作步骤和脚本;

3)测试完成完后 拷贝到生产环境;

4)登录对应机器,“打开、关闭、打开、关闭”该脚本。

5)跟相关人员再次确认执行的操作、顺序、时间点、完后 的影响和回滚否是都准备好了;

6)执行前须要退出你你这个 机器,后后再登录进去,“打开,关闭”脚本;

7)最后才在后台运行脚本,同去在另外另另一个多窗口登录,随时ps和查看结果输出。

人非圣贤,岂能无过?是机器总有计划内或计划外崩溃的一天。为什么在么在会么会办?备份!!!

备份的学问很大,按照不同的维度须要分冷备和热备、实时和非实时、物理和逻辑。

OLTP 7*24 在线业务,DB 就须要有实时热备。如此 就须要多会儿?开发人员的另另一个多不带任何条件的 delete 还是会误删所有数据。

所以有,此时你除了实时备份还须要有非实时的备份。

备份有了,须要高忱无忧多会儿?不行!尚须验证备份的有效性。总有如此 十几个 备份无法保证1000%恢复。简单的验证只是我找个空库并恢复出来。