作为一个SRE,或者一个苦逼运维,被开发坑已经是的一个无法避免的事情了,我们就不能再坑自己了,所以,有以下法则与君共勉
法则#1:备份所有东西(并定时检查备份的可用性)
经验丰富的运维知道系统肯定会在将来的某天down掉的,无论你多么优秀,多么努力去维护,最好的解决方案就是一个有效的备份
如果你还没有备份你的系统,那么,你应该现在马上开始计划了,在计划这些事情的时候,记住如下几点:
- 使用什么工具来备份?脚本?软件?
- 是否拥有足够的磁盘空间来备份?
- 我们应该多久来压缩一次我们的备份文件?
- 除了完整备份外,是否也需要普通的增量备份?
- 你希望如何执行你的备份任务?例如:crontab ?
如果你的重要系统没有备份,马上停止阅读这篇文章,马上回去备份你的系统
法则 #2: 熟练掌握命令行(尽量避免使用UI图形界面)
这并不只只针对linux系统,我们真的要学习使用命令行来调用接口来执行我们的任务
如果你是一个linux的sysadmin,你更应该熟练掌握命令行了
在任何操作系统下,你如果想更高效,你应该掌握命令行,一个windows管理员和linux管理员的主要区别就是windows更倾向于图形化工具来管理服务器,而linux更倾向于命令行
在两种方法都可以完成工作的时候,我们应该更倾向于命令行,这会让我们更好的理解服务是如何工作的
Rule #3: Automate Everything ( and become lazy ) 自动化所有东西(做一个懒人)
懒的系统管理员能够成为一个好的系统管理员
在我认识的所有系统管理员中,没有人愿意打破这个法则
花几分钟来想想一些每天执行的,每周执行的,没月执行的,然后找出如何自动化执行这些东西,然后,让服务器来做这些重复性工作就好了
参考文章:http://www.thegeekstuff.com/2010/07/three-sysadmin-rules/
Latest posts by Zhiming Zhang (see all)
- aws eks node 自动化扩展工具 Karpenter - 8月 10, 2022
- ReplicationController and ReplicaSet in Kubernetes - 12月 20, 2021
- public key fingerprint - 5月 27, 2021