浅谈IT基础运维

编辑摘要:我从2011年进入IT运维行业,开始了2年的IT基础架构运维,后来来了现在这个单位从事将近4年的数据备份、高可用...

我从2011年进入IT运维行业,开始了2年的IT基础架构运维,后来来了现在这个单位从事将近4年的数据备份、高可用等软件的售后维护工作。2年的基础运维所积累的知识和经验,我一直都觉得给我目前的工作提供很大的帮助,事实上也是如此。所以本文,我想先谈谈IT基础运维该怎么搞起,后续再分享其他知识和经验。如果有幸你看到这篇文章,而你又是那位下定决心要在IT运维之路上实现你的梦想和追求,那么,希望这篇文章可以帮助到你。

基础运维,故名思义就是企业IT系统中的基础设施的运行维护,基础设施是一切应用程序运行的基础。基础运维涉及的知识和技术比较广泛,最底层的就是服务器、小型机、存储、交换机之类的硬件设备了,其次往上就是操作系统、集群软件,当然目前虚拟化也是基础运维中的重要成员了。

以下夸夸其谈,希望能给初学者一些基础的概念吧。

1)服务器

服务器目前大概分3类:PC服务器、小型机、大型机。当然还有中型机。

PC服务器,身为企业级的服务器,刚入门的学员可能认为很高端好神秘。其实说白了就是一台升级版的个人电脑,一样是CPU、内存、硬盘、主板、电源之类的部件。为什么说是升级版?因为企业级服务器承载着重要的程序和服务,每时每刻提供大流量高并发的访问,对服务器的性能、稳定性和可靠性提出了很高的要求,普通的个人电脑是无法胜任的。PC服务器一般配备冗余双电源、合计容量高达TB级别的ECC纠错内存、2-4个高性能CPU、冗余硬盘、冗余网络链路等,可应对单点故障,在一定的故障范围内还可以继续工作。硬盘冗余,一般来说就是RAID技术。网络冗余,就是将2个以上的网络端口进行绑定的技术。主要PC服务器厂家有IBM、华为、联想、DELL、浪潮、曙光等等。

小型机,主要厂家有3家,IBM、SUN、HP,SUN已经在多年前被Oracle收购了。小型机与PC服务器相比,更稳定、性能更好,支持更多的内存,更多的cpu数量,更多的板卡(网卡、光纤卡)。曾经见过一台10年内未曾重启的小型机,听着让人觉得牛逼啊,但工程师看着就觉得害怕(害怕重启的时候启动不了啊)。小型机CPU采用精简指令集RISC,而PC服务器采用复杂指令集CISC,IBM采用POWER处理器、SUN采用SPARC处理器、HP采用安腾和PA-RISC处理器。大部分小型机能够在运行状态下进行CPU、内存、以及板卡的增加和更换工作,无需停机,这个估计是小型机相对PC服务器最大的优点了,想想不关机就能更换内存,多霸气啊。

大型机,俺没见过,真不敢班门弄斧呀。一般都是银行核心交易系统使用,是一种比小型机更加厉害的机器,宕机时间接近于零。

2)操作系统

说完服务器,接下来当然是操作系统了。PC服务器一般使用Linux系统和Windows系统。小型机使用Unix操作系统。

Linux,企业常用的有Redhat Linux、SuSE Linux、CentOS;Ubuntu目前也是常用的操作系统,尤其在云计算大行其道的今天。

Windows系统,指的是服务器版本的系统。Windows2003ent、Window2008ent、Windows2012ent等。

Unix操作系统主要有3个:IBM公司的POWER服务器对应的操作系统是AIX,SUN公司的SPARC服务器对应的操作系统是SOLARIS、HP公司的安腾、PA-RISC服务器对应的操作系统是HP-UX。每个系统都有自己的优缺点。易用性易学性最好的,非AIX莫属了。

Linux和Unix属于开放系统,与Windows差异很大。Linux和Unix绝大多数的使用操作都是以命令方式执行,而不是windows的直观的图形界面,可能看上去很枯燥无味,但是一旦熟悉,你将爱上它。初学的学员可以先从Linux开始学习,学什么呢?可能是很多学员的疑问,一般来说学习一个操作系统需要学习系统安装、基础操作、设备管理、磁盘管理、软件管理、进程管理、网络管理等。

3)存储(磁盘阵列)

大家都知道个人电脑配置有1个或多个硬盘,服务器也一样,也配备有若干个硬盘。随着IT系统的使用,数据量将越来越大,单个硬盘无法满足容量的需求,多个硬盘单独使用也无法满足使用的便捷性。这个时候RAID技术出现,可以将多个硬盘组合成一个更大的磁盘空间,例如三个100GB硬盘采用RAID0技术可以组合成一个300GB的磁盘空间。但是随着IT数据的增加,服务器配备的几个硬盘已经无法满足用户数据增长的需求,这个时候,外置存储设备出现了,通过外接存储设备上的几十甚至几百个硬盘的RAID技术组合,服务器可以使用更大的存储空间。

一个存储(也称磁盘阵列)的容量从最初几个TB到如今的几百TB,甚至可以达到PB级别。如果一个服务器使用一个存储设备,显然是一种资源的深度浪费啊。存储区域网络SAN是一种介于服务器和存储之间的链路,通过存储网络,多个服务器可以访问同一个存储的相同的磁盘资源或不同的磁盘资源,这个存储网络叫FC网络(SAN网络、网状通道),一般使用光纤这种高速传输介质。例如一个10TB的存储,可以分配3TB空间给服务器A,7TB空间给服务器B。当然,实际的IT环境很多都是1个大容量存储设备与几十个服务器的对应关系。这种存储网络设备我们叫SAN交换机、FC交换机或者光纤交换机,存储和服务器通过FC交换机进行互联,使用FC协议进行存储访问操作。

常见的存储厂家有IBM、SUN、HP、DELL、华为等等。常见的FC交换机有IBM、HP、SUN,其实这些厂家基本都是OEM博科的FC交换机。什么是OEM,大家可以简单理解为克隆吧,不做阐述。差点忘了还有2家高端存储厂家:HDS和EMC。

4)网络

网络,其实我真不懂网络,我只是知道一些基本的概念,例如千兆、万兆、二层、三层、链路聚合、接入层、核心层、NAT、VLAN、交换机、路由、防火墙、ACCESS、TRUNK。

我想我不是全能的,总要有一个弱点,只能这么自我安慰了吧!

5)虚拟化

虚拟化最近几年真是太火了,因为它实实在在地为企业节省了大量成本。

什么是虚拟化,简单来说就是在一个物理服务器上安装虚拟化软件后,可以同时运行多个操作系统。传统的IT环境是一个服务器只运行一个操作系统,目前是一个服务器同时运行多个操作系统,很显然,采用虚拟化技术,企业再也不需要购买大量的服务器了。虚拟化技术也不是近几年的产物,而是10几年前出现了,只可惜当时的服务器性能底下,不足以承载过多的负荷,而现在的技术进步,服务器承载10个甚至几十个虚拟机已经卓卓有余。

主流的虚拟化技术有PowerVM、VMware、Citrix、OpenStack。Openstack是云计算范畴了,有兴趣的学者可自行了解。

6)集群软件

集群软件很多,针对不同的操作系统有不同的集群软件,例如IBM AIX平台的HACMP、SUN平台的sun cluster、HP平台的ServiceGuard,Linux的HeartBeat等等,当然少不了我最熟悉的Veritas Cluster Service(VCS),VCS支持绝大多数操作系统平台,包括Linux、Unix、Windows,可以说一套命令走天下。

什么是集群软件,集群软件有什么作用,大家可以想象,当你在银行ATM设备取款,突然银行后台的交易系统发生服务器故障,那怎么办?假设银行后台的交易系统使用了集群软件,那么当这个服务器发生故障后,集群软件将交易系统程序自动启动在另外一台服务器上,这样,就保证了ATM取款工作的继续进行。这个仅仅是一个例子,或者说是很早期的情况,目前的集群系统已经支持多个服务器部署同一个应用程序同时提供访问,不再是主备关系了。


唠叨了不少了,可惜都是很老的知识体系了,现在不是流行私有云、公有云、软件定义存储、软件定义网络、容融合、大数据吗?

所谓万变不离其宗,想要跑得快,必须走得稳啊,基础知识必须扎实。^_^


书籍推荐

学习的书籍很多,鸟哥的私房菜系列和大话存储系列书籍可以说是经典中的经典了。

Linux入门推荐:《循序渐进Linux》高俊峰,《鸟哥的Linux私房菜》鸟哥

小型机入门推荐:《走入IBM小型机世界》刘浩林,《SUN小型机管理指南》张学胜、王峰

存储入门推荐:《大话存储》张冬(冬瓜头)

学习网站

ChinaUnix官网:http://www.chinaunix.net/

ChinaUnix论坛http://bbs.chinaunix.net/

AIX专家俱乐部:http://www.aixchina.net/

AIX专家俱乐部论坛:http://www.aixchina.net/club/