什么是高可用性(HA)_ha高可用-程序员宅基地

技术标签: 存储系统  负载均衡  网络  计算机基础  磁盘  服务器  工作  

  什么是高可用性 (HA)
  “高可用性”(High Availability)通常来描述一个系统经过专门的设计,从而减少停工时间,而保持其服务的高度可用性。 
  例如我们希望电力、水力服务是高可用性的系统。 
  计算机系统的可靠性用平均无故障时间(MTTF)来度量,即计算机系统平均能够正常运行多长时间,才发生一次故障。系统的可靠性越高,平均无故障时间越长。可维护性用平均维修时间(MTTR)来度量,即系统发生故障后维修和重新恢复正常运行平均花费的时间。系统的可维护性越好,平均维修时间越短。计算机系统的可用性定义为:MTTF/(MTTF+MTTR) * 100%。由此可见,计算机系统的可用性定义为系统保持正常运行时间的百分比。
  负载均衡服务器的高可用性 
  为了屏蔽负载均衡服务器的失效,需要建立一个备份机。主服务器和备份机上都运行High Availability监控程序,通过传送诸如“I am alive”这样的信息来监控对方的运行状况。当备份机不能在一定的时间内收到这样的信息时,它就接管主服务器的服务IP并继续提供服务;当备份管理器又从主管理器收到“I am alive”这样的信息是,它就释放服务IP地址,这样的主管理器就开开始再次进行集群管理的工作了。为在主服务器失效的情况下系统能正常工作,我们在主、备份机之间实现负载集群系统配置信息的同步与备份,保持二者系统的基本一致。
  HA的容错备援运作过程 
  自动侦测(Auto-Detect)阶段由主机上的软件通过冗余侦测线,经由复杂的监听程序。逻辑判断,来相互侦测对方运行的情况,所检查的项目有:主机硬件(CPU和周边)、主机网络、主机操作系统、数据库引擎及其它应用程序、主机与磁盘阵列连线。为确保侦测的正确性,而防止错误的判断,可设定安全侦测时间,包括侦测时间间隔,侦测次数以调整安全系数,并且由主机的冗余通信连线,将所汇集的讯息记录下来,以供维护参考。 
  自动切换(Auto-Switch)阶段 某一主机如果确认对方故障,则正常主机除继续进行原来的任务,还将依据各种容错备援模式接管预先设定的备援作业程序,并进行后续的程序及服务。 
  自动恢复(Auto-Recovery)阶段在正常主机代替故障主机工作后,故障主机可离线进行修复工作。在故障主机修复后,透过冗余通讯线与原正常主机连线,自动切换回修复完成的主机上。整个回复过程完成由EDI-HA自动完成,亦可依据预先配置,选择回复动作为半自动或不回复。
  HA三种工作方式: 
  (1)主从方式 (非对称方式) 
  工作原理:主机工作,备机处于监控准备状况;当主机宕机时,备机接管主机的一切工作,待主机恢复正常后,按使用者的设定以自动或手动方式将服务切换到主机上运行,数据的一致性通过共享存储系统解决。 
  (2)双机双工方式(互备互援) 
  工作原理:两台主机同时运行各自的服务工作且相互监测情况,当任一台主机宕机时,另一台主机立即接管它的一切工作,保证工作实时,应用服务系统的关键数据存放在共享存储系统中。 
  (3)集群工作方式(多服务器互备方式) 
  工作原理:多台主机一起工作,各自运行一个或几个服务,各为服务定义一个或多个备用主机,当某个主机故障时,运行在其上的服务就可以被其它主机接管。
  什么是高可用性(HA) 
  高可用性的衡量指标 
  可用性的计算公式: 
  %availability=(Total Elapsed Time-Sum of Inoperative Times)/ Total Elapsed Time 
  elapsed time为operating time+downtime。 
  可用性和系统组件的失败率相关。衡量系统设备失败率的一个指标是“失败间隔平均时间”MTBF(mean time between failures)。通常这个指标衡量系统的组件,如磁盘。 
  MTBF=Total Operating Time / Total No. of Failures 
  Operating time为系统在使用的时间(不包含停机情况)。 
  高可用性系统的设计 
  设计系统的可用性,最重要的是满足用户的需求。系统的失败只有当其导致服务的失效性足以影响到系统用户的需求时才会影响其可用性的指标。用户的敏感性决定于系统提供的应用。例如,在一个能在1秒钟之内被修复的失败在一些联机事务处理系统中并不会被感知到,但如果是对于一个实时的科学计算应用系统,则是不可被接受的。 
  系统的高可用性设计决定于您的应用。例如,如果几个小时的计划停机时间是可接受的,也许存储系统就不用设计为磁盘可热插拔的。反之,你可能就应该采用可热插拔、热交换和镜像的磁盘系统。 
  所以涉及高可用系统需要考虑: 
  决定业务中断的持续时间。根据公式计算出的衡量HA的指标,可以得到一段时间内可以中断的时间。但可能很大量的短时间中断是可以忍受的,而少量长时间的中断却是不可忍受的。 
  在统计中表明,造成非计划的宕机因素并非都是硬件问题。硬件问题只占40%,软件问题占30%,人为因素占20%,环境因素占10%。您的高可用性系统应该能尽可能地考虑到上述所有因素。 
  当出现业务中断时,尽快恢复的手段。 
  导致计划内的停机因素有: 
  周期性的备份 
  软件升级 
  硬件扩充或维修 
  系统配置更改 
  数据更改 
  导致计划外停机的因素有: 
  硬件失败 
  文件系统满错误 
  内存溢出 
  备份失败 
  磁盘满 
  供电失败 
  网络失败 
  应用失败 
  自然灾害 
  操作或管理失误 
  通过有针对性的设计,可以避免上述全部或部分因素带来的损失。当然,100%的高可用系统是不存在的。 
  创建高可用性的计算机系统 
  在UNIX系统上创建高可用性计算机系统,业界的通行做法,也是非常有效的做法,就是采用群集系统(Cluster),将各个主机系统通过网络或其他手段有机地组成一个群体,共同对外提供服务。创建群集系统,通过实现高可用性的软件将冗余的高可用性的硬件组件和软件组件组合起来,消除单点故障: 
  消除供电的单点故障 
  消除磁盘的单点故障 
  消除SPU(System Process Unit)单点故障 
  [1] 消除网络单点故障 
  消除软件单点故障 
  尽量消除单系统运行时的单点故障

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/rj03hou/article/details/5507415

智能推荐

【区块链2.0实战学习笔记】————8、Solidity开发以太坊游戏_solidity链游pve开发-程序员宅基地

文章浏览阅读813次。8.1 以太坊游戏的特点8.2 以太坊游戏开发准备8.3 以太坊游戏Influence代码框架8.4 以太坊游戏Influence源代码解读8.4.1 游戏界面8.4.2 库文件lib8.4.3 游戏主功能:小行星拍卖8.4.4..._solidity链游pve开发

python中文件读写--open函数详解_python open 读-程序员宅基地

文章浏览阅读7.2k次,点赞6次,收藏39次。python中open函数详解在python中文件的读取分为三步走:读:打开文件 -> 读文件 -> 关闭文件(有点像把大象放进冰箱需要几步?的问题)1、open函数open函数主要运用到两个参数,文件名和mode,文件名是添加该文件对象的变量,mode是告诉编译器和开发者文件通过怎样的方式进行使用。因此在Python中打开文件的代码如下:file_object = open('filename','mode')..._python open 读

接口请求的六种常见方式_编辑的请求方式是什么-程序员宅基地

文章浏览阅读4.8k次。接口请求的六种常见方式:1、Get 向特定资源发出请求(请求指定页面信息,并返回实体主体)2、Post 向指定资源提交数据进行处理请求(提交表单、上传文件),又可能导致新的资源的建立或原有资源的修改3、Put 向指定资源位置上上传其最新内容(从客户端向服务器传送的数据取代指定文档的内容)4、Head 与服务器索与get请求一致的相应,响应体不会返回,获取包含在小消息头中的原信息(与get请求类似,返回的响应中没有具体内容,用于获取报头)5、Delete 请求服务器删除request-URL所标示的_编辑的请求方式是什么

浅析YOLO目标检测算法AI安全帽识别技术及场景应用_yolo图像分类帽子和人不在同一处-程序员宅基地

文章浏览阅读5k次,点赞4次,收藏17次。将AI安全生产摄像机与EasyCVR视频平台结合使用,通过安全帽检测,可以有效地来检测工人是否合规穿戴个人防护装备,提高视频监控应用在行业多场景下的智能分析与处理能力。_yolo图像分类帽子和人不在同一处

Codeforces Round #343 (Div. 2) D. Babaei and Birthday Cake(线段树+离散化优化DP)_codeforce b-babala cake离散化线段树-程序员宅基地

文章浏览阅读1.5k次。题目链接:点击打开链接题意:给出n个圆柱体的地面半径和高, 要求只能有一个直接放在桌子上, 其他的要放在他上面, 第i个能放在第j个上面的条件是:当且仅当第i个的体积大于第j个且j 思路:一看就是一个DP, 而且状态很容易表示, d[i]表示到第i个为止能得到的最大总体积。 转移到 max(d[j]) + a[i], (j a[j])。 但是n非常大, 显然要优化, 因为第二层循环_codeforce b-babala cake离散化线段树

Python学习之我踩过的坑_python卡姿兰大眼睛-程序员宅基地

文章浏览阅读192次。一些碎碎念:今天,高高兴兴地投入到Python的学习中,氮素,以我这么优秀的人,怎么可能不掉坑??我有一万种犯错的办法好吗?!首先,在Python交互环境中定义函数。是时候展现一波真正的技术了。如下图:哎,怎么报错?擦亮卡姿兰大眼睛一看,哦,原来忘了添加冒号,再来再来怎么还是报错???(黑人问号脸)是时候百度一下了OO,原来是缩进的问题,没有添加空格,再次修改好啦!..._python卡姿兰大眼睛

随便推点

Android屏幕适配-程序员宅基地

文章浏览阅读91次。屏幕适配非常好用的Android屏幕适配:https://www.jianshu.com/p/1302ad5a4b04今日头条屏幕适配方案终极版:http://blog.itpub.net/31077337/viewspace-2212649/秦子帅:Android刘海屏适配方案...

ELK生态:Logstash增量读取csv文件数据,导入到Elasticsearch_使用logstash导出es数据到csv-程序员宅基地

文章浏览阅读5k次。简介ELK生态之Logstash导入数据到Elasticsearch; 数据源:csv格式文件; Elasticsearch和Logstash版本:5.6.1; 前提环境:Elasticsearch单机或集群;Logstash客户端;实践csv文件内容:"sixmonth","23","男","1998/6/3 18:31:46""xiaoming","23","男","19..._使用logstash导出es数据到csv

eclipse链接git(SSH免密码链接)_eclipse git ssh-程序员宅基地

文章浏览阅读6.6k次。eclipse 使用ssh方式连接git_eclipse git ssh

HTML代码页面无法跳转为什么,html超链接不跳转 html为什么超链接不跳转页面-程序员宅基地

文章浏览阅读1.2w次。html里面代码加上超链接不跳转网页html为什么点击超链接不跳转?代码如下:点击链接 点击后你的链接是不是在框架里面 如果是要加上 target="_top"如何设置在html中保留超链接格式但不实现跳转html为什么超链接不跳转页面检查一下html超链接是否书写正确。html 超链接如何设置点击跳转到根目录或其他目录超链接跳转到其他的目录或者根目录一般是使用相对路径或者绝对路径的进行跳转。 工..._htm为什么value无法跳转

什么是爬虫?_爬虫是什么-程序员宅基地

文章浏览阅读2.6k次,点赞2次,收藏14次。应该有不少知友在学习爬虫的过程中都走了不少弯路,一听到要用Python爬虫,就认为开始着手把Python完全系统的去学习一遍,于是开启了漫长的Python学习时光,但往往还没有接触到爬虫,就把前面学的理论知识给忘了,毫无成就感,越来越看不到希望,最后只好放弃。、价格在2000元到2500元、地区需要在浦东,最后网站就会给出一些筛选完的具体列表,通过一步步的点击最后获得了你想要的信息,如果想将这些信息进行对比,还得手动将一些参考数据摘抄下来,这一系列复杂的人工操作必将花费不少的时间。_爬虫是什么

matlab videoinput 函数,Create video input object-程序员宅基地

文章浏览阅读645次。videoinputCreate video input objectSyntaxobj = videoinput(adaptorname)obj = videoinput(adaptorname,deviceID)obj = videoinput(adaptorname,deviceID,format)obj = videoinput(adaptorname,deviceID,format,P1..._matlab videoinput