什么是系统容错? 什么是容错?容错技术主要包括哪些

\u4ec0\u4e48\u662f\u5bb9\u9519\u63a7\u5236\u7cfb\u7edf

\u73b0\u5728\u7cfb\u7edf\u89c4\u6a21\u8d8a\u6765\u8d8a\u5927\uff0c\u4e5f\u8d8a\u6765\u8d8a\u590d\u6742\u4e86\uff0c\u5bb9\u9519\u63a7\u5236\u7cfb\u7edf\u662f\u4e3a\u4e86\u907f\u514d\u67d0\u4e9b\u539f\u4ef6\u53d1\u751f\u6545\u969c\u800c\u5f15\u8d77\u5176\u6240\u5728\u7684\u63a7\u5236\u7cfb\u7edf\u4e0d\u7a33\u5b9a\uff0c\u800c\u63d0\u51fa\u7684\u7406\u8bba\u3002
\u5982\u679c\u5728\u6267\u884c\u5668\u3001\u4f20\u611f\u5668\u6216\u5143\u90e8\u4ef6\u53d1\u751f\u6545\u969c\u65f6\uff0c\u95ed\u73af\u63a7\u5236\u7cfb\u7edf\u4ecd\u7136\u662f\u7a33\u5b9a\u7684\uff0c\u5e76\u4ecd\u7136\u5177\u6709\u8f83\u7406\u60f3\u7684\u7279\u6027\uff0c\u5c31\u79f0\u6b64\u95ed\u73af\u63a7\u5236\u7cfb\u7edf\u4e3a\u5bb9\u9519\u63a7\u5236\u7cfb\u7edf\u3002
\u5bb9\u9519\u63a7\u5236\u7cfb\u7edf\u5c31\u662f\u4f7f\u7cfb\u7edf\u7684\u53cd\u9988\u5bf9\u6545\u969c\u4e0d\u654f\u611f\uff0c\u751a\u81f3\u662f\u81ea\u9002\u5e94\u7684\u3002

\u5bb9\u9519FT(Fault Tolerant)\u6280\u672f\u4e00\u822c\u5229\u7528\u5197\u4f59\u786c\u4ef6\u4ea4\u53c9\u68c0\u6d4b\u64cd\u4f5c\u7ed3\u679c\u3002\u968f\u7740\u5904\u7406\u5668\u901f\u5ea6\u7684\u52a0\u5feb\u548c\u4ef7\u683c\u7684\u4e0b\u8dcc\u800c\u8d8a\u6765\u8d8a\u591a\u5730\u8f6c\u79fb\u5230\u8f6f\u4ef6\u4e2d\u3002\u672a\u6765\u5bb9\u9519\u6280\u672f\u5c06\u5b8c\u5168\u5728\u8f6f\u4ef6\u73af\u5883\u4e0b\u5b8c\u6210\uff0c\u90a3\u65f6\u5b83\u548c\u9ad8\u53ef\u7528\u6027\u6280\u672f\u4e4b\u95f4\u7684\u5dee\u522b\u4e5f\u5c31\u968f\u4e4b\u6d88\u5931\u4e86\u3002
\u5c40\u57df\u7f51\u7684\u6838\u5fc3\u8bbe\u5907\u662f\u670d\u52a1\u5668\u3002\u7528\u6237\u4e0d\u65ad\u4ece\u6587\u4ef6\u670d\u52a1\u5668\u4e2d\u5927\u91cf\u5b58\u53d6\u6570\u636e\uff0c\u6587\u4ef6\u670d\u52a1\u5668\u96c6\u4e2d\u7ba1\u7406\u7cfb\u7edf\u5171\u4eab\u8d44\u6e90\u3002\u4f46\u662f\u5982\u679c\u6587\u4ef6\u670d\u52a1\u5668\u6216\u6587\u4ef6\u670d\u52a1\u5668\u7684\u786c\u76d8\u51fa\u73b0\u6545\u969c\uff0c\u6570\u636e\u5c31\u4f1a\u4e22\u5931\uff0c\u6240\u4ee5\uff0c\u6211\u4eec\u5728\u8fd9\u91cc\u8bb2\u89e3\u7684\u5bb9\u9519\u6280\u672f\u662f\u9488\u5bf9\u670d\u52a1\u5668\u3001\u670d\u52a1\u5668\u786c\u76d8\u548c\u4f9b\u7535\u7cfb\u7edf\u7684\u3002

双机容错系统方案
一,双机容错系统方案综述
1.1 久强世纪 Storage Solution 双机容错系统
近年来,随着计算机技术的飞速发展,服务器的性能有了大幅度的提升,服务器作为处理关键性事物
的业务主机已随处可见.对于要求有高可用性和高安全性的系统,比如金融,邮电,交通,石油,电力,
保险证券等行业,用户提出了系统容错的要求.久强世纪公司推出基于Cluster集群技术的双机互备援解
决方案,包括用于对双服务器实行监控的HA 容错软件和作为数据存储设备的系列磁盘阵列系统.通过软
硬件两部分的紧密配合,提供给客户一套具有单点故障容错能力,且性价比优越的用户应用系统运行平台.
1.2 Cluster集群技术
Cluster集群技术:一组相互独立的服务器在网络中表现为单一系统,并以单一系统的模式加以管理.
此单一系统为客户工作站提供高可靠性的服务.
Cluster大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可
被所有的网络客户所使用.Cluster必须可以协调管理各分离的组件的错误和失败,并可透明的向Cluster
中加入组件.
一个Cluster包含多台(至少二台)拥有共享数据储存空间的服务器.任何一台服务器运行一个应用
时,应用数据被存储在共享的数据空间内.每台服务器的操作系统和应用程序文件存储在其各自的本地储
存空间上.
Cluster内各节点服务器通过一内部局域网相互通讯.当一台节点服务器发生故障时,这台服务器上
所运行的应用程序将在另一节点服务器上被自动接管.当一个应用服务发生故障时,应用服务将被重新启
动或被另一台服务器接管.当以上任一故障发生时,客户将能很快连接到新的应用服务上.
1.3久强世纪 Storage Solution 双机容错系统方案
Cluster集群可由N台服务器组成,当Cluster最小值N=2时,即为双机容错集群系统.
久强世纪Cluster双机容错系统结合了磁盘阵列产品的安全可靠性与HA监控软件技术的优点,将二
者的优势相互配合.使用软件与磁盘阵列结合的方案,可以有效提高主机工作效率,减轻服务器和网络设
备压力,保证系统稳定性.

二,系统概述

2.1 功能概述
·如果硬盘发生故障时,磁盘阵列柜会有蜂鸣声告警,同时硬盘架面板上的状态指示灯变成红色(正
常时为绿色),以便提醒用户进行及时有效的维护
·独特的硬盘保护环路设计,可以确保故障硬盘插拔时,即刻隔断与SCSI总线的连接,而不会影响
SCSI总线上的信号
·即时响应: 控制器在硬盘发生故障时即刻识别错误信息
·支持环境监控(当机箱内温度过高时会有蜂鸣告警声)
·冗余电源备份(支持热插拔)
·热插拔风扇
·系统安全密码锁定
·当柜门关闭时,仍可观察到控制器及硬盘工作状态
·支持不同品牌,容量,型号的SCSI硬盘
2.2 阵列柜结构

AccuSTOR S940阵列柜的组成包括RAID控制器,双电源保护装置,支持热插拔的硬盘盒(Mobile Rack)
等,大部分部件具有冗余能力,可以全面保护硬盘和数据的安全.
AccuSTOR S940的RAID控制器使用64-bit RISC处理器,基本缓存(CACHE)为64MB, 控制器提供4个
通道(Channel),其中两个为主机通道(Host Channel),2个为设备通道(Disk Channel),可同时接驳8块
硬盘,最大RAID5容量为7X146GB=1.02TB.
在控制器中,可以方便的给设置0,1,3,5,0+1级的RAID组.控制器带有Monitor接口,用户可
以通过该接口使用终端或终端仿真程序进行设置,可以对控制器的BIOS程序进行升级.
在阵列柜的顶部预留一个插槽,用户可以选装一个备份RAID控制器,以提高系统的可靠性.
AccuSTOR S940或内部与SCSI硬盘的接口是采用SCA-2规格的整体式后背板,可以直接使用80Pin
热插拔硬盘,配备转换口后,也可使用80Pin Ultra2/Ultra160硬盘.每一硬盘插槽配有隔绝保护IC,以
消除硬盘在热插时的电流负效应,避免瞬间电流造成对硬盘或控制器的损害.
AccuSTOR S940阵列柜安装双份热插拔电源,每个电源的功率300W,通过调整电压开关该电源可以在
110/220V电压下工作.
正常情况下,双电源在Share状态工作,各输出150W功率,保证电源的使用寿命.如果其中一只电
源发生故障,另一电源将自动转换到300W 输出功率状态,使阵列继续正常运转.同时系统将通过液晶屏
幕和蜂鸣方式发出警报,用户可以将损坏的电源直接拔除,而不必关闭阵列.
机箱后背板上装有四个热插拔冷却风扇,风扇的启动温度和转速受ENC控制,用户可以通过ENC上的

DIP开关进行设定.所有风扇均采用德国标准的三钢珠结构,使其使用寿命大大延长.
阵列柜中安置有8个硬盘盒,可以接驳80针Ultra2/Ultra160 SCSI硬盘和SCA硬盘,普通硬盘接入
阵列后,即支持热插拔功能.Mobile Rack可自动为硬盘设置ID,前面板上有指示灯,可以显示硬盘的工
作状态.
阵列柜后面板上装有HOST-A,HOST-B接口各两个,用来接驳主机.Monitor口可接至终端或PC机,
用来进行阵列的设置.Modem口可以接驳调制解调器,用于传真和Pager方式的远程报警.UPS口可连接
UPS电源,当断电时UPS系统会送出一PowerFail信号到此UPS接口上,此时磁盘阵列控制器会即刻将缓
存(Cache)的资料完整地写入磁盘中,并关闭缓存,如服务器再有资料传来则会直接写入硬盘内,直到电
源恢复正常.两个设备通道接口配备终结器,用户可以串联机柜或其他SCSI设备.
2.3 双机容错系统软件 HA
久强世纪 Storage Solution双机容错系统解决方案提供专用双机软件:HA.
HA For NT 作为目前市场上最为成熟的双机容错软件,以其友好图形操作界面,方便的配置与管理被
广泛应用于政府,学校,电信,电力,石油,交通等行业.
通过装在两个服务器中的双机热备份应用软件HA,系统具有在线容错能力,即当处于工作状态的服
务器无法正常工作时,通过双机系统容错软件,使处于守候监护状态的另一台服务器迅速接管不正常服务
器上的业务程序及数据资料,使得网络用户的业务交易正常运行,保证交易数据的完整一致性及交易业务
的高可靠性.
通过架设与两台服务器间的侦测网络,HA for NT软件能够对两台服务器的软硬件运行状态实行监控.
HA For NT具有两种工作模式:
Hot Standby:即双机热备份,两台服务器为生产机--备份机关系.当生产机发生故障时,备份机自
动接管生产机的任务和数据,使拥护业务交易正常运行.使用者可在最短时间内回复作业,使客户的应用
不必中断,减少主机停机所造成的损失.
Daul Active:即双机互备援.两台服务器各运行不同的应用任务,并互相作为备份机.当两部主机
中任一主机当机时,另一部主机可迅速接替故障主机任务.
三,系统整合
久强世纪 Storage solution双机容错系统是由HA容错软件与磁盘阵列有机组合的成熟方案.整个
系统的组合架构工作包括三个方面:
1)硬件系统的连接
2)容错软件的安装和配置
3)与用户应用的整合
3.1 硬件系统的连接
硬件部分的连接主要包括磁盘阵列与主机的连接和侦测网络的连接.
用户可以将支持多主机的磁盘阵列系统分别连接至两台服务器的SCSI接口. 磁盘阵列系统提供两条
标准68Pin外接SCSI电缆,可与任何服务器的Ultra 3 SCSI接口接驳.用户不需要在服务器上增加任何
硬件设备或驱动程序.磁盘阵列连接至主机后,用户可以象增加普通硬盘那样对其进行分区,格式化,安
装文件系统等操作.
HA for NT可使用三种侦测网络.
RS232线路:只需使用软件附带的专用电缆将两台服务器的串口连接即可;

TCP/IP:使用直连网线或通过交换设备(Switch或Hub)连接两台服务器的网卡;
Share Disk:在磁盘阵列柜上设置双主机共享的8MB分区;
以上三种侦测网络可同时使用,互为备份,有利于提高双机系统的可靠性.
3.2 容错软件的安装和配置
HA容错软件的安装简单快捷.整个安装过程中,用户不需要进行繁琐的安装选择,或更改服务器硬
件配备或操作系统设定与容错软件配合.
HA for NT具有友好图形用户界面(GUI),使容错软件的配置管理成为轻松的工作.
3.3 与用户应用的整合
久强世纪 Storage solution双机容错控制系统能够提供具有相当容错能力的应用系统平台.它既可
以同所有大型数据库配合使用,也可监管用户自主开发的应用软件.在与容错系统整合时,只需将数据库
系统分别在两台服务器安装,并将数据文件放置于共享的磁盘阵列即可,而不需要对应用程序进行任何更
改.

  • 璁$畻鏈瀹归敊鎶鏈閿欒蒋浠剁殑瀹氫箟
    绛旓細瀹炵幇瀹归敊鐨勫叧閿墜娈垫槸鍐椾綑锛屽寘鎷粨鏋勫啑浣欍佷俊鎭啑浣欍佹椂闂村啑浣欎互鍙婂啑浣欓檮鍔犳妧鏈傜粨鏋勫啑浣欐寚鐨勬槸鍦绯荤粺涓缃涓浉鍚岀殑缁勪欢锛屼互纭繚鍗充娇涓涓粍浠跺嚭鐜版晠闅滐紝鍏朵粬缁勪欢浠嶈兘缁х画宸ヤ綔銆備俊鎭啑浣欏垯鏄湪瀛樺偍鏁版嵁鏃朵繚鐣欏涓壇鏈紝浠ラ槻姝㈡暟鎹涪澶便傛椂闂村啑浣欏垯鏄氳繃瀹氭湡澶囦唤锛岀‘淇濆湪鏁呴殰鍙戠敓鏃惰兘鎭㈠鍒版渶杩戠殑姝e父鐘舵併傚啑...
  • 浠涔堟槸瀹归敊鎬
    绛旓細鍙潬鎬у浜庣伀绠彂灏勪箣绫诲叧閿у簲鐢ㄩ鍩熸潵璇村挨涓洪噸瑕併傝屽浜庨氱敤璁$畻鏈烘潵璇达紝涓涓噸瑕佺殑鎸囨爣灏鏄郴缁鐨勫彲鐢ㄦс傚彲鐢ㄦф槸鎸囧湪涓骞寸殑鏃堕棿涓‘淇濈郴缁熶笉澶辨晥鐨勬椂闂存瘮鐜囥傚彲娴嬫у湪瀹归敊绯荤粺鐨勮璁¤繃绋嬩腑涔熸槸涓涓潪甯搁噸瑕佺殑鎸囨爣锛屽鏋滄垜浠棤娉曞鏌愪釜绯荤粺杩涜娴嬭瘯锛屽張濡備綍鑳戒繚璇佸畠涓嶅嚭闂鍛紵姝ゅ杩樻湁MTBF锛堟晠闅滈棿...
  • 瀹归敊鏄粈涔鎰忔
    绛旓細閫氫織鏉ヨ锛瀹归敊鐜囧氨鏄寚鍏佽閿欒鍑虹幇鐨勮寖鍥村拰姒傜巼銆傚湪MOBA娓告垙涓閿欑巼鎸囦竴涓洟闃熼噷瀹圭撼闃熷弸鍜岃嚜宸卞嚭閿欒屼笉瀵艰嚧鍥㈢伃鐨勫嚑鐜囥備妇渚嬶細鐢佃剳寮鏍稿悗锛绯荤粺涓嶇ǔ瀹氾紝鍙互璋冭妭瀹归敊鐜 x Value (All Cores) -2%銆倄 Value (core 0) -2%銆倄 Value (core 1) -2%銆倄 Value (core 2) -2%銆倄 Value (core ...
  • 浠涔堟槸鑷籂閿欑郴缁,鍜瀹归敊绯荤粺鐨勫尯鍒槸浠涔?
    绛旓細瀹归敊绠鍗曞湴鏉ヨ锛屽氨鏄彂鍑洪敊璇殑鎸囦护锛岀粡杩绯荤粺鑷绾犻敊涔嬪悗鎵ц姝g‘鐨勬寚浠ゃ傚啑浣欏湪鏁版嵁涓績鍐呬竴鑸寚缃戠粶鍐椾綑鍜岀數鍔涘啑浣欙紝缃戠粶鍐椾綑涓鑸噰鐢ㄤ袱瀹朵互涓婄殑缃戠粶鏈嶅姟鎻愪緵鍟嗭紝淇濊瘉鍦ㄤ竴瀹剁綉缁滄柇璺椂锛屾暟鎹腑蹇冭繕鑳界户缁繍琛屻傜數鍔涘啑浣欎竴鑸浗鍐呮槸涓よ矾甯傜數锛屾垨涓璺競鐢靛姞涓璺煷娌瑰彂鐢垫満缁勩備繚璇佺數鍔涚殑姝e父渚涘簲銆
  • 涓夌被瀹归敊鏄寚
    绛旓細涓夌骇瀹归敊鏈哄埗 1銆佷竴绾у閿欙紙纭欢瀹归敊锛変竴绾у閿欐槸鎸囬氳繃纭欢璁捐鏉ュ疄鐜伴敊璇娴嬪拰绾犳鐨勫姛鑳姐傚父瑙佺殑纭欢瀹归敊鎶鏈寘鎷啑浣欏瓨鍌細鍦ㄨ绠楁満绯荤粺涓鍔犻澶栫殑瀛樺偍璁惧锛屼互渚垮湪鏌愪釜缁勪欢鍙戠敓鏁呴殰鏃讹紝绯荤粺鍙互鑷姩鍒囨崲鍒板鐢ㄨ澶囩户缁繍琛屻2銆佷簩绾у閿欙紙杞欢瀹归敊锛変簩绾у閿欐槸鎸囬氳繃杞欢璁捐鏉ュ疄鐜伴敊璇娴嬪拰绾犳鐨勫姛鑳...
  • 瀹归敊鐜囨槸瓒婇珮瓒婂ソ杩樻槸瓒婁綆瓒婂ソ
    绛旓細瀹归敊鐜囨槸瓒婇珮瓒婂ソ銆傚閿欑巼鏄寚绯荤粺鍦ㄩ潰瀵归敊璇垨寮傚父鎯呭喌鏃惰兘澶熺户缁甯歌繍琛岀殑鑳藉姏銆備竴鑸潵璇达紝瓒婇珮鐨勫閿欑巼瓒婂ソ锛屽洜涓洪珮瀹归敊鐜囧彲浠ユ彁楂樼郴缁熺殑绋冲畾鎬с佸彲闈犳у拰鍙敤鎬с傞珮瀹归敊鐜囩殑鍘熷洜锛1銆侀敊璇鐞嗚兘鍔涳細楂樺閿欑巼鎰忓懗鐫绯荤粺鍏锋湁鏇村ソ鐨勯敊璇鐞嗚兘鍔涳紝鍙互妫娴嬨佽瘑鍒拰绾犳閿欒锛屼粠鑰岄伩鍏嶇郴缁熷穿婧冩垨鏁版嵁涓㈠け銆
  • 璁$畻鏈瀹归敊鎶鏈殑瀹归敊鎶鏈蹇
    绛旓細褰撳嚭鐜版煇浜涙寚瀹氱殑纭欢鏁呴殰鎴栬蒋浠堕敊璇椂锛绯荤粺浠嶈兘鎵ц瑙勫畾鐨勪竴缁勭▼搴忥紝鎴栬呰绋嬪簭涓嶄細鍥犵郴缁熶腑鐨勬晠闅滆屼腑姝㈡垨琚慨鏀癸紝骞朵笖鎵ц缁撴灉涔熶笉鍖呭惈绯荤粺涓晠闅滄墍寮曡捣鐨勫樊閿欍傦紙2锛瀹归敊璁$畻鏈虹郴缁燂細鍦ㄥ彂鐢熸晠闅滄垨瀛樺湪杞欢閿欒鐨勬儏鍐典笅浠嶈兘缁х画姝g‘瀹屾垚鎸囧畾浠诲姟鐨勮绠楁満绯荤粺銆傦紙3锛夎璁′笌鍒嗘瀽瀹归敊璁$畻鏈虹郴缁熺殑鍚勭鎶鏈О...
  • 浠涔堟槸绯荤粺瀹归敊?
    绛旓細閫氳繃瑁呭湪涓や釜鏈嶅姟鍣ㄤ腑鐨勫弻鏈虹儹澶囦唤搴旂敤杞欢HA,绯荤粺鍏锋湁鍦ㄧ嚎瀹归敊鑳藉姏,鍗冲綋澶勪簬宸ヤ綔鐘舵佺殑鏈嶅姟鍣ㄦ棤娉曟甯稿伐浣滄椂,閫氳繃鍙屾満绯荤粺瀹归敊杞欢,浣垮浜庡畧鍊欑洃鎶ょ姸鎬佺殑鍙︿竴鍙版湇鍔″櫒杩呴熸帴绠′笉姝e父鏈嶅姟鍣ㄤ笂鐨勪笟鍔$▼搴忓強鏁版嵁璧勬枡,浣垮緱缃戠粶鐢ㄦ埛鐨勪笟鍔′氦鏄撴甯歌繍琛,淇濊瘉浜ゆ槗鏁版嵁鐨勫畬鏁翠竴鑷存у強浜ゆ槗涓氬姟鐨勯珮鍙潬鎬. 閫氳繃鏋惰涓庝袱鍙版湇鍔″櫒...
  • 浠涔堟槸瀹归敊绯荤粺?璇蜂妇渚嬭鏄!
    绛旓細鍏跺疄鍙屾満鐑鍜屽弻鏈瀹归敊鏄竴涓蹇;浠庡箍涔変笂璁诧紝鍙屾満鐑锛堝弻鏈哄閿欙級灏辨槸瀵逛簬閲嶈鐨勬湇鍔★紝浣跨敤涓ゅ彴鏈嶅姟鍣紝浜掔浉澶囦唤锛屽叡鍚屾墽琛屽悓涓鏈嶅姟銆傚綋涓鍙版湇鍔″櫒鍑虹幇鏁呴殰鏃讹紝鍙互鐢卞彟涓鍙版湇鍔″櫒鎵挎媴鏈嶅姟浠诲姟锛屼粠鑰屽湪涓嶉渶瑕佷汉宸ュ共棰勭殑鎯呭喌涓嬶紝鑷姩淇濊瘉绯荤粺鑳芥寔缁彁渚涙湇鍔°傚弻鏈虹儹澶囦竴鑸儏鍐典笅闇瑕佹湁鍏变韩鐨勫瓨鍌ㄨ澶囥
  • 鐜嬭瀹归敊鏄粈涔鎰忔濆晩?
    绛旓細鍦ㄥ疄鐜拌繃绋嬩腑锛岄渶瑕佷娇鐢ㄥ悇绉嶆妧鏈拰鎵嬫锛屽鏁呴殰闅旂銆佸浠藉拰鎭㈠銆佺洃鎺ф姤璀︾瓑绛夈傛澶栵紝瀵绯荤粺杩涜棰戠箒鐨勬祴璇曞拰妯℃嫙锛屼互灏藉彲鑳藉湴棰勬祴鍜屾ā鎷熺郴缁熷湪鐢熶骇鐜涓嬪彲鑳藉嚭鐜扮殑闂锛屼粠鑰屽彲浠ユ洿濂藉湴鍘诲鐞嗗拰淇鐜板疄涓嚭鐜扮殑鏁呴殰銆傜帇鑰瀹归敊闇瑕佷繚鎸佹寔缁殑鍏虫敞鍜屾姇鍏ワ紝鍦ㄧ郴缁熻繍缁村拰鏀硅繘鐨勬暣涓敓鍛藉懆鏈熶腑閮介渶瑕佽冭檻瀹归敊鎬...
  • 扩展阅读:安卓手机不兼容怎么办 ... 什么是系统的容错设计 ... 电脑系统不兼容的表现 ... 系统和子系统 ... 容错控制系统 ... 手机兼容模式怎么开 ... 系统容错机制 ... 容错机制的三大标准 ... 什么叫系统 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网