作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (13): 230-235. doi: 10.3969/j.issn.1000-3428.2010.13.082

• 开发研究与设计技术 • 上一篇    下一篇

计算机系统容错技术研究

陆 阳1,王 强1,张本宏1,诸葛战斌2   

  1. (1. 合肥工业大学计算机与信息学院,合肥 230009;2. 合肥工大高科信息技术有限责任公司,合肥 230088)
  • 出版日期:2010-07-05 发布日期:2010-07-05
  • 作者简介:陆 阳(1985-),男,教授、博士、博士生导师,主研方向:分布式控制技术,离散事件控制系统,可靠性工程;王 强,博士研究生;张本宏,讲师、博士研究生;诸葛战斌,高级工程师、硕士
  • 基金资助:
    国家自然科学基金资助项目(60873195);安徽省自然科学基金资助项目(070412049)

Research on Fault-tolerant Technology for Computer System

LU Yang1, WANG Qiang1, ZHANG Ben-hong1, ZHUGE Zhan-bin2   

  1. (1. School of Computer & Information, Hefei University of Technology, Hefei 230009; 2. GOCOM Information & Technology Co., Ltd., Hefei 230088)
  • Online:2010-07-05 Published:2010-07-05

摘要: 针对计算机系统中软、硬件可靠性问题的不同特点,讨论容错技术的最新发展现状,分析计算机系统中的各种容错方法,包括传统的冗余设计、错误回卷恢复机制以及当前研究较多的一般化容错设计方法等,研究目前已有的一些容错方法在反应延迟、容错成本、精确量化、异构同步、可靠性建模等方面存在的缺陷以及待解决关键问题,并对如何进一步更好地完善和使用这些容错方法进行总结。

关键词: 计算机系统, 容错, 冗余, 软件错误, 硬件错误

Abstract: According to different acharacteristics of software reliability and hardware reliability, this paper discusses the current developping status about fault-tolerance technology, and analyzes various ideas and strategies of fault-tolerance methods in computer systems including redundance, error rollback recovery mechanism and generalized fault-tolerant design method etc. Some defects and key issues for some existed fault-tolerance methods on reaction delay, fault-tolerance cost, precise quantification, heterogeneous synchronous, reliability modeling are pointed out. How to improve and use these methods better is suggested.

Key words: computer system, fault-tolerance, redundancy, software error, hardware error

中图分类号: