PGStudy-静默数据损坏SDC缓解-Farron工具
Understanding Silent Data Corruptions in a Large Production CPU Population
期刊: (发表日期: 十月 23, 2023) 作者: Shaobu Wang; Guangyan Zhang; Junyu Wei; Yang Wang; Jiesheng Wu; Qingchao Luo |
---|
摘要翻译: 对SDCs的静默特性导致目前对SDCs的研究相对较少的特性做出介绍 对大型生产处理器——超过100万个处理器中的SDK进行了研究 1. 对某些处理器功能是否特别脆弱,以及他们对应用程序的潜在影响 2. 探究可信的SDCs的重复触发条件以及划分更难重现的SDCs 3. 缓解SDCs的挑战和机遇 对应SDCs的观察结果开发了Farron,依赖于优先级测试来检测高度可重复的SDCs |
期刊分区:SOSP顶会 |
Local Link: Wang 等 - 2023 - Understanding Silent Data Corruptions in a Large Production CPU Population.pdf |
文章四问
Q1: 为什么看? (推荐? 关联? 解决问题?)
A1: 同门推荐,容错计算,SDC,提出了对SDC现有模型的挑战,并提出了更优的解决方式Farron
Q2: 文章写的什么? (创新点? 工具? 实现路径?)
A2: 创新点是对现有SDC模型的挑战,使用工具是Pin插桩与OpenDCDiag
Q3: 效果如何? (效果图? 结果? 评价?)
A3:在检出率,性能方面都有提升,评价还行,但有点缺乏创新
Q4: 感受怎样? (感受? 收获? 思考? 复看?)
A4:了解了一种容错计算中出现的错误,了解了一些工具