DC娱乐网

新一代国产RAS方案发布

近年来,数智化浪潮澎湃迭进,企业数据管理也迎来新一轮模式变革。尤其在数据安全领域,从单个硬盘的可靠性指标到“芯-云”全栈

近年来,数智化浪潮澎湃迭进,企业数据管理也迎来新一轮模式变革。尤其在数据安全领域,从单个硬盘的可靠性指标到“芯-云”全栈系统化升级,随着存储RAS技术在国产存储链路中的应用愈发深入,产业上下游正构建起高效协同的生态纽带,目标直指数据存储全域安全高地。

2025年,在国家信息安全和自主可控要求下,国产化存储链路建设不断提速。与此同时,面向SSD监控和故障预测等细分存储场景,传统Smart ID模式也暴露出一系列技术难点:如各家Smart ID定义不一致,难以统一;可监控指标性少,缺乏后续延伸性等。

基于此,国内存储产业上下游展开双向奔赴。中科可控率先联合国产C86处理器和硬盘、存储控制器等部件厂商,打造出新一代全国产RAS方案。该方案围绕全栈存储产品环节,制定监控ID及故障预测ID指标项,并统一对应故障监控项&预测项logpage地址和故障等级定义,在网卡故障信息收集规范、故障管理及上报机制方面,形成先进的标准化落地能力。

在这一方案中,RAS已不再是单一产品的特性指标,而是贯穿设计、制造、集成、运维全流程的生态纽带。包括国产处理器、存储阵列控制器、硬盘厂商,网卡厂商以及BMC等全栈环节,基于开放式生态底座实现了深度协同,使错误校正从被动应对变为主动预防。并且通过在架构设计初期就融入RAS理念,实现了从指令集到接口协议的全链路优化。

中科可控全国产RAS方案流程图

l 固件级的开放标准

各厂商遵循统一的RAS接口标准,通过硬盘固件本身进行量化打分,并根据不同分值对健康值进行相应的判断,为智能化运维提供基础。健康度分值及监控项将存放于硬盘的日志页(Log Page)的某个字节中,支持带内和带外接口获取,使不同品牌的硬盘能够在同一存储池中实现智能协作。当某一硬盘检测到异常时,可立即向系统发出预警,并启动跨设备的负载均衡。

RAS 软件方案

l 系统级的资源调度

设备端采集底层原始数据,为带内故障预测模型提供再训练数据源,实现预测准确度的自我进化;BMC平台及国产存储控制器基于指定的健康度算法进行信息监控和预判读,并将标准化评估结果进行上报,实现系统级的故障预警。

l 开箱级的实用功能

方案具备开箱即用的一键预测功能,且当某个环节出现预警时,系统能精准定位到详细的错误细节,给出对应的等级提示或处理建议,进而联动本土服务团队提供快速响应和更换。这大大缩短了系统的平均修复时间,将数据风险降至最低。

l 盘内级的侦测能力

在盘内风险监测上,方案针对DDR 可纠正错误(DDR correctable error)的侦测能力同样亮眼,通过分级响应机制实现全流程风险可控:当检测到少量报错时,BMC SEL 日志会记录轻微事件,硬盘监控页面同步给出低风险提示,方便维护人员及时关注;当错误满足一定条件时,BMC SEL 日志将记录严重事件,监控页面升级为中风险提示,强化预警等级;若错误达到特定数量,BMC SEL 日志会标记为紧急事件,监控页面直接给出换盘建议,推动问题快速解决。

在数据成为核心生产要素的今天,打造全域安全高效的存储技术方案势在必行。真正的数据安全,源于整个产业链的协同创新。当RAS从局部产品特性演进为生态系统能力,我们迎来的不仅是可靠的数据存储底座,更是一个更加智能、开放、安全的数字未来。