磁带存储重出江湖

 

近来大数据分析和人工智能的发展强力刺激着企业收集对其业务各方面有影响的信息,这不足为奇。当前,金融监管部门要求金融机构的记录保存时间比过去更长,形形色色的公司和机构正在保存越来越多的信息。
研究表明,记录的数据量每年增长30%至40%。与此同时,存储大部分数据的现代硬盘容量的增长率仅为数据量增长率的一半。幸运的是,大部分信息无须实时访问。对此,磁带是一个理想解决方案。
磁带?真的吗?有人可能会联想到《电脑风云》或《奇爱博士》这样的老电影中笨重主机旁间断旋转的带盘的画面。经现状核实:磁带从未消失!
事实上,全球大多数数据都保存在磁带上,包括基础科学数据,如粒子物理学、射电天文学,还有人类遗产和国家档案、电影、银行、保险、石油勘探等数据。甚至还有一群人(材料科学、工程学或物理学的专业人员,包括我在内)致力于不断改进磁带存储。
磁带已经存在很长时间了,但这一技术并未停滞不前。恰恰相反,如硬盘和晶体管一样,磁带在过去几十年中取得了巨大进步。
首个商用数字磁带存储系统IBM Model 726能够在一卷磁带上存储约1.1兆字节(MB)的数据。如今,一个盒式磁带能够容纳15太字节(TB)的数据,单个机械手自动磁带库可容纳高达278拍字节(PB)的数据。如将这么多的数据存储在光碟上,需要3.97亿张光碟,这些光碟堆在一起,可形成一座逾476千米高的塔。
的确,磁带虽然不能提供类似硬盘或半导体存储器那样快速的访问速度,但仍然具有众多优势。首先,磁带存储更节能:记录下所有数据后,磁带盒就会被安静地存放在自动磁带库的卡槽中,不消耗任何能量。其次,磁带非常可靠,出错率要比硬盘低4到5个数量级。另外磁带也非常安全,配有内置和动态加密,以及介质自身的性质带来额外的安全性。毕竟,不将磁带盒放入驱动器中就无法访问或修改数据。鉴于网络攻击导致的数据盗窃日益猖獗,这一“空气间隙”(物理隔离网闸)具有特别的吸引力。
磁带的离线特性还可对软件错误增设一道防线。例如,2011年,一次软件更新故障致使谷歌意外删除了约4万个谷歌邮箱账户中保存的邮件信息。尽管在多个数据中心的硬盘上存储了多份数据副本,依然造成部分数据丢失。幸运的是,这些数据还存储在磁带上,谷歌最终通过磁带备份恢复了所有丢失的数据。
2011年的谷歌邮箱事件首次披露云服务提供商在运营中使用磁带。近期,微软也声称其Azure Archive Storage使用了IBM磁带存储设备。
尽管具备这些优点,但企业使用磁带往往只是出于经济考虑。磁带存储的成本仅为磁盘存储等量数据成本的1/6,这就是为什么有海量数据的地方就有磁带。但是,由于磁带现已完全从消费级产品中消失,大多数人都没有感觉到它的存在,更不用说注意到磁带记录技术近年来已经取得以及在可预见的未来会继续取得巨大进步了。
总而言之,磁带已经伴随我们几十年,未来几十年仍将继续存在。我为何会如此肯定?且听我慢慢道来。

磁带存在的时间如此之久,根本原因是——便宜。而且越来越便宜。这种情况会持续下去吗?

你可能会认为,如果往磁盘中塞入更多数据的能力正在削弱,那么磁带也应如此,因为它使用的基本技术是相同的,甚至更古老。但令人惊奇的是,磁带容量的扩展速度没有出现减缓的迹象。事实上,它将继续保持以每年约33%的历史速度持续多年增长,这意味着,磁带的容量每2至3年就会翻倍。这就是磁带的摩尔定律。
对于那些必须存储数量激增的数据而预算又不变的人,这是个好消息。要了解为何磁带(而不是硬盘)仍拥有如此巨大潜力,需考量磁带和硬盘的发展历程。
两者依照相同的基本物理原理来存储数字化的数据。其原理是,在磁性薄膜材料上有窄磁道,磁性可在两种极性状态之间转换。信息经编码变成一串比特位元,用沿磁道特定点位处是否发生磁性转换来表示。自20世纪50年代推出磁带和硬盘以来,二者的制造商皆打着“密度更高、速度更快、价格更低”的口号。因此,二者按美元计的每吉字节(GB)容量成本都已经下降了多个数量级。
成本的降低要归功于磁性基片每平方毫米可记录的信息密度呈指数增长。磁录密度是数据磁道的记录密度和垂直方向的磁道密度的乘积。
早期,磁带和硬盘的磁录密度相近。但硬盘的市场规模和销售收益的快速增长为更大范围的研发工作提供了资金,促使制造商更为积极地提高硬盘的磁录密度。因此,当前高容量硬盘的磁录密度约为磁带磁录密度的100倍。
尽管如此,因磁带可用于记录的表面积较大,当代最先进的磁带系统能够提供的本机盒容量高达15TB,高于市场上容量最大的硬盘。尽管如此,两种设备占用的空间几乎相同。
除了容量,磁带和硬盘的性能特征截然不同。一盒磁带的长度通常是几百米,平均数据访问时间达到50至60秒,而硬盘只需5至10秒。但令人惊奇的是,数据写入磁带的速度竟是写入磁盘速度的2倍。
过去几年,硬盘数据的磁录密度的增长速度由历史上的年均40%左右放缓至10%至15%。其原因与基础物理学相关:要在给定的区域记录更多数据,就要减小为每一个位元分配的区域。因而,这又会造成数据读取时信号的减弱。如果信号过度减弱,它将因磁盘上磁性涂料中颗粒产生的噪声而丢失。
缩小颗粒尺寸可以减少背景噪声。但是在不影响维持磁性状态稳定的情况下,很难将磁性颗粒缩小到一定的尺寸。用于磁记录的最小尺寸颗粒在该行业中称为超顺磁极限。磁盘制造商已经达到这一极限。
直到近期,这种衰退趋势对消费者的影响才没有那么明显,这是因为磁盘驱动器制造商通过增加磁盘的磁头和盘片数量,来增加相同尺寸设备的容量,以此进行弥补。但目前可用的空间以及增加磁头和盘片的成本都限制了磁盘制造商的盈利,且这一停滞期开始愈发明显。
几项正在开发新技术可使硬盘超越目前超顺磁极限。这些技术包括热辅助磁记录(HAMR)和微波辅助磁记录(MAMR),它们可使用更小的颗粒,允许磁化更小的磁盘区域。但这些方法增加了成本,引入了棘手的工程难题。制造商表示,即使取得成功,增长能力仍可能受限。例如,西部数据公司近期宣布,2019年开始销售微波辅助磁记录硬盘,预计磁录密度每年将仅扩展15%左右。
与之相反,磁带存储的磁录密度远低于超顺磁极限。因此磁带的摩尔定律可以延续10年甚至更久,而不会遇到基础物理学方面的障碍。
但是,磁带仍然是一项棘手的技术。它的可移动属性、薄聚合物基板而非刚性的盘片、多达32个磁道同时记录,对设计者来说都是巨大的障碍。这就是为什么我在IBM苏黎世研究实验室的研究团队一直努力寻找可实现磁带的持续扩展的方法,或者调整使用硬盘技术,或者发明一种全新的方法。
2015年,我们与富士胶片公司的合作者证明,在磁带垂直方向上使用超小钡铁氧体粒子,记录数据密度是目前商业技术所能达到密度的12倍以上。近期,在与索尼存储媒体解决方案项目的合作中,我们演示了以达到当前最先进磁带机约20倍的磁录密度记录数据的可行性。从长远来看,如果此技术实现商业化,一个电影工作室现在可能需要十几盒磁带来存档的一部商业巨片的所有数字资料,就可存于一盘磁带上。
要实现这种扩展,我们需要一系列的技术进步。举例而言,我们改进了读写磁头追随磁带的细长磁道的能力。在我们的最新演示中,磁道的宽度只有100纳米左右。
我们还必须减小数据读取器的宽度,由微米级减小到50纳米以内。数据读取器是用于读回数据磁道记录的磁阻传感器。使用如此微小的读取器获取的信号将布满噪声。需要通过增加介质固有的信噪比来进行补偿,固有信噪比与磁性颗粒的成分、尺寸和方位以及磁带表面的平滑度和光滑性相关。为了进一步强化,我们还改进了设备的信号处理和纠错方案。
为了确保新型磁介质记录的数据能够留存几十年,我们改变了记录层中磁性粒子的性质,使它们更加稳定。但是最初,这种改变令数据记录变得很困难,普通的磁带传感器无法可靠地写入新磁介质。因此我们使用特殊写磁头。它产生的磁场比传统磁头的产生的磁场要大得多。
结合这些技术,我们在实验室系统中读取和写入数据的线性密度达到每英寸81.8万位元。(出于历史原因,全球各地的磁带工程师以英寸计量数据密度。)结合新技术能够处理每英寸24.62万个磁道,我们的原型设备达到了每平方英寸201GB的磁录密度。假设一个磁带盒可以容纳1140米的磁带(基于我们缩减了新型磁带介质的厚度,这个假设是合理的),此磁录密度相当于一盒磁带的容量高达330TB。这意味着一盒磁带能够记录的数据量与一手推车硬盘所能记录的数据相当。

2015年,包括惠普、IBM、甲骨文和昆腾以及众多学术研究小组在内的信息存储行业联盟发布了“国际磁带存储路线图”。其预测,到2025年,磁带存储的磁录密度将达到每平方英寸91GB。根据这一趋势推断,到2028年,每平方英寸将超过200GB。

该路线图的作者们都对磁带存储的未来发展非常感兴趣。但你不必担心他们是否过于乐观。我和我的同事近期的实验证明,每平方英寸200GB是完全可行的。因此,在我看来,在未来至少10年内,磁带将能确保以往的增长势头。
事实上,磁带可能是最后遵循摩尔定律增长趋势的信息技术之一,这种增长趋势将维持至10年后,甚至更长。这一趋势将进一步增加磁带相对于硬盘及其他存储技术的成本优势。磁带尽管很古老,很难在黑白电影之外见到,但它仍将存在很多年。
作者:Mark Lantz

作者:极客石头

在搞事情的路上越走越远。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注