整理 | Ricky
作者 | 王与桐
(资料图)
软件定义存储(SDS),并不是个新概念,但是在创投圈子却还是年轻的。
该概念发展至今已有十余年的历史,相关的技术和产品在2010年前后开始进入商用市场,初期主要用于互联网等行业,具体场景是需要海量数据存储、高访问并发量、但是对数据的可靠性和一致性要求并不苛刻等业务场景。
在2015年左右,随着云计算的普及,以及移动互联网进入井喷期,数据量急剧增加,因此软件定义存储/分布式存储开始在企业级市场得到大量应用,尤其是在虚拟化和云计算环境中,存储资源需要池化和弹性扩容,软件定义存储搭配普通服务器硬件组成分布式存储集群成为当然之选。由于分布式架构和软件定义带来的诸多优势,SDS也被公认是数据存储系统的未来发展方向。
从SDS技术的现实情况来看:
一方面,SDS在公有云平台上得到了广泛的应用。目前所有的公有云大平台,它们的存储架构都采用的是软件定义存储架构,不会有任何公有云使用以EMC为代表的传统存储架构。
另一方面,目前整个企业级市场在存储领域的投资仍然集中在传统存储架构上,采购的也大都是传统的存储产品。而华瑞指数云主要是面对企业级市场,目前SDS的市场份额占比还比较低,并且主要应用于中低端业务场景,但是随着企业IT架构的现代化升级和演进,未来增长空间较大。
另外,SDS本身也需要迭代升级——从1.0进化到2.0——这也是华瑞指数云想要做的。
36氪此次采访了华瑞指数云联合创始人&CTO曹羽中,以及华瑞指数云早期投资人明势资本董事总经理徐之浩。曹羽中曾任华为公司云与计算BG 西欧区 CTO,华为公有云创始核心专家,华为私有云首席架构师,美国IBM私有云产品SCE首席架构师等,对云计算赛道以及软件定义存储赛道有着纵深的理解和广阔的视野。他将从"科普"的角度,解释SDS是什么,为什么我们要进入SDS2.0时代。
以下是对话实录,36氪整理:
36氪:软件定义存储这个行业还在发展过程中,能不能先简单介绍一下该行业的基本情况。
曹羽中:软件定义存储这个概念已有十余年的历史。从技术愿景的角度来说,自从这个概念推出以来,整个产业界都认可这是存储领域的发展方向和未来,比如Gartner从2015年起一直到最新的2022年,在其每年发布的"存储和数据保护技术周期报告"中都把SDS列为存储领域的变革性技术,甚至是唯一的变革性技术。
从该技术的现实情况来看:一方面,它在公有云平台上起到了很大的作用。目前所有的公有云大平台,它们的存储架构都采用的是软件定义存储架构,不会有任何公有云使用以EMC为代表的传统存储架构;另一方面,目前整个企业级市场在存储领域的投资仍然集中在传统存储架构上,采购的也是传统的存储产品,SDS产品虽然也开始在一些企业广泛部署使用,但是主要应用于中低端业务场景,它们并没有选择大步朝软件定义存储的方向迈进,在我看来,这是一个错位。
公有云全部采用了SDS方向的技术,但企业市场并没有。我们团队曾经长期从事公有云IaaS层分布式基础软件的研发,最大的愿景是用软件定义存储的架构真正改变企业对其的抵触心态。
另外一些比较深层次的原因,软件定义存储在企业级市场上并没有大厂家出现,传统存储巨头很难从战略层面对SDS产品进行大规模投入,大型公有云厂商主要把SDS当作整体IaaS底座的一部分。这也预示着这是一个会有很大变革机会的领域。
从IT基础架构的发展来看,存储架构与计算架构是需要配套发展的。从计算架构的角度来说,其实已经大步迈向分布式架构,微服务架构,分析型引擎,数据驱动计算等新范式,整个企业级应用都在朝向云原生应用发展。但是对于存储架构来说,在今天的线下的企业级数据中心市场,很大一部分投资还是在集中式架构,硬件形态为主的传统存储阵列,虽然也有一些企业已经部分采用了SDS,但只用承载外围的中低端应用,只占其存储投资的小部分,没有进入的主流赛道,远远不足以驱动企业数据架构的大变革。
我们团队希望使用软件定义存储的架构完成整个企业级存储架构的演进,让它变成一个统一的SDS架构,进而支撑起整个企业的数据底座,我们计算架构的云原生架构以及应用架构将向新的应用形态演进,整个趋势都能把它匹配起来,这也是我们的总体方向。
36氪:SDS分布已经从1.0时代发展到2.0时代,可以详细地介绍一下二者有哪些区别吗?行业的哪些变化又导致了这些区别的产生?
曹羽中:SDS1.0诞生的这十多年时间里,其被贴上了中低端存储的标签,没有进入企业存储的中高端市场,更不足以成为真正的企业级存储架构的变革者和主流选择。
第一代SDS软件(SDS 1.0) 起源于18年以前,开源Ceph软件为典型代表,随着互联网,云计算和大数据时代的到来获得了较为广泛的采用,但是第一代SDS软件(SDS1.0)存在先天不足——面向慢速硬件和网络时代设计,存储系统的IO处理效率局限性明显,IOPS低、时延大,性能稳定性和可靠性都难以匹配企业关键业务的需求,且进化速度也比较缓慢,SDS 1.0不可避免地进入了瓶颈期。
存储产品最重要的几个性质是可靠性、性能与时延。尽管1.0版本理念与方向是先进的,同时天然地贴合企业未来发展,可惜在上述三项核心能力上没有达到集中式架构应有的水准。所以我们提出2.0的新概念。SDS 2.0作为新一代存储系统软件,首先需要适应新兴的高速硬件和网络技术的要求,通过软件层IO栈的颠覆性的改变,实现IO处理效率的数量级提升,能够充分的压榨出新一代硬件的极限性能,能够通过软件技术创新,而不是依赖于专属硬件设计,来提升系统的总体可靠性,故障容错能力和故障恢复的效率,在IOPS,时延,可靠性等存储系统的核心指标上,能够达到替换传统高端存储阵列的水准。其次,面向海量数据处理场景,需要提供高吞吐,大并发,性能和容量的线性扩展能力,支撑高性能,低时延的数据实时分析处理。第三,企业在数字化转型过程中,会经历一场深刻的转变,从以应用和业务流程为驱动,转变为以数据为驱动,企业迫切需要构建新一代数据基础设施,能够实现数据的天然的共享存储,共享访问,统一管理和智能流动,还能更好地满足数据跨越混合多云及边缘的应用需求。为了满足这样的需求,SDS2.0作为一个统一的存储系统软件,需要从架构和元数据管理层面有充分的前瞻设计和全新的工程实现。
36氪:关于SDS迭代,为什么会从1.0时代进化到2.0?
曹羽中:我从两个方向回答。一方面,是需求侧发生的变化;另一方面,是技术侧发生的变化。
从需求侧来说,一个是AI,另一个是国内的信创,需要我们核心的系统或数据库搬到国产自主可控的大平台上,存储技术就包括其中。企业IT云化转型走向深入,会把更多的企业关键应用,核心应用,各类围绕着OLTP数据库构建起来的系统迁移到国产自主可控的云化平台上,在这个过程中,云平台对于软件定义存储技术提出了更高的要求,需要软件定义存储具备以软件定义的方式去替代各类传统存储和全闪阵列的能力。 数字化技术和AI的广泛采用,将推动大数据的分析和应用由原来的批处理走向实时数据分析,将需要存储层在应对海量数据存储高并发访问的同时,提供更低的IO读写时延。从存储系统的信创角度,我们并不能仅仅满足于研发同质化的产品实现对国外存储系统的平替,信创存储产品能够借助软件定义存储的架构实现弯道超车,换道超车,实现我国在企业存储领域的超越。
从技术侧来说,首先计算范式发生了很大的变化,比较明显的是原先的算力主要通过CPU形式来提供,往后更多的通过GPU这类更专用的硬件形式提供。GPU极大的提升了数据的并行处理能力,与CPU读取和处理数据的方式是很不一样的,需要有跟它的并行处理能力相匹配的数据底座。就比如取外卖时只有一个外卖架投入使用,在外卖不多时是可以满足需求的,在GPU运算时代,可能相当于整个公司的人都同时去取外卖,原先的外卖架就不能满足需求了。
过去十几年来,硬盘介质和网络等基础硬件发生了很大的变化。譬如存储介质已经实现了大规模的从机械硬盘向SSD固态硬盘的过渡,由此带来了硬件层面的超高IOPS和超低时延,新兴SSD介质相比磁介质,性能提升了1000倍,访问时延下降了数百倍,达到了10us级;网络带宽由过去的10M和100M已经提升到现在的10G和100G, 提升了1000倍,随着RDMA等新兴技术的出现,网络访问时延已经下降数百倍,达到了10~20us的水平。然而,目前市场上主流的第一代SDS的IO软件栈还是采用的15~18年以前的系统架构,处理单个IO的时延会达到几百us之多,比今天的网络和介质要慢一个数量级,软件IO栈已经成为了整个数据存储系统的主要瓶颈。
打个比方,2005年的游戏是没有办法把2023年的电脑跑满的,硬盘,网络等处于一个很闲的状态,也没有办法把今天的3090,4090显卡充分的用起来给用户带来优秀的体验。客户花钱买下新一代硬件,但可能硬件上只有10%左右的潜力被挖掘出来,还有90%的IO能力被闲置,这不就是一种资源的巨大浪费吗。
其实我们可以这么说,通用标准硬件发展到现在这个阶段,再加上软件技术的完整革新,在存储领域我们已经具备用SDS软件+通用标准硬件完全替换掉集中式架构的高端存储阵列的能力了。
36氪:您提到的"硬件到目前这个阶段"是从什么时候开始的?
曹羽中:硬盘介质方面,NVMe SSD相比传统的机械硬盘HDD,从性能,时延,可靠性等维度都是远远优胜,除了成本。实际上最近这几年NVMe SSD的每TB成本一直在下降,大家对它的预期是等NVMe SSD的成本进入到所谓的颠覆点,到了这个点之后,企业的热数据存储乃至温数据存储都不会再采购机械硬盘,企业采购全闪介质的投入就会大于HDD上的投入,企业数据中心的全闪时代就到来了。这个时间点预期在未来几年就会出现,当SSD的成本下降到某一点时,整个企业级市场就没有再去采购HDD作为主存储介质的理由。就像笔记本电脑实际上就已经发生类似的事情,从某个时间点起,所有的笔记本电脑里就都没有机械硬盘了。
企业数据中心网络的大变化其实很快也会发生。基于RoCEv2协议的RDMA正在走向大规模成熟商用。目前的新一代25GE以太网交换机和网卡中,RoCEv2几乎已经是标配了,随着企业网络从10GE向25GE的升级,企业数据中心网络大范围支持基于RoCEv2协议的RDMA网络是在几年内即将发生的事,RDMA网络的超低时延,将极大的利好于分布式架构和存算分离架构,也为分布式的SDS软件在要求高性能和低时延的业务领域去平替集中式存储提供了现实基础。
技术此消彼长时就会出现交叉点,我们已经看到了交叉的趋势,等待交叉点的到来。在硬件升级的交叉点到来时,我们希望通过实现SDS软件的换代升级,使SDS这样的产品形态有能力切入企业更核心,更高端的业务系统,进而实现SDS换代替换传统硬件盒子式的存储产品的交叉点。
36氪:所以我可以理解为,目前这个领域仍处于市场教育的阶段,你们现在所做的是抢占窗口期,等到时间点到来的时候,你们已经成为占领市场的一方?
曹羽中:现在NVMe+RDMA网络这样的硬件组合还属于比较高端的市场。只有在比较高端的业务场景里,客户才会考虑掏钱购买NVMe SSD加RDMA网络这样的配置。但是如前所述接下来几年这个配置就会成为一种硬件采购的标配,会成为一个通用的主流市场。这种情况下,我们的新一代SDS2.0这样的软件架构产品的市场规模、可以触达的客户业务场景将会快速扩大。
现在我们和客户谈的是,在今天主流的普通机械硬盘HDD加10GE TCP/IP网络的硬件条件下,我们的SDS2.0软件相比市场上的SDS1.0产品也会有几倍的性能提升,但它还不是颠覆性的,但是当你硬件环境进化到NVMe SSD+RDMA网络的层次,SDS2.0软件架构相比市场上的SDS1.0软件的性能提升将达到几十倍,是碾压式,颠覆性的提升,故障恢复速度,可靠性的提升也将是巨大的。客户几乎没有任何理由在NVMe SSD+RDMA网络这样的新一代高速硬件上使用低速的SDS1.0时代的SDS软件。
36氪:SDS2.0与AFA的关系是?
曹羽中:在过去的行业认知里,SDS产品是低端存储,FC SAN混闪阵列是中端存储,AFA全闪阵列是高端存储。我们推出SDS2.0产品WDS,是软件定义的分布式架构,但是完全攻克了过去分布式存储架构IOPS低,时延大,时延不稳定的固有缺点,从IOPS,时延,可靠性等核心指标上来评价,是可以达到乃至超越AFA高端全闪阵列的水准的,可以作为AFA的一个更现代化的替代品。SDS2.0又不仅仅是对AFA的平替,WDS有许多AFA做不到的能力,比如纯软件交付,容量水平扩展,性能线性扩展,自动化的资源调度,与云化环境/云原生环境的无缝融合,无特定硬件依赖,业务无损的无缝升级扩容,与计算引擎的协同优化,数据的池化和智能流动等等。所以SDS2.0在企业存储架构的现代化演进上面将扮演主要的角色。
打个比方,假设一个很极端的场景,华为云或者阿里云使用AFA的存储架构,如果用户需要申请网盘,它们做的事就是往里头堆一根线,说:"兄弟,hold住,我往那堆一个机器,堆完以后再接到里面去。"然后再打个电话给客户说:"兄弟,现在可以使用了,你用的是什么端口?"
极端一点就是这样。为什么全球的大型公有云平台不采用AFA这样的存储架构和产品去承载企业级应用呢?有成本的因素,采购商用的AFA产品很昂贵,硬件的备件更换等等也需要采购专门的硬件,显著的增加了备件采购成本和运维成本。更重要的是技术上的考量,因为传统的AFA架构首先是一个硬件,由管理员基于复杂的配置去定义和创建所谓的LUN,它与云计算所要求的完全自动化、API驱动、灵活弹性扩展和资源池化共享是格格不入的,从运维监控的角度,AFA也没有办法完全融入云平台的自动化监控运维体系,扩容升级等运维操作将非常复杂,从资源共享和数据共享的角度,一套一套的AFA本质上就是割裂的数据孤岛,无法满足存储资源池化共享和数据智能流动的需求。
36氪:这涉及到另一个老生常谈的问题,刚才提到企业替代AFA的成本是昂贵的,同时你们主打企业级市场,对于你们的客户来说,它们有动力去完成替换吗?
曹羽中:几个驱动力:
第一,整个业务架构要向云架构转型,这是业务领域很重要的驱动力。AFA跟云化架构,云原生架构的需求无法完全匹配。
第二,从节约成本的角度来说,随着数据量越来越大,客户需要的存储空间与性能也越来越大,在这种情况下,如果完全用AFA硬件架构来搭建,总的成本会是一个天文数字。这是无法支撑的。
第三,是新兴业务形态,以GPU计算、以实时数据分析或AI训练为代表的业务场景,数据量不仅大,同时又要求高性能和高吞吐,这种情况下使用AFA极度不经济,这些新型业务形态天然地需要分布式的SDS架构。
所以这是三个主要的驱动力:即老业务云化的需求、成本驱动和新兴业务场景,这都是SDS2.0比较完美适配需求的地方,所以企业的动力是很充足的。
另外,也不用局限在平行替换现有AFA这个点上,更重要的是面向未来的发展如何新建,企业如何采用新的思维,新的架构去建设其下一代的存储架构,乃至一个统一的存储平面和数据底座,这个是SDS 2.0能够带给企业客户的更大的价值。
36氪:像您刚才提到的,目前这个行业里有很多痛点,它需要新的架构去解决,为什么其他的公司或者说其他的这些技术人没有发现问题,没有想到用这种改变。
曹羽中:这里有几个因素。
一个是本身技术能力没那么强的公司比如创业公司或一些大厂,他们技术发展思路基于某开源组件的修改,然后去优化性能。可1.0的软件架构再怎么修改也不是2.0的,它永远都是一个渐进式的修补。这一类厂家对技术本身缺乏把控能力,他们没有勇气、架构能力和工程能力去抛开原有的开源架构去设计2.0架构,并使它真正地工程落地,这是做不到的。这一类厂家可以归结为"能想得到,但做不到"。马车再怎么样做优化修改,也成为不了汽车。
第二类厂家已经想到,并且也在做。这些厂家以公有云为代表。我们本身是公有云团队,我们有能力做这件事情,是因为我们在过去10多年一直从事云底座的研发,经历了这方面的思考和工程实践。目前在做这件事情的有几个公有云巨头。
公有云需要通过SDS架构去承载越来越多的企业业务,不会借助AFA这种硬件架构来完成这件事。因此,他们有很多业务压力来迫使他去做这件事。目前阿里华为还有其他云巨头,对底层的 SDS架构做了大量研发和升级。但其中的问题是以公有云平台为中心进行设计实现,这意味着它很难线下产品化交付。阿里云没有办法把它以轻量化产品化的方式搬出,卖给某一个企业使用。从架构设计的一开始,他就没有针对这种目标,也由于没有针对这种目标,他们的架构需要对硬件进行依赖。
公有云讲究以最快的速度推出,很多性能不足的地方,需要硬件进行补充,他们天然就会采取这种措施。公有云的存储架构里,底层可能使用类似傲腾这样的硬件做加速。对于客户来说,客户并不想买傲腾。这就是公有云的问题所在,它面向云平台架构,为云服务而设计,规模比较大,有很多依赖。
第三类厂家是传统存储巨头,以EMC为代表。它们有相关的技术能力与资源,没有这方面人才也可以再招。它们没有来做这件事情最重要的因素是定位问题。传统存储端已经做了分布式架构,但不能做成软件定义存储这类分布式的存储,因为它不提供纯软件的交互形态。这是基于商业策略来考虑的,所以不提供软件,而是提供完全一体化的产品,这是第一个缺点;第二个缺点是,传统巨头将其集中式存储架构定位为中高端系列面相核心数据,把分布式存储体系定位为中低端系列面向海量数据。从产品定位就画了一条线,他们就没有动力、投入和决心。他不会用左手去打自己的右手,虽然现在是左右两个手都硬。这也是EMC和华为这些公司的策略,没有变革的巨大推动力。因为两条线都是市场的主要玩家,有着比较高的市场占有率,所以不会产生变革性投入。这跟所有大厂很难做颠覆性创新是一个逻辑。颠覆性的东西不会砸资源把它完成,大概就是这么一个市场格局。
36氪:你刚才提到企业存储架构有更新迭代的必要性,从企业客户的角度考虑,他们会选择什么时候进行更换,你们有考虑过这个问题吗?
曹羽中:这是渐进的,不是一蹴而就的。就像现在使用云化架构去替换企业现有架构,一定是小幅度地试探,一点点推进。而不是一夜之间把原先的AFA全部扔掉,换成SDS2.0这种产品。
36氪:所以你们现在有看到他们一点一点地在试探是吗?
曹羽中:各行业的企业正在把越来越多的业务做云化,做分布式改造,做云原生改造,做基础架构硬件的标准化,这个事情一直在推进。刚开始可能是开发测试业务,外围的业务,然后再做普通业务系统,最后再到准核心,核心业务系统,他会一步一步向前演进,在这个过程中,他会进一步思考他总体系统架构,计算架构,存储架构,数据架构等。
当SDS2.0这样的产品出现之后,由于这是一个面向未来的新一代技术,具备各方面的优势,又可以支撑当前必须要用AFA才能承载的业务,这时企业就有机会有意愿选择SDS2.0而不是传统存储和AFA,并且还可以考虑采用SDS 2.0的技术方案构建企业的统一存储底座,彻底改变过去为不同的业务系统采购和部署不同的存储硬件的坚井式建设模式。这个过程需要有一定的总体规划,但是肯定是需要逐步去落地的,就像我们说的去IOE,这绝对不是一夜之间完成的,需要慢慢往前推进。
36氪:说到国产数据库替代Oracle,可能现在我们很多的国产数据库,包括一些分布式数据库或者开源数据库,放了很多新的技术概念在其中。他可能适合很多新的场景,但其实跟Oracle相比,他们有不够稳定的问题。这可能是很多企业没有办法下定决心从Oracle切换到国产数据库的一个原因。作为一个创业公司研发的创新产品,稳定性不如市场主流成熟产品是完全可以理解的,但从客户的角度来说,他们不会因为是新成立的公司就花钱为产品的不稳定性买单。所以我想了解一下华瑞是如何考虑这个问题的?
曹羽中:这是一个非常关键的问题。从技术方面来说,我们具备领先的优势和面向未来的产品,但阻碍我们的产品真正的走向大规模的生产应用的最核心因素之一就是你所提到的"稳定性"。企业客户对于产品稳定性的担忧,有时候是对技术架构不了解引起的,有时候又仅仅表现在心理作用,对于没有经过长时间的市场验证的产品的一种不安全感。
先从技术的角度来说,SDS软件作为分布式架构,它本身从可靠性与稳定性的设计上与存储阵列,AFA完全是不同的思路。存储阵列,AFA的硬件是专门设计的,更多的依赖硬件的可靠性,硬件的冗余来实现全系统的可靠性,稳定性和可靠性确实是高端存储阵列经过长期市场考验建立起来的口碑。
我们的SDS产品作为分布式架构软件,跑在通用硬件上,其稳定性和可靠性的设计逻辑是首先假定硬件是不可靠的,更多的是从软件层面来整体实现全系统的可靠性和稳定性。分布式系统的系统架构原则是没有单点故障,具备故障容错能力,具备故障自愈能力,能够及时识别有故障的硬件,亚健康状态的硬件,将这些硬件踢出集群,在这个过程中,对上层业务不产生任何影响。在我们的SDS2.0软件架构中,我们在软件层面实现了更多的可靠性和稳定性保障措施,比如极速的分布式复制状态机,能保证数据的强一致性同时又具备10微秒级的数据复制时延,可以提供极速的故障恢复能力,通过副本数据比对,端到端dif, 多级故障域,分布式链路追踪等多重手段来进一步保障数据的可靠性和一致性。
其次呢,通用硬件本身的可靠性其实也一直在提升,比如NVMe SSD介质的可靠性就比机械硬盘高几个数量级,普通x86服务器的可靠性也一直在提升。20多年前,业界曾经普遍认为x86服务器是不够可靠的,企业的核心业务一定是要跑在小型机上才放心,但是在过去的10年来,我们看到几乎所有的企业都在把核心业务从小型机上下移到x86平台上来,小型机逐步在市场上消失了。所以我们坚信,SDS软件+通用硬件,在可靠性和稳定性上面追上乃至赶超高端存储硬件是一定会发生的。
第三点,SDS作为分布式架构软件,是更容易与云化环境融合形成互动的。因为云原生架构的上层业务注重资源的弹性伸缩、快速创建,重启和删除。作为云原生架构的SDS存储能够更天然地与云原生应用产生互动,应用层很容易实现存储资源感知和自动化管理,然后可以采取计算和存储联动的一些可靠性措施,这种更高层面的系统可靠性也就超越了传统高端存储阵列所强调的存储可靠性了。
至于企业客户选择新产品的心理担忧的问题,是需要一定的时间来解决的。实际上企业客户乃至具体的信息化技术负责人有很多种类型,有的保守派,有的是追随者,有的是激进派。现在有很多企业客户有切实的痛点,如果再加上在选择产品方面并不保守,在新技术上面愿意大胆尝试,这些就是我们理想的早期客户,我们需要这样的客户帮助我们破冰,去培养市场的声誉和口碑。当然,我们本身从产品和技术层面是要做好充分的可靠性保障的,包括建设完备的运维能力和售后维保体系。在业务有痛点需要解决,新产品本身可以带来显著的价值的基本前提下,我们相信品牌和信任是可以逐步建立起来的,企业客户的认知和产品选择习惯是可以逐步改变的。当然,这个一定需要一个比较长的周期,这也是为什么我们认为在企业级市场要发生一次真正的技术变革需要一个10年的长周期。
36氪:关于你们跟一些硬件厂家的合作,具体是如何做的?比如你们的产品的极速性能是需要在某些固定的硬件上才能发挥作用吗,还是在通用硬件上都可以,合作的形式是怎么样的?
曹羽中:首先作为一款基础软件,我们最重要的架构设计逻辑是不依赖任何特定硬件。这是我们和很多存储产品最重要的区别之一。有些存储产品宣传的性能也很强,其实它是有前提条件的,比如使用了傲腾持久化内存来存储元数据,如果缺少这一类特定的硬件,他的性能就会大打折扣,甚至是运行不了。
我们把类似傲腾这种硬件归为非标品,因为他目前还是比较特殊、价格昂贵、未得到广泛采用的新硬件。在我们的SDS软件体系里,没有对非标品硬件的特定依赖,对于已经在市场上得到大量应用的通用硬件又提供了广泛的兼容性支持,客户可以选择不同类型的CPU架构,包括Intel,海光,鲲鹏,飞腾等,可以选择不同品牌,不同类型的硬盘介质,包括机械硬盘,SATA SSD, NVMe SSD,SCM SSD等,实现了从低端硬件到最高端的硬件的全覆盖支持。
同时我们架构设计的另外一个原则是要压榨出硬件物理性能的极限,硬件能跑多快,我们的SDS软件就能跑多快,对外提供相对应的存储IO读写性能和带宽,并且保证稳定的低时延。在我们跟英特尔做一次联合测试中,特地选择了基于PCIe 4.0接口的英特尔傲腾P5800X,这是市场上性能最高的商用SSD之一,单盘就能跑出150万IOPS。测试结果表明,我们的SDS2.0软件WDS, 使用单个进程就可以将一整块英特尔傲腾P5800X的峰值能力发挥出来,也就是达到近150万 IOPS。整套分布式存储系统对外能提供的峰值集群性能与系统中的硬盘介质的物理极限性能的总和基本相当,证明软件侧没有瓶颈,能驱动最高端硬件的极限性能,转化为客户业务能够使用的IO读写能力。
还有一类硬件叫DPU,对此我们的架构设计原则是不依赖于任何特定DPU,但是又预留开放架构与DPU硬件做协同,让DPU起到锦上添花,提供更多附加价值的作用。
还有一类硬件叫是计算型存储,就是SSD介质内部拥有一定的计算处理能力,能够在SSD介质内部提供压缩,解压缩能力。我们也是在SDS软件里面预留开放架构与这一类计算型存储介质做协同,这样可以在某些业务场景,给企业客户提供更有价值的方案。
36氪:徐总,假设现在有两家公司,他们能做出同样的事情,但一家性能更出色,另一家稳定性更出色,稳定性更好的公司性能可以达到60分,另一家公司在某些点上的性能能做到90分,你们会选择投哪家公司呢?
明势资本徐之浩:我认为对于存储产品来说,稳定性和可靠性都非常重要。往往对于一些新兴的增量的场景,首先性能要满足业务要求,如果性能满足不了要求,再稳定也无法使用。
我其实有这个答案,之前遇到过类似的情况,客户是愿意为了满足业务场景的性能需求、在中短期忍受稳定性的欠缺。在性能能够满足业务要求的前提下,稳定性和可靠性就会成为关键考虑因素了。我们会参考客户访谈,团队是否有做过同类商用产品的经验,团队的软件工程能力和可靠性工程能力等来评估一家公司是否有能力研发出能够稳定上生产,并且可以大规模复制销售的存储产品。
36氪:行业里其实也有一些所谓在做软件定义存储或SDS这样的公司,比你会觉得他们和华瑞之间现在聊的华瑞有什么区别?从投资的角度来说,你认为什么样的公司未来的商业价值更高?
明势资本徐之浩:团队在愿景上,在技术能力上,在选择的技术路线上,有没有成为行业的变革者和颠覆者的可能性,是我最看重的。可以比较明确地看到一个点是,大家可以去判断一家存储创业公司的产品是不是基于海外一些开源的存储系统软件在做,如果是的话,大概率做的就是SDS 1.0时代的产品。我对比较流行的开源的存储系统也都有所了解,这类开源存储系统的技术架构都比较过时了,发展潜力也有限,是不具备挑战市场上的成熟集中式存储产品,变革数据存储行业的潜力的。我在华瑞指数云看到了我看重的东西,我觉得这是比较核心的区别。
另外一个核心的区别是,虽然目前我们看技术看软件,但商业化能力是非常重要的。我们确实能看到一些具备很强技术创新能力,或者技术方向在未来会有较大市场空间的一些创业公司大部分都走不到后面。这往往是因为早期,纯技术创始人在商业路径上的思考很容易弯路。现在的资本市场不是特别好,即使是在资本市场很好的时候,给创业公司的容错空间也不见得有那么大。像华瑞公司的话,两位创始人中,羽中负责技术多一点,另一位创始人亮总,在做业务方面有很丰富的经验,不仅在国内有经验,在海外也有常驻的经历,负责一个区域的业务。我觉得这个点对我们来说是很重要的。
综合这么考虑,一方面我们还是希望在产品上做到创新的。现在大家都喜欢讲国产替代,稍微有追求一点,我们更希望我们做的是国产升级。很多时候纯粹的国产替代会面临很多问题,大家的产品会同质化,只能切入相对低端且低毛利的场景中。所以在产品技术上,我们希望有国产升级的可能性。另外团队上带来的差异也比较大,无论是技术、产品还是商业,这都是很强的一支团队,我觉得这一点也是挺关键的。
我再补充一个小点,是我们当初在接触时让我感触很深的一点。我们一直在投各类软件项目,可以看到很多软件的创业公司早期并没有在测试稳定性和质量保证上投入特别多精力,他们想先把东西做出来,然后再慢慢考虑后面的事。但华瑞这个团队,我们在早期的时候就发现,他们很早就投入了很多钱去建设自动化测试环境,进行各种故障注入和长期稳定性测试。华瑞有一个完全自用的机房,现在差不多有160台服务器组成各类测试平台。这个投入是非常夸张的。说实话我觉得中大型互联网公司里能把测试环境维持到100多台的都非常少。他们本身就是华为出来的团队,非常了解稳定性和可靠性对企业软件的重要性,在特别早期的时候,就投入了很多的资源和精力去构建环境和自己的测试体系,这给我的印象非常深。我们也投了很多数据库类的基础软件,稳定性确实是早期基础软件需要迈过的一道坎,华瑞在这方面的意识和实际的投入是非常足的。
关键词:
上一篇:中交地产(000736)6月2日13点16分触及涨停板
下一篇:最后一页
-
中交地产(000736)6月2日13点16分触及涨停板2023-06-02
-
小朋友们迎接大运会的方式:7大童声合唱团在成都欢度六一_世界播报2023-06-02
-
新能源智能装备企业思客琦IPO过会 客户圈涵盖宁德时代/中创新航等2023-06-02