如何为企业选择最合适的企业数据存储解决方案?
by Canonical on 23 October 2024
围绕 IT 基础架构所做的选择对业务成本和性能都有很大的影响,其中涉及到运营、财务、数据分析和市场营销等多个领域。鉴于数据在所有这些领域中的重要性,甚至是在整个企业中的重要性,在选择新的存储系统时做出正确的决定至关重要。本篇文章将介绍选择时的一些考虑因素,以确保您在成本效益和性能之间取得平衡。
一、性能
存储性能涉及多个维度,首先来考虑最简单的度量指标:
IOPs(Input/Output operations per Second)– 每秒输入/输出操作数,即一秒钟内可处理的操作次数。
响应时间(Response time)– IO 操作处理后安全存储到存储系统中并向请求应用程序发送确认信息所耗用的时间。
带宽(Bandwidth)– 一秒钟内可以传输的数据量的度量方式。
如果考虑每次 IO 操作的大小,情况会变得更加复杂。每次 IO 操作的大小对所用总带宽会有影响。传输 4KB 的数据比传输 1MB 数据所需的时间更少,因此会影响 IO 请求的响应时间。
我们来看两个例子:
1. 数据库
数据库通常使用较小的 IO 大小,每次操作通常只更新一个数据库表,因此所用的总带宽将会很低。但是,响应时间对于该用例而言至关重要,因为数据库接收到数据已安全写入的确认信息越快,处理下一个事务的速度就越迅速。
2. 流媒体
编辑多个 4k 视频流时,视频编辑应用程序需要访问所有这些数据,因此相较于每次 IO 操作请求的响应时间,更加重要的是利用存储系统的所有可用带宽,尽可能快地传输整个视频文件。
二、可扩展性
所有企业组织在其存续期间的某个时刻都会面临数据增长的情况。全球每天产生数 EB 的新数据,虽然很少有企业组织必须要处理如此规模的数据,但他们的存储系统也应该是可扩展的,避免现有的工作负载出现中断。
在某些系统中,通过不断地添加磁盘机架(纵向扩展)可以实现,这样虽然可以扩增容量,但并不会提升系统控制器的性能。在更加新式的横向扩展存储系统中,扩增容量的同时也能提升计算能力,因此同时实现更大容量与更好性能。
三、可靠性
存储系统的主要目的是安全存储数据。如果应用程序不能一致地检索数据,存储系统则几乎无用。为了保护数据,新式存储系统采用镜像、奇偶校验或纠删码等技术来确保磁盘或 SSD 的丢失不会导致数据丢失。存储系统还具有多个控制器和多个客户端连接,以此确保在任何这些组件出现故障时都具有高可用性。横向扩展存储系统具有更高的可靠性,因为组成集群的软件组件分布于多个节点,这使得集群能够经受多次硬件故障。
四、灵活性
存储系统必须能够容纳许多不同的工作负载,且每个工作负载都有各自的要求。有些可能要求高性能,有些可能要求存档,但无论什么要求,在这些不同类别的存储池之间进行迁移数据的功能都很重要,因为这样可以为其他应用程序释放宝贵的快速存储空间。
容量扩增和消耗方面,能够以牺牲一定性能的方式从小型存储系统扩展到大型存储系统非常重要。迁移数据一直都充满挑战,并且可能导致应用程序运行中断,只是迁移到更大容量的存储系统应该成为“过去式”!
当企业组织不再需要用到存储系统的全部可用容量时,能够缩小集群规模也很重要。这就是横向扩展系统比专有纵向扩展系统更具优势的地方,因为它们是基于通用硬件构建而成,这些硬件可以根据需要重复用于其他应用程序。
五、功能集
在比较多个解决方案时,聚焦于对您来说重要的功能是很重要的。您需要使用哪些协议(块、文件或对象),系统是否支持所有这些协议?您是否需要快照、克隆等本地复制功能?如果需要,系统可以创建和管理多少此类复制数据?您是否会需要远程复制,或者静态数据加密或对象版本控制等合规性功能?
与企业组织中的应用程序所有者进行合作,有助于明确真正重要的功能,而不是根据供应商有时共享的“英雄存储数字”或极限值来选择解决方案。
六、成本效益
在以上各个领域中,做出的决策有可能导致存储系统成本增加,因此用例的需求与系统的功能相匹配显得至关重要。例如,我们可以构建一个全部采用闪存盘的存储系统,但是对于不经常访问的存档类存储来说,有必要这样做吗?同样地,在考虑可用功能时,您是否需要远程复制,该功能是否需要额外的许可费用?
实事求是地说,了解您不需要的东西和了解您确实需要的东西一样重要!
七、企业存储的开源选择
要想在性能、可扩展性、灵活性和成本等所有需求方面取得平衡,可能需要做出妥协,并深入了解自己想要在这些方面取得的效果。
专有存储阵列通常需要为支持服务和未来升级预先支付大量费用,并且在某些情况下,升级困难且耗时,特别是必须从较小系统迁出以便进一步扩展的情况下。 公共云解决方案初期既便宜又灵活,但在您存储了大量数据之后,它就不再是最经济有效的方法了(如果您有兴趣了解更多详情,请点击此处阅读我们该主题的相关白皮书!)。
Ceph 等开源存储系统已可用于企业部署,并且可以为本文中描述的所有需求提供具有经济效益的解决方案。Canonical Ceph 是一个适用于所有规模和所有工作负载的存储解决方案,从边缘到大规模企业级部署,以及所有协议(块、文件和对象)均可适用。
具有不同性能、容量和协议需求的各种用例都可以通过单个横向扩展集群进行管理。Ceph 能够利用商用硬件横向扩展,这意味着扩展为增量模式,并且可以根据性能或容量需求进行调整。
了解更多
下载我们的白皮书 – 面向企业的软件定义存储,了解以下信息:
- 企业在扩展存储系统时面临的预算挑战
- 开源式软件定义存储如何为基于遗留设备的存储系统提供可行的替代方案
- 如何使用 Ceph 来确保:
- 可靠性
- 可扩展性
- 灵活性
- 如何在扩展规模的同时保持成本效益
- 如何通过整合到单个多协议存储集群中的方式来减少数据孤岛
- 如何通过本地和远程数据复制为灾难情况做准备
- 托管服务如何在降低成本的同时提供“体验即服务”
更多资源
订阅博客文章
查看更多内容
Canonical 推出首个 MicroCloud LTS 版本
扩大 Canonical 基础架构解决方案 - MicroCloud 2.1.0 LTS 长期支持承诺 Canonical 推出 MicroCloud 的首个长期支持(LTS,Long Term Support)版本。MicroCloud 是 Canonical 的云基础架构产品组合的一员。作为 Ubuntu 的发行商,Canonical 以每两年在4月份提供 Ubuntu LTS 版本著名。随着 MicroCloud LTS 的加入,Canonical 扩大了对寻求面向边缘和低接触云的可扩展虚拟化解决方案的组织提供长期支持的承诺。 MicroCloud 2.1.0 LTS 支持单节点部署,改进了安全状况,并在初始化过程中具有更大的灵活性。它将 LXD 作为其虚拟化平 […]
Canonical 宣布推出 12 年 Kubernetes LTS
Canonical 的 Kubernetes LTS(长期支持)将支持 FedRAMP 合规性,并在裸机、公共云、OpenStack、Canonical MicroCloud 和 VMware 上获得至少 12 年的承诺安全维护和企业支持。 Canonical 宣布,从 Kubernetes 1.32 开始,将提供 12 年的安全维护和支持。新版本易于安装、操作和升级,具有一流的开源网络、DNS、网关、度量服务器、本地存储、负载平衡器和入口服务。Canonical Kubernetes 使客户能够按照自己的节奏进行升级,对于喜欢快速行动的组织,将每四个月发布一次新的上游版本,对于需要长期支持环境的组织,则提供 12 年的承诺。 “Kubernetes 的不断升级是企业团队 […]
如何使用 DSS 构建您的首个模型
GenAI 无处不在,它正在改变我们对待技术的方式。如果您曾想要深入大型语言模型(LLM)的世界,但是感到无从下手,那么有一个好消息!Hugging Face 最近推出了一个自定进度的课程,非常适合初学者和更有经验的爱好者。由于模型占用面积小,它可以实际操作,易于使用,并且设计为在标准硬件上工作。 当我听到这个消息时,我决定使用 Canonical 的数据科学堆栈(DSS)来尝试一下。 在这篇博客中,我将指导您设置 DSS 并运行 Hugging Face 课程的第一个笔记本。该笔记本侧重于受监督的微调,这是一种使预先训练的语言模型适应特定任务或领域的方法。在这篇帖子的结尾,您将会看到 GenAI 是多么的简单和容易理解——这将是一项用于开启新年篇章的完美新技能。 设置您 […]