谢谢您的订阅!
当新的内容发布后您将开始接收邮件。您也可以点击邮件内的链接随时取消订阅。关闭Close

如何为企业选择最合适的企业数据存储解决方案?

by Canonical on 23 October 2024

围绕 IT 基础架构所做的选择对业务成本和性能都有很大的影响,其中涉及到运营、财务、数据分析和市场营销等多个领域。鉴于数据在所有这些领域中的重要性,甚至是在整个企业中的重要性,在选择新的存储系统时做出正确的决定至关重要。本篇文章将介绍选择时的一些考虑因素,以确保您在成本效益和性能之间取得平衡。

一、性能

存储性能涉及多个维度,首先来考虑最简单的度量指标:

IOPs(Input/Output operations per Second)– 每秒输入/输出操作数,即一秒钟内可处理的操作次数。

响应时间(Response time)– IO 操作处理后安全存储到存储系统中并向请求应用程序发送确认信息所耗用的时间。 

带宽(Bandwidth)– 一秒钟内可以传输的数据量的度量方式。

如果考虑每次 IO 操作的大小,情况会变得更加复杂。每次 IO 操作的大小对所用总带宽会有影响。传输 4KB 的数据比传输 1MB 数据所需的时间更少,因此会影响 IO 请求的响应时间。

我们来看两个例子:

1. 数据库

数据库通常使用较小的 IO 大小,每次操作通常只更新一个数据库表,因此所用的总带宽将会很低。但是,响应时间对于该用例而言至关重要,因为数据库接收到数据已安全写入的确认信息越快,处理下一个事务的速度就越迅速。  

2. 流媒体

编辑多个 4k 视频流时,视频编辑应用程序需要访问所有这些数据,因此相较于每次 IO 操作请求的响应时间,更加重要的是利用存储系统的所有可用带宽,尽可能快地传输整个视频文件。

二、可扩展性

所有企业组织在其存续期间的某个时刻都会面临数据增长的情况。全球每天产生数 EB 的新数据,虽然很少有企业组织必须要处理如此规模的数据,但他们的存储系统也应该是可扩展的,避免现有的工作负载出现中断。

在某些系统中,通过不断地添加磁盘机架(纵向扩展)可以实现,这样虽然可以扩增容量,但并不会提升系统控制器的性能。在更加新式的横向扩展存储系统中,扩增容量的同时也能提升计算能力,因此同时实现更大容量与更好性能。

三、可靠性

存储系统的主要目的是安全存储数据。如果应用程序不能一致地检索数据,存储系统则几乎无用。为了保护数据,新式存储系统采用镜像、奇偶校验或纠删码等技术来确保磁盘或 SSD 的丢失不会导致数据丢失。存储系统还具有多个控制器和多个客户端连接,以此确保在任何这些组件出现故障时都具有高可用性。横向扩展存储系统具有更高的可靠性,因为组成集群的软件组件分布于多个节点,这使得集群能够经受多次硬件故障。

四、灵活性

存储系统必须能够容纳许多不同的工作负载,且每个工作负载都有各自的要求。有些可能要求高性能,有些可能要求存档,但无论什么要求,在这些不同类别的存储池之间进行迁移数据的功能都很重要,因为这样可以为其他应用程序释放宝贵的快速存储空间。 

容量扩增和消耗方面,能够以牺牲一定性能的方式从小型存储系统扩展到大型存储系统非常重要。迁移数据一直都充满挑战,并且可能导致应用程序运行中断,只是迁移到更大容量的存储系统应该成为“过去式”!

当企业组织不再需要用到存储系统的全部可用容量时,能够缩小集群规模也很重要。这就是横向扩展系统比专有纵向扩展系统更具优势的地方,因为它们是基于通用硬件构建而成,这些硬件可以根据需要重复用于其他应用程序。

五、功能集

在比较多个解决方案时,聚焦于对来说重要的功能是很重要的。您需要使用哪些协议(块、文件或对象),系统是否支持所有这些协议?您是否需要快照、克隆等本地复制功能?如果需要,系统可以创建和管理多少此类复制数据?您是否会需要远程复制,或者静态数据加密或对象版本控制等合规性功能?

与企业组织中的应用程序所有者进行合作,有助于明确真正重要的功能,而不是根据供应商有时共享的“英雄存储数字”或极限值来选择解决方案。

优化云存储的成本

灵活应用Ceph

六、成本效益

在以上各个领域中,做出的决策有可能导致存储系统成本增加,因此用例的需求与系统的功能相匹配显得至关重要。例如,我们可以构建一个全部采用闪存盘的存储系统,但是对于不经常访问的存档类存储来说,有必要这样做吗?同样地,在考虑可用功能时,您是否需要远程复制,该功能是否需要额外的许可费用?

实事求是地说,了解您不需要的东西和了解您确实需要的东西一样重要!

七、企业存储的开源选择

要想在性能、可扩展性、灵活性和成本等所有需求方面取得平衡,可能需要做出妥协,并深入了解自己想要在这些方面取得的效果。

专有存储阵列通常需要为支持服务和未来升级预先支付大量费用,并且在某些情况下,升级困难且耗时,特别是必须从较小系统迁出以便进一步扩展的情况下。  公共云解决方案初期既便宜又灵活,但在您存储了大量数据之后,它就不再是最经济有效的方法了(如果您有兴趣了解更多详情,请点击此处阅读我们该主题的相关白皮书!)。 

Ceph 等开源存储系统已可用于企业部署,并且可以为本文中描述的所有需求提供具有经济效益的解决方案。Canonical Ceph 是一个适用于所有规模和所有工作负载的存储解决方案,从边缘到大规模企业级部署,以及所有协议(块、文件和对象)均可适用。 

具有不同性能、容量和协议需求的各种用例都可以通过单个横向扩展集群进行管理。Ceph 能够利用商用硬件横向扩展,这意味着扩展为增量模式,并且可以根据性能或容量需求进行调整。

Ceph 集群架构概述

了解更多

下载我们的白皮书 – 面向企业的软件定义存储,了解以下信息:

  • 企业在扩展存储系统时面临的预算挑战
  • 开源式软件定义存储如何为基于遗留设备的存储系统提供可行的替代方案
  • 如何使用 Ceph 来确保:
    • 可靠性
    • 可扩展性
    • 灵活性
  • 如何在扩展规模的同时保持成本效益
  • 如何通过整合到单个多协议存储集群中的方式来减少数据孤岛
  • 如何通过本地和远程数据复制为灾难情况做准备
  • 托管服务如何在降低成本的同时提供“体验即服务”

更多资源

订阅博客文章

订阅您感兴趣的主题

在提交此表格的同时,我确认已阅读和同意的隐私声明隐私政策。

查看更多内容

Canonical 推出首个 MicroCloud LTS 版本

扩大 Canonical 基础架构解决方案 - MicroCloud 2.1.0 LTS 长期支持承诺  Canonical 推出 MicroCloud 的首个长期支持(LTS,Long Term Support)版本。MicroCloud 是 Canonical 的云基础架构产品组合的一员。作为 Ubuntu 的发行商,Canonical 以每两年在4月份提供 Ubuntu LTS 版本著名。随着 MicroCloud LTS 的加入,Canonical 扩大了对寻求面向边缘和低接触云的可扩展虚拟化解决方案的组织提供长期支持的承诺。  MicroCloud 2.1.0 LTS 支持单节点部署,改进了安全状况,并在初始化过程中具有更大的灵活性。它将 LXD 作为其虚拟化平 […]

什么是 IoT 设备管理?

IoT 设备管理是指用于部署、监控和维护 IoT 设备的流程或实践。随着组织扩大其 IoT 工作,可靠的设备管理方法对于运行安全、简化的设备群至关重要。  全球联网设备的激增(预计 2024 年达到 188 亿台)意味着 IoT 设备管理变得越来越复杂,这一现实并没有被恶意行为者忽视。事实上, 2023 年平均每个组织每周遭受 60 次 IoT 攻击。这是因为设备以及它们之间的连接和您的管理系统构成了一个相当大的攻击面。 在这篇博客中,我们将通过关注您需要实现的 3 个目标来讲解 IoT 设备管理的基础:可见性、互操作性和安全性。我们将介绍开放式设备管理方法如何确保您在任何行业、任何规模的任何设备中实现这三个目标。 可统合并保护您设备的一把伞 您可以将自己的 IoT 管理 […]

分步指南:在 Ubuntu 上使用 Azure IoT Operations

简介 随着最近 Azure IoT Operations 的发布,Microsoft 为其客户提供了一个统一的数据平面,在节点数据捕获、基于边缘的遥测处理和云入口方面做出重大改进。  Azure IoT Operations 与 Ubuntu 的结合可谓是相得益彰,可以构建开箱即用的安全可靠的解决方案。  这篇博客是 Microsoft 的 Azure IoT Operations 入门的分步指南。最后,您会将 Azure IoT Operations 服务部署到本地支持 Azure Arc 的 microk8s Kubernetes 集群,并使用 X509 证书身份验证配置了与集群的 MQTT 代理的安全通信。为了实现这一点,您将执行命令、创建和编辑文件并发布自签名证书 […]