安全数据存储对于推动 AI 人工智能的关键性
by Canonical on 18 June 2024
立即报名 八月十四日下午2:00 网路研讨会直播 -使用 Ceph 的 AI 存储
没有数据就没有 AI
人工智能是近年来最激动人心的一场科技革命。Nvidia、Intel、AMD 和其他公司继续生产速度越来越快的 GPU,进而支持更大的模型和决策过程中更高的吞吐量。
除了当下对人工智能的大量宣传之外,还有一点仍被人们所忽略:AI 需要数据。
首先,存储系统需要对不断增长的数据集的高性能进行访问,但更重要的是,它们需要确保这些数据得到安全存储,以供当下以及未来之用。在典型的 AI 系统中,用到了多种不同类型的数据:
- 原始和预处理数据
- 训练数据
- 模型
- 结果
所有这些数据的收集、处理和输出都要耗费时间和计算能力,因此需要对数据进行保护。在某些情况下,诸如自动驾驶汽车的遥测数据之类的数据可能永远无法复制。即使在训练数据被用于创建模型之后,其价值也不会削减;模型如要实现改进,就需要使用一致的训练数据集,如有任何调整,都会认真衡量。
原始、预处理、训练和结果数据集可能包含个人身份信息,因此需要采取措施确保以安全的方式存储此等信息。除了安全存储数据的道德责任之外,发生数据泄漏还可能受到重罚。
安全存储 AI 数据的挑战
安全存储数据有诸多风险,这些风险也存在于 AI 环境中。毕竟,机器学习是另一个消耗存储资源的应用领域,只不过有时规模要大得多。
AI 用例相对较新,但大多数现代存储系统,包括 Ceph 等开源解决方案,都具备成熟的功能,可以用来降低这些风险。
通过静态数据加密阻止实体盗窃
理论上,存储系统中使用的任何磁盘都有可能因为盗窃或在发生故障事件后返厂保修更换而丢失。使用静态加密的情况下,如果没有解密数据所需的加密密钥,存储在磁盘、旋转介质或闪存上的每个字节的数据都是无用的。因此可以保护敏感数据或者经过数小时甚至数天处理后创建的专有模型。
严格访问控制,防止不速之客进入
任何系统设计都有一个核心原则,即确保用户(真人或无头账户)只能访问他们需要的资源,并且任何时候都可以轻松删除该访问记录。诸如 Ceph 这样的存储系统既使用自身的访问控制机制,也与 LDAP 等集中认证系统集成,以实现简单轻松的访问控制。
通过传输加密防止窃听
最糟糕的情况莫过于对话遭到窃听。计算机网络中亦是如此。通过对客户端到存储器的所有网络流以及内部存储系统网络进行加密,可以防止数据泄漏给在网络上窃听的第三方。
通过快照和版本控制告别勒索软件攻击
似乎每周都会有不同的大型企业披露勒索软件事件,他们的系统遭到未经授权的第三方控制且数据遭到加密。这不仅会导致停工,企业还有可能被迫支付赎金以获得解密密钥,以重获其系统控制权并访问数据。AI 项目通常需要投入大量的时间和资源,因此主动权如若遭到勒索软件攻击,可能会造成极大的损害。
使用时间点快照或对象的版本控制,企业组织可以恢复到先前的非加密状态,并有可能更快地恢复操作。
了解更多
Ceph 是一种可用于存储各种 AI 数据集的存储解决方案,不仅可以扩展以满足性能和容量需求,并且具有许多功能确保数据得到安全存储。
了解有关 Ceph 如何解决 AI 存储挑战的更多信息:
立即报名 八月十四日下午2:00 网路研讨会直播 -使用 Ceph 的 AI 存储
更多资源
订阅博客文章
查看更多内容
如何为企业选择最合适的企业数据存储解决方案?
围绕 IT 基础架构所做的选择对业务成本和性能都有很大的影响,其中涉及到运营、财务、数据分析和市场营销等多个领域。鉴于数据在所有这些领域中的重要性,甚至是在整个企业中的重要性,在选择新的存储系统时做出正确的决定至关重要。本篇文章将介绍选择时的一些考虑因素,以确保您在成本效益和性能之间取得平衡。 一、性能 存储性能涉及多个维度,首先来考虑最简单的度量指标: IOPs(Input/Output operations per Second)– 每秒输入/输出操作数,即一秒钟内可处理的操作次数。 响应时间(Response time)– IO 操作处理后安全存储到存储系统中并向请求应用程序发送确认信息所耗用的时间。 带宽(Bandwidth)– 一秒钟内可以传输的数据量的度量方 […]
从 CentOS 迁移到 Ubuntu:系统管理员和开发运营指南
Photo by Sonja Langford, Unsplash CentOS 7 于 2024 年 6 月 30 日迎来生命周期结束(EoL)。在此日期之后,CentOS Project 将停止提供更新或支持,包括重要的安全补丁。放弃基于 RHEL 的生态系统可能令人望而生畏,但是如果您正在考虑 Ubuntu,那么这种转换既轻松简单又经济可行。 自动化安全验证领域的领跑者 Pentera,提供了一个极具说服力的案例研究来简化这种转换。他们详细介绍了如何在作出最小调整但需采取增强的安全性措施情况下,将其基于容器的系统迁移到 Ubuntu。这一举动也得到了其客户的积极回应,他们赞赏 Ubuntu在过去二十年以每两年一次的频率持续发布长期支持版本的可靠历史,并提供广泛的社区 […]
Canonical 将出席 2024 KubeCon China 主题会议
2024 年 8 月 21 日,我们的 AI 产品经理 Andreea Munteanu 和托管服务产品经理 Adrian Matei 将代表 Canonical 出席在嘉里酒店举办的 Kubecon China 会议。Canonical 多年来一直是 KubeCon 盛会的常客,我们非常高兴参加本次 KubeCon China 首秀。 本会议将以“应对人工智能/机器学习项目中的运营时间市场减速因素”为主题(Tackling Operational Time-to-Market Decelerators in AI/ML Projects),深入探讨实现 AI 企业卓越运营方面的要求和因素,涵盖基础架构配置到监控以及应急恢复等。 在竞争激烈的人工智能市场中,上市时间对于成 […]