什么是对象存储?

对象存储是一种以非结构化格式(称为对象)存储和管理数据的技术。现代组织需要创建和分析大量非结构化数据,例如照片、视频、电子邮件、网页、传感器数据和音频文件。云对象存储系统将这些数据分布在多个物理设备上,但允许用户从单个虚拟存储库有效地访问内容。对象存储解决方案非常适合用于构建需要扩展和灵活性的云原生应用程序;您还可以使用这些解决方案导入现有数据存储以进行分析、备份或存档。

元数据对于对象存储技术至关重要。使用对象存储,对象保存在单个存储桶中,而不是作为文件夹内的文件保存。相反,对象存储整合了构成文件的数据片段,将所有用户创建的元数据添加到该文件,并附加自定义标识符。这将创建一个称为存储桶的平面结构,而不是分层或分级存储。这使您可以根据存储桶的功能和特征来检索和分析其中的任何对象,而无论文件类型如何。

对象存储是数据湖的理想存储,因为它为大量数据提供了一种架构,每条数据都存储为一个对象,并且对象元数据提供了一个唯一标识符以便于访问。这种架构消除了传统存储的扩展限制,这也是为什么对象存储是云存储的原因。

对象存储的主要优势是近乎无限的可扩展性以及为数据湖、云原生应用程序、分析、日志文件和机器学习(ML)等使用场景存储大量数据的成本较低。对象存储还提供更高的数据持久性和弹性,因为它可以在多台设备上、跨多个系统,甚至跨多个数据中心和区域存储对象。这可以实现近乎无限的规模,同时提高数据的弹性和可用性。

为什么对象存储很重要?

随着业务的发展,它们需要管理急剧增加并且孤立的大量数据,这些数据来自很多被任意数量的应用程序、业务流程和最终用户使用的来源。今天,这些数据中的大部分都是非结构化的,最终采用多种不同的格式和存储介质,并且不容易融入中央存储库。这增加了复杂性,并减慢了创新速度,因为无法访问数据以用于分析、机器学习(ML)或新的云原生应用程序。对象存储能够提供可以大规模扩展并且经济高效的存储来以原生格式存储任何类型的数据,从而帮助您打破这些限制。对象存储消除了困扰传统存储系统的复杂性、容量限制和成本障碍,因为对象存储以较低的每 GB 价格提供了无限的可扩展性。

您可以通过用户友好的应用程序界面集中管理非结构化数据。您可以使用策略来优化数据存储成本,并在必要时自动切换存储层。云对象存储可以更轻松地执行分析和获得见解,从而加快决策速度。

虽然对象可以存储在本地,但对象存储是为云构建的,可提供几乎无限的可扩展性、高持久性和成本效益。借助云对象存储,可以从任何位置轻松访问数据。

对象存储有哪些使用场景?

客户将对象存储用于各种解决方案。以下是一些常见的使用场景。

分析

您可以在云对象存储中收集和存储几乎无限的、任何类型的数据,并执行大数据分析以获得有关您的运营、客户和您所服务的市场的宝贵见解。

数据湖

数据湖使用云对象存储作为其基础,因为它具有几乎无限的可扩展性和高持久性。您可以无缝、无中断地将存储从 GB 增加到 PB 的内容,只需为您使用的内容付费。它具有可扩展的性能、易于使用的功能、原生加密和访问控制功能。

云原生应用程序数据

云原生应用程序使用容器化和无服务器等技术,以快节奏和灵活的方式来满足客户的期望。这些应用程序通常由称为微服务的小型、松散耦合的独立组件组成,这些组件通过共享数据或状态进行内部通信。云存储服务为此类应用程序提供数据管理,并为云环境中持续存在的数据存储挑战提供解决方案。利用对象存储,您可以添加任意数量的内容,而且能在任何位置访问内容,因此,您可以更快地部署应用程序并接触更多的客户。

数据存档

云对象存储非常适合长期数据留存。您可以使用能够优化数据持久性、加快检索速度、加强安全性与合规性并且提升数据可访问性的解决方案来取代本地的磁带和磁盘存档基础设施,从而获得高级分析及业务情报能力。您还可以以经济高效的方式归档大量富媒体内容,并长时间保留强制性监管数据。

富媒体

加速应用程序并降低存储视频、数字图像和音乐等富媒体文件的成本。借助对象存储,您可以创建经济高效的全局复制架构,通过使用存储类和复制功能将媒体交付给分布式用户。

备份和恢复

您可以将对象存储系统配置为复制内容,这样就可以在物理设备发生故障时使用复制的对象存储设备。这可确保您的系统和应用程序继续运行而不会中断。您还可以跨多个数据中心和地理区域复制数据。

ML

机器学习(ML)中,您“教”计算机进行预测或推理。您使用算法来训练模型,然后将模型集成到您的应用程序中,以实时和大规模地生成推理。由于规模和成本效率的原因,机器学习需要对象存储,因为生产模型通常从数百万到数十亿个示例数据项中学习,并在短短 20 毫秒内生成推理结果。

云对象存储与其他类型的存储相比如何?

云存储有三种类型:对象存储、文件存储和数据块存储。每种类型都是特定使用场景和存储要求的理想之选。

文件存储

许多应用程序需要共享文件访问。传统上,这是由网络附属存储(NAS)服务提供的。常见的文件级协议包括用于 Windows 服务器的服务器消息块(SMB)和 Linux 实例中的网络文件系统(NFS)。文件存储适用于非结构化数据、大型内容存储库、媒体存储、主目录和其他基于文件的数据。

比较对象存储和文件存储

对象存储和文件存储之间的主要区别在于数据结构和可扩展性。文件存储被组织成具有目录和文件夹的层次结构。文件存储还遵循严格的文件协议,例如 SMB、NFS 或 Lustre。对象存储使用带有元数据的平面结构和每个对象的唯一标识符,使用标识符可以更轻松地在潜在的数十亿个对象中找到特定对象。

由于这些结构上的差异,文件存储和对象存储具有不同的扩展能力。对象存储可提供近乎无限的扩展性,可扩展到 PB 级和数十亿个对象。由于固有的层次结构和路径,文件存储会遇到扩展限制。

数据块存储

数据库或 ERP 系统等其他企业应用程序通常需要针对每个主机的专用低延迟存储。这种存储与直接连接存储(DAS)或存储区域网络(SAN)类似。基于数据块的云存储解决方案使用各个虚拟服务器进行预置,可提供高性能工作负载所需的超低延迟。

比较对象存储和数据块存储

对象存储最适合用于大量非结构化数据,尤其是当持久性、无限存储、可扩展性和复杂的元数据管理是影响整体性能的相关因素时。

数据块存储可在各种使用案例中提供低延迟和高性能值。其功能主要用于结构化数据库存储、VM 文件系统卷,以及大量读取和写入负载。

AWS 如何帮助您满足云对象存储需求?

Amazon Simple Storage Service (Amazon S3) 是一种对象存储服务,提供行业领先的可扩展性、数据可用性、安全性和性能。各种规模和行业的客户都可以使用 S3,来存储并保护各种使用场景(如数据湖、网站、移动应用程序、备份和还原、存档、企业应用程序、IoT 设备和大数据分析)的数据,容量不限。Amazon S3 提供管理功能,以便您可以优化、组织和配置对数据的访问,以满足您的特定业务、组织和合规性要求。以下是 Amazon S3 优势的一些示例。

持久性、可用性和可扩展性

Amazon S3 的构建目的就是提供 99.999999999%(11 个 9)的数据持久性。使用 Amazon S3,您的对象将冗余存储在 Amazon S3 区域中至少三个可用区(AZ)的多台设备上。Amazon S3 旨在通过快速检测和修复任何丢失的冗余,来抵御同时发生的设备故障,并且它还可使用校验和来定期验证数据的完整性。

安全性与合规性

Amazon S3 通过安全性、合规性和审核功能保护您的数据。Amazon S3 本身是非常安全的。在创建时,只有您可以访问自己所创建的 Amazon S3 存储桶,而且您可以完全控制哪些人员拥有您的数据的访问权限。Amazon S3 支持用户身份验证,以控制对数据的访问。您可以使用各种访问控制机制,例如存储桶策略,选择性地向用户和用户组授予权限。此外,S3 还维护合规性计划(如 PCI-DSS、HIPAA/HITECH、FedRAMP、SEC 法规第 17 条 a-4、欧盟数据保护指令和 FISMA)以帮助您满足法规要求。AWS 还支持很多审计功能,可用于监控对 Amazon S3 资源的访问请求。

灵活管理

AWS 提供最为灵活的存储管理和管理功能组合。存储管理员可以报告和可视化数据使用趋势并对其进行分类,以降低成本并提高服务水平。可使用唯一的可自定义元数据来标记对象,以便您可以单独查看和控制每种工作负载的存储占用情况、成本和安全性。S3 清单工具可以提供有关对象及其元数据的预定报告,以便执行维护、合规性或分析操作。Amazon S3 还可以分析对象访问模式,以便制定可以自动分级、删除和保留的生命周期策略。最后,Amazon S3 还可以与 AWS Lambda 配合使用,因此客户可以记录活动、定义提醒并调用工作流,无需管理任何其他基础设施。

经济高效的存储类

Amazon S3 提供了一系列存储类,您可以根据工作负载的数据访问、弹性和成本要求进行选择。Amazon S3 存储类专门用于为不同的访问模式提供最低成本的存储。您仅需按实际用量付费。您需要支付的费率取决于您的对象大小、您在该月存储对象的时间以及您选择的存储类别。为您的工作负载查找出色的 Amazon S3 存储类

高效分析

Amazon S3 是唯一一种允许客户对数据运行复杂数据分析的云存储平台,客户不需要将数据提取并移动到单独的分析数据库。了解 SQL 的客户可以使用 Amazon Athena 在 Amazon S3 中按需分析大量非结构化数据。借助 Amazon Redshift Spectrum,客户可以对 Amazon S3 中的数 EB 数据运行复杂的分析,还可对您在 Amazon S3 和 Amazon Redshift 数据仓库中的数据运行查询。

大型客户和合作伙伴社区

AWS 在全球拥有数百万活跃客户和数万个合作伙伴,拥有大型且极具活力的生态系统。几乎所有行业和规模的客户(包括初创公司、企业和公共部门组织)都在 AWS 上运行所有可能的使用案例。AWS 合作伙伴网络(APN)包括专注于 AWS 服务的数千个系统集成商和成千上万个将其技术应用到 AWS 中的独立软件供应商(ISV)。

立即创建 AWS 账户,开始使用对象存储。

AWS 对象存储后续步骤

查看其他与产品相关的资源
查看云存储服务的免费优惠 
注册免费账户

立即享受 AWS 免费套餐。 

注册 
开始在控制台中构建

在 AWS 管理控制台中开始构建。

登录