客户案例 / 媒体与娱乐行业 / 英国

2024 年
BBC 徽标

BBC 使用 Amazon S3 留存其百年历史

了解英国公共服务广播公司 BBC 如何将其旗舰档案安全迁移至 Amazon S3 Glacier Instant Retrieval。

留存

留存 BBC 档案内容为后人所用

25 PB

在 10 个月内完成迁移(120 TB/天);停用物理基础设施

缩减

使用 Amazon S3 Glacier Instant Retrieval 和 S3 Intelligent-Tiering 缩减整体基础设施成本

优化

数据可用性并提高数据和内容的可访问性

数据湖

标准化存储基础,以便日后开拓机遇

概述

英国广播公司 (BBC) 档案技术和服务团队需要一个现代化的解决方案来集中、数字化和迁移其已有百年历史的旗舰档案。该团队希望合并其档案,增强媒体的可保存性和可访问性,以供将来使用。

由于 BBC 有使用 Amazon Web Services (AWS) 的经验,它开始使用 Amazon Simple Storage Service (Amazon S3) Glacier Instant Retrieval。这是一种归档存储类,可提供最低成本的存储服务,适合长期保存但极少访问且要求毫秒级检索能力的数据。通过将其档案库迁移到 AWS,BBC 优化了数据的可访问性,提高了成本效益,腾出了所占用物理基础设施空间,并为档案保存的未来转型提供了支持。

广播间

机会 | 利用 AWS 留存数据并提高 BBC 的数据可访问性

BBC 档案技术和服务团队是 BBC 百年档案的保管团队,负责保管这家广播公司成立以来的所有档案——从历史电影到现代数字媒体的 1600 万项媒体资产。该团队致力达成三大目标:整合所有档案的交付内容、通过数字化提高档案的可访问性,以及使用现代解决方案留存媒体内容。“我们希望制定一项前瞻性战略,使用灵活的存储和计算等工具来促进机器学习的应用。”BBC 档案技术和服务团队的产品及服务主管 Brendan Mallon 表示,“我们的目标是保护档案库的内容,确保它在未来 100 年内依然可供访问。”

该广播公司的数据被分成新闻、体育、广播以及节目等不同的类别存储库。它希望标准化其供应链和工作流程,以制定可持续的集中化存档计划。虽然它在本地基础设施上运行良好,但在 2017 年,它意识到必须降低其系统的复杂性。现有分散的数据集使得内容整合变得非常繁琐。于是,该团队开始了为期五年的任务,以整合其各种存储应用层并提高可持续性。

由于 BBC 多年来一直在 AWS 上运行其媒体资产处理系统,因此迁移到支持长期保存策略的 AWS 解决方案是切实可行的选择。“我们希望采用一致的方法从不一致的数据集中提取价值,创建与媒体相匹配的权威单一目录,为我们的受众创造价值。”Mallon 说,“我们可以利用 AWS 对所有内容进行标准化存储。”

kr_quotemark

通过 Amazon S3 Glacier Instant Retrieval,我们可以快速检索档案,同时可灵活管理成本。”

Mark Glanville
BBC 档案技术与服务部门高级技术架构师

解决方案 | 每天迁移 120 TB 并通过优化存储降低成本

由于存档数据的规模,网络迁移是最切实可行的自动化选择。为了完成内容迁移,BBC 使用了由 AWS Direct Connect 支持的现有基础设施。这是一项云服务,可帮助用户创建连接 AWS 的专用网络,实现大规模流畅可靠的数据传输,以进行近乎实时的分析、快速的数据备份或广播媒体处理。2022 年 11 月,在经过大约 12 个月的规划及咨询 AWS 合作伙伴 CloudFirst.io (Cloudfirst) 后,档案迁移工作正式开始。

在高峰期,该团队每天迁移 120 TB 的数据,并使用 AWS Direct Connect 将大量内容传输到 AWS。在短短 10 个月内,该团队已将 25PB 的数据传输到云端。通过这种方式,可以停用其传统的磁带介质媒体存储库,并在媒体资产管理系统和公共云存储之间开发下一代抽象层。“我们得以停用半数档案库的物理基础设施。”BBC 档案技术与服务团队的高级技术架构师 Mark Glanville 说道,“这为伦敦市中心的宝贵空间腾出了大量的技术空间和技术能力。”

BBC 将其大部分数据迁移到了 Amazon S3 Glacier Instant Retrieval。该解决方案为存储在 BBC 档案库中的各种数据提供了理想的灵活存储类别。由于团队已经在其媒体资产处理系统中使用了 AWS,该系统已存储了大约 3 PB 的数据,因此他们对 Amazon S3 解决方案有了丰富的经验。“我们与 AWS 团队合作,为我们的大部分内容选择了正确的存储类别。”Glanville 表示,“通过 Amazon S3 Glacier Instant Retrieval,我们可以快速检索档案,同时可灵活管理成本。”

该团队结合使用 Amazon S3 Glacier Instant Retrieval 和 Amazon S3 Intelligent-Tiering,后者是一种云存储类别,可在不影响性能或运营开销的情况下自动节省存储成本。BBC 可以根据其预期的访问级别在这两种存储类别之间进行选择,而不会影响性能。

“通过使用 Amazon S3 Glacier Instant Retrieval 和 Amazon S3 Intelligent-Tiering,我们可以为相对热存储中的内容获得类似档案馆的计价模式。”BBC 执行产品经理 Tom Cartwright 说,“这非常重要,因为我们可以在项目初期就决定数据的存储位置。”

成果 | 为机器学习机会创建数据湖

随着百年来的内容都已纳入档案库,BBC 正着眼于未来的数据标准化和数据留存。它计划通过可整合物理和数字资产的下一代数据湖来应对这一挑战。BBC 希望使用语音转文本和面部识别等工具,通过机器学习来提升数据发现能力。使用机器学习工具显著提高了档案库的可搜索性,可以更加轻松地搜索绝大部分内容。目标是优化保存、可用性和创新能力,以便在未来 100 年内不断为受众传递价值。

“我们共同的愿景是为业务建立一个可持续的未来。”Mallon 表示,“我们希望尽可能简便地发现及访问我们的内容。”

关于 BBC

英国广播公司 (BBC) 是一家拥有百年历史的公共服务广播公司,服务英国及全球数百万观众。该公司拥有广泛的多媒体资产,包括电视频道、广播网络、数字服务和新闻服务。

使用的 AWS 服务

Amazon S3

Amazon Simple Storage Service(Amazon S3)是一项对象存储服务,在可扩展性、数据可用性、安全性和能效方面业界领先。

了解更多 »

免费获得 S3 的实操体验 »

Amazon S3 Glacier Instant Retrieval

Amazon S3 Glacier Instant Retrieval 是一种归档存储类,可提供最低成本的存储服务,适合长期保存但极少访问且要求毫秒级检索能力的数据。

了解更多 »

Amazon S3 Intelligent-Tiering

Amazon S3 Intelligent-Tiering 是唯一可以在数据访问模式改变时自动节省存储成本的云存储类,且不会影响性能或运营开销。

了解更多 »

AWS Direct Connect

AWS Direct Connect 云服务是通往 AWS 资源的最短路径。传输时,您的网络流量保持在 AWS 全球网络上,不会接触公共互联网。

了解更多 »

更多媒体与娱乐行业客户案例

未找到任何项目 

1

行动起来

无论行业无论规模,每天都有各种机构在使用 AWS 实现自身业务转型、实现企业愿景。欢迎您联系我们的专家,立即踏上您的 AWS 之旅。