使用 Microsoft Azure Data Box 云解决方案可以通过快速、经济、可靠的方式向 Azure 发送 TB 量级的数据。 通过向你发送专有的 Data Box 存储设备来加速安全数据传输。 这些存储设备有两种变体,其最大可用存储容量分别为 120 TB 和 525 TB。 这些通过区域运营商传输到数据中心。 这些设备具有坚固的外壳,可在运输过程中保护数据。
注释
Azure Data Box 80TB 设备将于 2025 年 5 月 31 日在美国、欧盟、英国、加拿大和 US Gov 区域停用。 在此日期之后,将不再接受此设备的新订单。 但是,我们将继续处理和支持所有现有订单。 Azure Data Box 服务将转换为使用下一代 Azure Data Box 120、Azure Data Box 525、Azure Data Box Disk 和 Azure 导入/导出服务,以满足这些区域中的所有脱机数据传输需求。
使用 Microsoft Azure Data Box 云解决方案可以通过快速、经济、可靠的方式向 Azure 发送 TB 量级的数据。 通过向你发送专有的 Data Box 存储设备来加速安全数据传输。 每个存储设备的最大可用存储容量为 80 TB,并通过区域运营商传送到数据中心。 该设备具有坚固的外壳,可在运输过程中保护数据。
可以通过 Azure 门户订购 Data Box 设备,以便从 Azure 导入或导出数据。 收到设备后,可使用本地 Web UI 进行快速设置。 根据是导入数据还是导出数据,将数据从服务器复制到设备或从设备复制到服务器,再将设备寄回 Azure。 如果要将数据导入到 Azure,在 Azure 数据中心内,数据将从设备自动上传到 Azure。 通过 Azure 门户中的 Data Box 服务对整个过程进行端到端跟踪。
用例
Data Box 非常适合在在无网络连接到有限网络连接的情况下传输大于 40 TB 的数据。 数据移动的方式可以是一次性的、定期的,或者先执行批量数据传输,再定期传输。
Data Box 非常适合用于在多个场景中将数据导入 Azure,包括以下场景:
一次性迁移 - 需要将大量本地数据移到 Azure 时。
- 将媒体库从脱机磁带移动到 Azure 以创建联机媒体库。
- 将 VM 场、SQL server 和应用程序迁移到 Azure。
- 将历史数据移至 Azure,以便使用 HDInsight 进行深入分析和报告。
初始批量传输 - 需要先使用 Data Box(种子)执行初始批量传输,然后通过网络执行增量传输时。
- 例如,备份解决方案合作伙伴(如 Commvault 和 Data Box)用于将初始大型历史备份移至 Azure。 完成后,增量数据将通过网络传输到 Microsoft Azure 存储。
定期上传 - 定期生成大量数据,并需要将这些数据移到 Azure 时。 例如,能源勘探领域生成有关钻井平台和风力发电农场的视频内容。
Data Box 可用于在多个场景中从 Azure 导出数据,包括以下场景:
灾难恢复 - 将来自 Azure 的数据副本还原到本地网络。 在典型的灾难恢复场景中,大量的 Azure 数据会被导出到 Data Box。 Microsoft 随后会发送此 Data Box,数据很快就会在本地还原。
安全要求 - 由于政府或安全要求,需要能够从 Azure 导出数据。 例如,Azure 存储在 US Secret 和 Top Secret 云中可用时,你可以使用 Data Box 从 Azure 导出数据。
迁移回本地或其他云服务提供商 - 当你想要将所有数据移回本地或其他云服务提供商时,请通过 Data Box 导出数据以迁移工作负载。
从 Data Box 引入数据
Azure 提供程序和非 Azure 提供程序均可以从 Azure Data Box 引入数据。 提供 Azure Data Box 数据引入功能的 Azure 服务包括:
SharePoint Online - 使用 Azure Data Box 和 SharePoint 迁移工具 (SPMT) 将文件共享内容迁移到 SharePoint Online。 使用 Data Box,可以删除用于传输数据的 WAN 链接上依赖项。 有关详细信息,请参阅使用 Azure Data Box Heavy 将文件共享内容迁移到 SharePoint Online。
Azure 文件同步 - 将文件从 Data Box 复制到 Azure 文件共享,这使你能够将文件服务汇聚到 Azure 中,同时又能保持对数据的本地访问权限。 有关详细信息,请参阅部署 Azure 文件同步。
HDFS 存储 - 使用 Data Box 将数据从 Hadoop 群集的本地 Hadoop 分布式文件系统 (HDFS) 存储迁移到 Azure 存储中。 有关详细信息,请参阅使用 Azure Data Box 从本地 HDFS 存储迁移到 Azure 存储。
Azure 备份 - 使你能够通过脱机机制将关键企业数据的大型备份移动到 Azure 恢复服务保管库。 有关详细信息,请参阅 Azure 备份概述。
可以将 Data Box 数据与多个非 Azure 服务提供程序协同使用。 例如:
- Veeam - 使你能够将大量数据从 Hyper-V 计算机备份并复制到 Data Box。
- Commvault - 利用 Azure Data Box 将 pbyte 规模备份和存档数据从本地迁移到 Azure,以用于网络约束环境。
优点
Data Box 旨在几乎不影响网络的情况下将大量数据移至 Azure。 该解决方案具有以下优点:
- 速度 - 下一代 Data Box 使用最高 100 Gbps 网络接口将数据移入和移出 Azure。
- 速度 - Data Box 使用 1 Gbps 或 10 Gbps 网络接口将多达 80 TB 的数据移入和移出 Azure。
- 安全 - Data Box 为设备、数据和服务提供内置安全保护。
该设备具有坚固的外壳,通过防破坏螺钉和防破坏贴纸固定。
设备上的数据始终使用 AES 256 位加密进行保护。
只能使用 Azure 门户中提供的密钥解锁设备。
服务受 Azure 安全功能的保护。
将导入订单中的数据上传到 Azure 后,会根据 NIST 800-88r1 标准完全擦除设备上的磁盘数据。 对于导出订单,一旦设备到达 Azure 数据中心,就会擦除磁盘。
有关详细信息,请参阅 Azure Data Box 安全性和数据保护一文。
功能和规格
此版本中的 Data Box 设备具有以下功能。
规范 | 说明 |
---|---|
重量 | < 46 磅。 |
维度 | 设备 - 宽度:309.0 毫米 高度:430.4 毫米 深度:502.0 毫米 |
机架空间 | 放在机架侧面时为 7 U(不能安装在机架上) |
所需的电缆 | 1 根电源线(附送) 2 个 10G-BaseT RJ45 电缆(CAT-5e 或 CAT6)(不包括) 2 个 100-GbE QSFP28 被动直接连接电缆(不包括)。 |
RAID 配置 | RAID 5 |
存储容量 | SKU 1 - 120 TB 可用(原始版本为 150 TB) SKU 2 - 525 TB 可用(原始版本为 600 TB) |
功率分级 | 电源设备的概率为 1300 瓦。 通常情况下,单位设备为 384 瓦。 |
网络接口 | 2 个 10-GbE 接口 - MGMT 和 DATA 3。 MGMT - 适用于管理,用户不可配置,用于初始设置 DATA3 - 适用于数据,用户可配置,且默认为动态 MGMT 和 DATA 3 也可作为 1 GbE 接口使用 2 个 100-GbE 接口 (QSFP28) - DATA 1、DATA 2 两者都用于数据,可以配置为动态(默认)或静态 |
数据传输 | 支持导入和导出。 |
数据传输介质 | RJ45、QSFP28 铜 |
安全性 | 坚固耐用的设备外壳,带防破坏定制螺钉 设备中的入侵检测系统 安全启动 硬件信任根 TPM 2.0 |
数据传输率 | 对大型文件使用 RDMA 上的 SMB Direct (100-GbE) 大约为 7 GB/秒。 可以使用这两个数据端口,但不是必需的。 性能可能因文件的源和大小而异。 |
管理 | 本地 Web UI - 一次性初始设置和配置 Azure 门户 - 日常设备管理 |
冷却功能 | 内部风扇冷却。 运行温度为 0-35°C 时性能完全正常,35-45°C 时性能有所降低。 存储温度为(-40 到 60)C 空气流量详细信息为 144 CFM/KW(120 TB)和 122 CFM/KW(525 TB) |
重要说明
Data Box Next Gen 120TB 和 525TB 设备使用 QSFP28 电缆。 与原始 80TB 设备一起使用的 SFP+/SFP28 电缆不能在没有适当适配器的情况下直接插入 Data Box Next Gen 设备。
下一代 Data Box 性能改进
新版本为数据引入和上传提供了增强的性能,使企业客户可以更轻松、更快地将大规模数据迁移到 Azure,无需大量的本地网络基础结构。 关键改进包括-
- NVMe 设备提供更快的数据传输速率,通过适用于中型到大型文件的 RDMA 上的 SMB Direct (100-GbE),复制速度高达 7GBps,与上一代设备相比,设备传输速度提高了 10 倍。
- 数据复制服务中性能显著提高,对于小型文件 (64K-512K) 提升 2 倍,对于大型文件 (8 MB-128 MB) 提升 7 倍。 数据复制服务在 Data Box 上本地运行,通过服务器消息块 (SMB) 协议连接到用户的网络连接存储 (NAS) 设备,并将数据复制到 Data Box。 这样就无需中间主机引入数据。
- 中到大型文件高速传输到 Azure 的数据上传速度高达 5 倍,可以最大限度地减少数据在 Azure 云中可访问的提前期。
- 这些改进是通过优化硬件和软件堆栈来实现的,包括对 SMB 使用 RDMA,从而共同降低 CPU 使用率,并提高整体效率。
规范 | 说明 |
---|---|
重量 | < 50 磅。 |
维度 | 设备 - 宽度:309.0 毫米 高度:430.4 毫米 深度:502.0 毫米 |
机架空间 | 放在机架侧面时为 7 U(不能安装在机架上) |
所需的电缆 | 1 根电源线(附送) 2 条 RJ45 电缆(未附送) 2 条 SFP + Twinax 铜电缆(未附送) |
存储容量 | 100 TB 设备在进行 RAID 5 保护后有 80 TB 的可用容量 |
功率分级 | 电源设备的概率为 700 瓦。 通常情况下,设备为 375 瓦。 |
网络接口 | 2 个 1 GbE 接口 - MGMT 和 DATA 3。 MGMT - 适用于管理,用户不可配置,用于初始设置 DATA3 - 适用于数据,用户可配置,且默认为动态 MGMT 和 DATA 3 也可作为 10 GbE 接口使用 2 个 10 GbE 接口 - DATA 1 和 DATA 2 两者都用于数据,可以配置为动态(默认)或静态 |
数据传输 | 支持导入和导出。 |
数据传输介质 | RJ45、SFP+ 铜缆 10 GbE 以太网 |
安全性 | 坚固耐用的设备外壳,带防破坏定制螺钉 防破坏贴纸放置在设备的底部 |
数据传输率 | 每天多达 80 TB 的数据,通过 10 GbE 的网络接口传输 |
管理 | 本地 Web UI - 一次性初始设置和配置 Azure 门户 - 日常设备管理 |
Data Box 组件
Data Box 包括以下组件:
Data Box 设备 - 一种物理设备,它提供主存储、管理与云存储的通信,还有助于确保存储在设备上的所有数据的安全性和机密性。 Data Box 设备的可用存储容量为 120 TB/525 TB,具体取决于所选的 SKU。
Data Box 设备 - 一种物理设备,它提供主存储、管理与云存储的通信,还有助于确保存储在设备上的所有数据的安全性和机密性。 Data Box 设备的可用存储容量为 80 TB。
Data Box 设备 - Azure 门户的扩展,使用该扩展可以通过 Web 界面(可从不同的地理位置访问该界面)管理 Data Box 设备。 使用 Data Box 服务执行的 Data Box 设备的日常管理。 服务任务包括如何创建和管理订单、查看和管理警报以及管理共享。
有关详细信息,请转到使用 Data Box 服务管理 Data Box 设备。
本地 Web 用户界面 - 基于 Web 的UI,用于配置设备,以便它可以连接到本地网络,并向 Data Box 服务注册该设备。 此外还可以使用本地 Web UI 关闭和重启 Data Box 设备、查看复制日志,并联系 Microsoft 支持部门以提交服务请求。
设备上的本地 Web UI 当前支持以下语言及其相应的语言代码:
语言 代码 语言 代码 语言 代码 英语(默认) en 捷克语 cs 德语 de 西班牙语 es 法语 fr 匈牙利语 hu 意大利语 it 日语 ja 韩语 ko 荷兰语 荷兰 波兰语 pl 葡萄牙语 - 巴西 pt-br 葡萄牙语 - 葡萄牙 pt-pt 俄语 ru 瑞典语 sv 土耳其语 tr 简体中文 zh-hans 有关使用基于 Web 的 UI 的详细信息,请转到使用基于 Web 的 UI 管理 Data Box。
工作流
典型的导入流包括以下步骤:
订购 - 在 Azure 门户中创建订单,提供发货信息和数据的目标存储帐户。 如果设备可用,则 Azure 会准备,然后寄送设备并随附发货跟踪 ID。
接收 - 交付设备后,使用指定的电缆为设备连接网络和电源。 (设备附送了电源线。需要购买数据电缆。)打开并连接到设备。 在要从中复制数据的主机上配置设备网络并装载共享。
复制数据 - 将数据复制到 Data Box 共享。
返回 - 准备、关闭并将设备发回 Azure 数据中心。
上传 - 将设备中的数据自动复制到 Azure。 根据美国国家标准和技术协会 (NIST) 的准则安全擦除设备磁盘数据。
在整个过程中,你会收到有关所有状态更改的电子邮件通知。 有关详细流的详细信息,请转到在 Azure 门户中部署 Data Box。
典型的导出流包括以下步骤:
订购 - 在 Azure 门户中创建导出订单,提供发货信息和数据的源存储帐户。 如果设备可用,Azure 将准备一台设备。 将数据从存储帐户复制到 Data Box。 数据复制完成后,Microsoft 将寄送设备并随附发货跟踪 ID。
接收 - 交付设备后,使用指定的电缆为设备连接网络和电源。 (设备附送了电源线。需要购买数据电缆。)打开并连接到设备。 在要将数据复制到的主机上配置设备网络并装载共享。
复制数据 - 将数据从 Data Box 共享复制到本地数据服务器。
返回 - 准备、关闭并将设备发回 Azure 数据中心。
数据擦除 - 根据美国国家标准和技术协会 (NIST) 的准则安全擦除设备磁盘数据。
在整个导出过程中,你会收到有关所有状态更改的电子邮件通知。 有关详细流的详细信息,请转到在 Azure 门户中部署 Data Box。
上市区域
Data Box 可根据部署服务的区域、设备的接收国家/地区以及传输数据的目标存储帐户来传输数据。
对于导入
服务可用性 - 当对导入或导出订单使用 Data Box 时,若要获取有关区域可用性的信息,请转到 Azure 可用产品(按区域)。
对于导入订单,Data Box 也可以部署在 Azure 政府云中。 有关详细信息,请参阅什么是 Azure 政府?。
目标存储帐户 - 存储数据的存储帐户可在服务可用的所有 Azure 区域中获得。
Data Box 设备的跨区域数据传输
从任何源到任何 Azure 目标区域的直接上传
现在,客户可以从 DataBox 设备向任何 Azure 目标区域选择一个给定源以进行直接上传。 通过此功能,可从本地源复制数据并将其传输到不同国家、地区或边界内的目的地。 例如,本地存储在源国家/地区(如印度)的数据可以直接上传到不同国家/地区(如美国)的 Azure 区域。 此功能为具有分布式数据存储需求的组织提供了灵活性和便利性。 请务必注意,DataBox 设备不会跨商业边界交付。 而会将其传输到始发国家或地区内的 Azure 数据中心。 源国家/地区与目标区域之间的数据传输使用 Azure 网络进行,不会产生额外费用。
优点
此功能对于在多个区域中设置 Azure 工作负载的大型分布式组织特别有用。 通过它可进行跨区域无缝数据传输,而无需中间步骤。 此外,不对客户收取跨洲际传输费用,这使其成为全球数据管理的一种经济高效的解决方案。
例外和限制
在规划数据传输策略时,客户应注意以下例外和限制:
- 不支持跨云传输。 无法在不同的云提供商之间传输数据。
- 不支持跨商业边界传送 Data Box 设备本身。
- 某些数据传输场景发生在大型地理区域。 在此类传输过程中,可能会遇到高于正常水平的延迟。
数据复原能力
Data Box 服务本质上是地域性的,并且在每个国家或商业边界内的某个区域中都有一个活动部署。 对于数据复原能力,服务的被动实例在不同区域进行维护,通常在同一国家或商业边界内。 在少数情况下,配对区域位于国家或商业边界之外。
在任何 Azure 区域受到灾难影响的极端事件中,Data Box 服务将通过相应的配对区域提供。 正在进行的和新的订单都将通过配对区域的服务进行跟踪和履行。 故障转移是自动的,由 Microsoft 处理。
对于与同一国家或商业边界内的区域配对的区域,无需执行任何操作。 Microsoft 负责恢复,这可能需要长达 72 小时。
对于在同一地理区域或商业边界内没有配对区域的区域,将通知客户从不同的可用区域创建新的 Data Box 订单,并将其数据复制到新区域的 Azure。 巴西南部和东南亚地区以及东亚地区将需要创建新订单。
有关详细信息,请参阅业务连续性和灾难恢复 (BCDR):Azure 配对区域。
后续步骤
- 请查看 Data Box 系统要求。
- 了解 Data Box 限制。
- 在 Azure 门户中快速部署 Azure Data Box。