标准化云基础架构
与许多金融服务公司一样,我们扩展的重要方式是合并和收购,因此,当四年前我们决定进行转型时,我们的 IT 环境中已包含孤岛式应用程序和大量不同的服务器、网络和存储硬件,给我们带来了沉重的负担。 我们的第一步是启动尽量实现 IT 基础架构标准化和简化这一持续过程,这在很大程度上意味着我们要更换掉大多数之前购买的基础架构组件。 我们当前基础架构的关键要素(包括安全多租户)如图 1 所示。 (安全多租户将在稍后介绍。)
▲图 1) 物理基础架构的关键要素(包括有助于实现安全多租户的要素)。
服务器
我们的服务器环境现在包含两个主要层:在 IBM 刀片式服务器上运行的 x86 层和运行 AIX 的中端层。 总的来说,在一组 1,500 个应用程序中,我们的虚拟化程度达到 85%。 使用 350 台 VMware ESX 主机及 4,500 台虚拟机的 x86 环境的虚拟化程度达到 95%。 使用 80 个 IBM 逻辑分区 (LPAR) 的 AIX 环境也实现高度虚拟化。
网络
我们的所有网络均使用最新 Cisco Nexus 7000 和 5000 系列数据中心交换机构建。 我们在数据中心间运行自己的多协议标签交换 (MPLS) 网络,允许 VLAN 跨越数据中心。 这使在我们的灾难恢复站点重新启动虚拟机 (VM) 的过程得到简化。
在每个数据中心内,我们使用 10GbE,这使我们无需使用光纤通道电缆和交换机结构,简化了我们的电缆基础架构,并让我们可以利用两个平台上的网络资源,从而节省资金。 目前,我们正通过整合 LAN 和 IP SAN 流量进一步简化布线。
存储
现在,我们部署的存储中至少 80% 是 NetApp 产品。 最初,我们部署了 FAS6070 和 FAS6080 系统来支持核心基础架构。 目前,在我们的生产和灾难恢复设施中,有八个 FAS6000 系列系统。 过去 12 个月中,我们还开始部署 FAS3100 系列。
我们共有 49 个 NetApp 存储控制器,共计 3.7 PB 可用存储容量, 其中包含很多专门作为文件服务器的存储系统,以及遍布全国的中心站点中的存储系统。
我们的所有 FAS3100 系统均使用 512 GB 闪存模块,看到因此获得的性能后,我们也对 FAS6000 系统进行了重新配置。 闪存 [10] 通过提供智能缓存(可自动适应工作负载的变化)提高性能。
这有助于我们支持我们目前部署的虚拟桌面基础架构 (VDI) 环境(稍后进行讨论),还使我们能显著缩短包含结构化数据的应用程序的延迟。 例如,启用闪存后,I/O 频繁的 Oracle 应用程序的读取延迟已从 11 至 12 毫秒缩短为不到 2 毫秒。
FAS6000 系统上约 350 TB 存储专用于支持 VMware ESX。 在 NFS 上部署整个 VMware 环境使我们在部署速度和灵活性方面取得了巨大的成功;我们 NFS 上的 VMware 部署是世界上最大的此类部署之一。 由于能够为 VMware 预先配置很大的卷,因此向新环境过渡变得更加简单。
我们使用 NetApp 多协议功能将大多数应用程序数据存储在同一存储设备上的单独 iSCSI LUN 中。 [1] 部署 SnapManager for Virtual Infrastructure (SMVI) 时,我们希望能通过将数据写入到 VMDK 文件移动到全 NFS 环境。 SnapDrive 更新使这一战略成为现实。 我们的 IBM AIX LPAR 环境也在 NFS 上运行。