1961年,人工智能之父John McCarthy教授提出,未来某一天,计算机将会像电话系统一样被组织成为一个全新的基础设施供用户使用。

随着二十年的快速发展,云计算已经成为了IT基础设施的代名词。特别是私有云和混合云,已经是企业IT建设的事实参考架构。升级转型到云模式,需要理解云计算的三个核心目标:

  1. 使用虚拟化技术,抽象所有IT资源,使之成为应用在其之上可以任意部署的资源池
  2. 利用软件定义技术,使得所有IT资源的运维管理高度自动化、自服务化
  3. 把企业云建设成为企业的数字业务创新平台、企业数字化转型的引擎。

2024.11 天津东丽·中国移动空港数据中心

从用户群体而言,公有云集中了大批中小企业和个人开发者,私有云巩固了大中型企业的IT堡垒,混合云则受大型政企的青睐。企业私有云的建设并非只是新技术的变革与引入,而是颠覆传统信息系统建设模式的系统工程。

私有云资源规划及设计

企业信息技术需求分析

基础设施需求

  1. 提高资源利用率、节约机房空间
  2. 灵活调配资源,建设绿色数据中心
  3. 基础设施标准化、整合和统一规划
  4. 优化数据存储,减少整体数据量
  5. 基础设施的统一管理ihe运维
  6. 缩短业务信息系统部署周期
  7. 业务信息系统灵活扩展
  8. 高性能计算需求
    1. IO瓶颈
    2. 数据瓶颈
    3. 管理瓶颈
  9. 资源池跨数据中心调配需求

系统灾备需求

  1. 同城灾备信息系统技术支持需求
  2. 异地灾备信息系统技术支持需求

业务信息系统需求

  1. 弹性资源调配
  2. 保障业务连续性
  3. 统一开发测试环境

数据和标准化需求

  1. 数据需求
    1. 业务信息系统产生的数据
    2. 云技术平台运营管理数据
  2. 标准化需求
    1. 技术角度
      1. 统一云计算的概念、定义和内容
      2. 标准化互操作规范
      3. 池化资源的标准格式规范
      4. 应用开发和部署实现标准接口
      5. 相关产品
    2. 运营和安全管理
      1. 服务能力
      2. 服务质量评估
      3. 运行维护
      4. 安全管理
      5. 能效管理

私有云资源规划及设计

企业应用软件模式划分

  1. 应用功能实现类
    1. 交易类
    2. 流程类
    3. 决策类
    4. 内容管理类
  2. 应用功能集成类
    1. 界面集成类
    2. 门户网站类
    3. 应用集成类
    4. 数据集成类

私有云建设的总体原则

  1. 标准化和开放性
  2. 先进性和超前性
  3. 实用性和方便性
  4. 安全性和保密性
  5. 稳定性和可靠性
  6. 跨平台性和可移植性
  7. 可维护性和可扩展性

云管理平台设计

网络资源池设计

  1. 直连网络
  2. 虚拟网络

计算资源池设计

存储资源池设计

业务上云迁移

  1. 访谈调研上云评估解决方案
  2. 环境准备架构设计
  3. 部署实施数据迁移应用迁移
  4. 业务系统上云测试和验证
  5. 优化诊断、上线护航
  6. 项目验收、结项
  7. 迁云总结和回顾

设备利旧

私有云设计的通用原则

通用原则包括三个部分:

  1. 原则内容
  2. 理由
  3. 影响

产品设计通用原则

  1. 公平地使用:对于具有不同能力的人,产品设计的首要原则是可以让所有人都公平的使用
    1. 为所有使用者提供相同的使用方式
    2. 避免隔离或者骑士使用者
    3. 所有使用者应该拥有相同的隐私权和安全感
    4. 能引起所有使用者的兴趣
  2. 灵活的使用:设计要迎合广泛的个人喜好和能力
    1. 提供多种使用方式供使用者选择
    2. 同时考虑左右手习惯的使用者
    3. 能增进用户的准确性和精确性
    4. 适应不同用户的不同使用节奏
  3. 简单而直观
    1. 去掉不必要的复杂细节
    2. 与用户的期望和直觉保持一致
    3. 适应不同读写和语言水平的使用者
    4. 根据信息重要程度进行编排
    5. 能够提供有效的提示和反馈
  4. 能够感觉到信息
    1. 强化重要信息的可识读性
    2. 为重要信息提供不同的表达模式,确保信息冗余度
    3. 重要信息要和周边有足够的对比
    4. 以可描述的方式区分不同的元素
  5. 容错能力
    1. 对不同元素进行精心安排,降低危害和错误
    2. 提供危害和错误的警示信息
    3. 失效时能提供安全模式
    4. 在执行需要高度警觉的任务时,不鼓励分散注意力的无意识行为
  6. 提供足够的空间和尺寸

架构设计通用原则

没有完美的架构

架构设计原则需要从非功能性原则和功能性原则两个维度考虑。

  1. 非功能性原则侧重于平台的稳定性、安全性、易用性、可用性、可维护性等特征。
  2. 功能性原则主要是为了满足私有云平台对外提供服务需求

非功能性原则

  1. 扩展性
    1. 集群横向扩展须包括计算节点、存储、网络资源的扩展以及扩展后的聚合
    2. 计算节点加入集群后,私有云上的现有业务不受影响
    3. 新节点加入对于用户是透明的,无须额外操作
  2. 稳定性
    1. 基础架构支持一定规模下的压力测试
    2. 具备完善的监控能力
    3. 具备自我修复能力
  3. 开放性
    1. API支持Restful
    2. API具备良好的兼容性
    3. API信息访问支持加密和安全访问控制

功能性原则

  1. 明确平台的服务层次,是IaaS,还是PaaS
  2. 针对每个层次,设定对应的SLA

私有云平台建设和管理

设计原则

  1. 标准化
  2. 高可用
  3. 增强的二层网络
  4. 虚拟化
  5. 高性能
  6. 开放接口

架构设计

IaaS

  1. 基础硬件设施层:服务器、存储、网络
  2. 虚拟化/资源池化层:计算虚拟化、网络虚拟化、存储虚拟化
  3. 资源调度层:弹性计算、负载均衡、动态迁移、按需供给

PaaS

  1. 统一身份认证
  2. 访问控制
  3. 工作流
  4. 决策支持及BI

SaaS

  1. 企业门户
  2. 信息管理
  3. 业务支撑

信息安全体系

  1. 安全服务中心
  2. 云安全模式

运营管理体系

  1. 故障管理
  2. 计费管理
  3. 性能管理
  4. 配置管理

部署和管理

云平台的部署

  1. 云管理平台统一管理所有资源池,包括生产资源池和灾备资源池
  2. 每个资源池中保持适应该类资源池的镜像和脚本文件、配置文件副本
  3. 业务数据在存储底层通过异步复制实现一致

云资源管理

  1. 设备管理
  2. 虚拟适配层
  3. 云适配层
  4. 虚拟化资源池管理
  5. 资源池调度
  6. 资源池服务
  7. 对外接口
  8. 管理平台

配置和合规性管理

  1. 配置与合规性管理流程的定义和组成部分
    1. 定义配置和合规性策略
    2. 准备内容
      1. 为验证合规性而收集的信息
      2. 用于显示合规性级别的报告
      3. 用于修正不合规之处的自动作业和操作手册程序
    3. 收集信息
      1. 用于标准化和强化的配置设置
      2. 固件、软件和补丁程序级别
      3. 变更记录的状态和完成情况
      4. 用户访问记录
      5. 网络访问记录
    4. 评估结果并生成显示各方面合规性级别的报告
    5. 对于不合规之处进行修正
  2. 配置与合规性管理的流程发展历程
  3. 流程自动化和工具的调整、集成

流程管理

  1. 服务请求管理
  2. 变更管理
  3. 故障管理

监控管理

  1. 保障云平台提供优质服务
  2. 支撑容量规划能力
  3. 支持弹性收缩能力

容量管理

  1. 定义
    1. 容量预测
    2. SLA
  2. 组成要素
    1. 容量储备
    2. 预测新要求
    3. 决策支持

存储管理

租户和权限

接口设计

  1. 管理服务接口
  2. 资源供给接口
  3. 外部调用接口

生命周期管理

计费管理

多云管理

容器云建设

网络设计

  1. 隧道方案
  2. 路由方案
  3. VLAN方案

持久化存储

  1. 容器卷插件
  2. Kubernetes的数据卷

日志集中管理

  1. 避免写日志冲突
  2. 不可忽视的日志标准化

监控设计

  1. 系统的监控
  2. 应用的监控
  3. 服务的监控

多租户和权限

  1. 多族与设计
  2. 资源管理与分配
  3. 安全权限管理

虚拟化与Kubernetes集成

灾备建设与管理

三个目标:

  1. 应用恢复时间
  2. 网络恢复时间
  3. 业务恢复时间

灾备规划与分析

  1. 数据分析
    1. 用途划分
    2. 存储和管理方式划分
  2. 业务分析
    1. 关键业务系统
    2. 重要业务系统
    3. 一般业务系统
  3. 技术分析
    1. 离线式容灾
    2. 在线容灾
  4. 数据恢复
    1. 基于存储的数据复制技术
    2. 基于主机的数据复制技术
    3. 基于数据库的数据复制技术

灾备级别与等级划分

  1. 数据集容灾
  2. 应用级容灾
  3. 业务级容灾

设计整合的架构

  1. 扩展性
  2. 安全性
  3. 高性能
  4. 易管理

灾备测试

服务与安全

云服务

  1. 服务定义与特征

  2. 服务的调配管理

  3. 服务设计和开发管理

    1. 服务要求
    2. 服务设计
      1. 概要设计说明服务
      2. 与服务产品组合以及目录集成
      3. 与服务反馈和计量集成
      4. 业务用户对服务设计签字确认
    3. 服务开发
      1. 定义服务开发方法
        1. 记录可转化为服务定义和SLA的业务驱动因素和要求
        2. 明确定义运营要求
        3. 定义业务情景和使用情形
        4. 定义业务用户和角色
        5. 制定服务的工作流说明
        6. 成本效益分析
      2. 与运营流程集成
        1. 性能SLA
        2. 可用性SLA
        3. 连续性SLA
        4. 安全性
        5. 合规性
      3. 指定服务控制措施
    4. 常见服务开发特点
      1. 按需自助服务
      2. 服务移动性
      3. 池化资源
      4. 灵活快捷
      5. 量化服务

云安全

  1. 传统安全边界消失
  2. 虚拟化服务的安全问题
  3. 数据集中的安全问题
  4. 稳定性和可靠性问题
  5. 云技术平台保护策略
  6. 企业私有云安全防护实践
    1. 边界防护
    2. 基础防护
    3. 增强防护
    4. 云化防护

私有云通用能力成熟度评估

通用云计算评测标准:

  1. 评估对象为云服务产品供应商,用于解决新技术、新产品选型,例如ITSS、可信云、云计算测评基准库
  2. 评估对象为建云的企业用户、用于基于用户角度综合评定从规划到投产的应用效果,例如3CMM模型

成熟度评估概念和模型

评估模型

  1. 四域,贯穿 规划建设-采购招标-资源提供-运营维护-服务交付
    1. 云服务规划
    2. 云资源提供
    3. 云服务管理
    4. 云安全
  2. 三维
    1. 技术
    2. 管理
    3. 效果

发展阶段

  1. 离散孤岛阶段
  2. 分层解耦阶段
  3. 服务导向阶段
  4. 能力体系阶段
  5. 服务融合阶段

评估方法

  1. 关键指标
  2. 参考指标

技术成熟度评估

云服务规划技术

  1. 架构规划
  2. 资源池架构
  3. 服务产品规划设计
  4. 服务连续性

云资源提供技术

  1. 资源调度
  2. 资源计量
  3. 云配置管理
  4. IaaS类资源能力
  5. PaaS类资源能力

云服务管理技术

  1. 云服务发布能力
  2. 故障管理能力
  3. 云服务自动化开通比例
  4. 服务开通时延

云安全技术

  1. 虚拟化网络安全
  2. 安全服务
  3. 安全域划分

管理成熟度评估

云服务规划管理

  1. 人员角色
    1. 技术架构设计和规划人员
    2. 容量规划员
    3. 预算管理员
    4. 建设工程项目经理
    5. 云服务安全和风向管理者
  2. 服务容量管理
    1. 人工估算
    2. 性能量化
    3. 线下压测
    4. 线上压测
  3. 组织架构管理
    1. 组织架构与市场业务对其
    2. 团队交互强调业务和平台之间、组织团队间、流程与测量数据正反馈
    3. 企业管理文化层强调勇于认错、持续改进

云资源提供

  1. 人员角色
    1. 资产管理和监控
    2. 资源调度
    3. 资源分配
    4. 资源回收
    5. 需求开发
  2. 云资源提供流程
    1. 资产管理流程
    2. 资源建设部署流程
    3. 资源分配/调整/回收/需求开发流程

云服务管理

  1. 服务人员角色,团队中必须的角色
    1. 云服务运营者
    2. 云服务交付者
    3. 云服务业务管理者
    4. 云服务管理者
    5. 网络服务提供者
  2. 运营交付流程
  3. 运维管理流程

云安全管理

  1. 制定访问控制策略和流程
  2. 定义岗位职责和工作内容
  3. 对访问者进行背景调查
  4. 定期对访问人员行为和操作进行安全审计
  5. 完成安全认证

成熟度效果评估

云服务规划

  1. 服务资源成本利用率
  2. 私有云规划建设周期

云资源提供

  1. 资源池化比例
  2. 资源性能
  3. 集群资源利用率
  4. 人均管理设备台数

云服务管理

  1. 资源交付周期
  2. 云服务业务支撑可用性
  3. 私有云使用周期

云安全效果

  1. 4A管控
  2. 重大安全事件数目