「服务器巡检和维护报告」模板
服务器巡检和维护报告巡检时间2022年12月30日 巡检人员小明 基础信息服务器名称:WebServer001IP地址:192.168.1.100服务器类型:虚拟化应用服务器巡检内容系统状态 监控项目 主机状态 CPU使用率 50% 内存使用率 70% 硬盘使用率 40% 网络流量 12.8GB 服务状态 服务名称 服务状态 WEB服务 运行正常 数据库服务 运行正常 邮件服务 运行正常 其他服务 运行正常 安全检查 安全项目 运行状态 防火墙设置 已启用 安全漏洞扫描 无高危漏洞 病毒扫描 无病毒感染 备份检查 备份项目 检查状态 系统备份 已备份 数据备份 已备份 存在风险问题记录、解决方案及预期解决时间表 问题编号 问题描述 问题表现 影响范围 发生频率 解决方案 操作步骤 预计解决时间 1 系统日志管理不善 日志堆积,未及时清理,占用磁盘空间 本地主机 每季度 优化日志管理策略 建立日志轮转清理脚本 2023年1月10日 风险分析优化日志管理策略,可能会需要重新配置...
「Goolge SRE 解密」
SRE就是让一个软件工程师来主导设计一个新型运维团队的结果 概念SRE: Site Reliability Engineering,SRE是一门工程科学,旨在帮助组织在其基础设施和应用系统中可持续的达成预设的可靠性目标。 前提: 故障是不可避免的,建立错误预算,要以工程视角来理解运维 所有问题都是软件问题、都能用程序来解决,研发软件解决运维问题 SLO的引入 团队人员兼具开发和运维能力, DevOps文化DevOps是一套有关运维和产品开发之间全生命周期协作的广泛原则。 运维构建自动化的变更流水线,运维搭桥、开发走路 CI/CD工具链: 持续交付 持续集成 原则SRE是一个工作角色,一组有效的实践以及激励这些实践的信念。 做好运维工作,需要采用软件工程的方法来实现 SRE不试图为所有东西提供100%的可用性,接受故障、拥抱故障、解决故障 SRE反对任何不必要的人力接入,要尽可能减少手工操作,运维的时间投入不得超过50% 通过降低失败成本而提升服务效能,SRE并不一定带来可靠性提升,更注重改进改进的速度 与开发共享所有权 SRE倾向关注生产问题而非业务逻辑...
CKA学习纲要-基础部署和POD的管理
部署、配置和验证环境 部署环境 主机 角色 IP k8smaster Master 192.168.10.120 k8snode1 Node 192.168.10.121 k8snode2 Node 192.168.10.122 版本信息 程序 版本号 Linux Rockylinux 9.3 Kubernetes 1.28.2 Docker 24.0.7 Cri-Docker 0.3.8 部署 构建BaseOS12# 所有节点主机配置免密登录# 提前下载相应yaml文件和镜像或者科学上网开启全局模式 部署Docker1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253# 关闭防火墙systemctl disable --now firewalld# 关闭selinuxsed -i 's/enforceing/disabled' /etc/selinux/con...
谈谈阿里云的ACE面试
全宇宙第77个阿里云ACE新鲜出炉。 很奇怪阿里云的认证ID和ACE ID是什么关系,是以后ACE ID不变,证书编号自增么? 面试是阿里云ACE认证的最后一关,也是最难的的一关。这里就结合我的经历给大家提供一个思路,希望能够给大家提供一个微薄的助力。 简介 学习最需要的,不是悲壮的毅力,而是对无限未知的渴求 我也算是一个IT老兵了。2004年从大学毕业以后,在北京多个院校和企业从事IT运维工作,先后经历了行政管理、桌面运维、系统建设、私有云实施、IDC机房维护、公有云资产管理等多个工种和多个方向的业务,持有MCSE、HCIE、RHCA、PMP、CISP、ITIL等多个证书。当然,现在也有一个阿里云的ACE证书。 基于提高公有云知识水平的目的,我最早参加阿里云的考试是在2021年,先后完成了阿里云的ACA、ACP(云和安全两个方向)以及老版本的ACE。随着阿里云ACE认证体系的进化和个人对解决方案架构的兴趣增加,我决定对ACE证书进行再认证,又参加了新版的ACE认证考试。 ACE考试分为三个阶段:理论、实验和面试。由于我是老版证书有效期内,所以免了理论部分的考试。实验部分主...
杭州半日游
过来杭州阿里云参加ACE考试的最后一门面试,正好天气不错,顺带在西湖周边走走。 阿里云谷园区 岳王庙 西湖印象
Nginx使用入门
2023.05 摄于河南开封·清明上河园 HTTP协议概述 超文本:超链接和各种多媒体元素标记的文本,彼此链接形成web 超文本标记语言:HTML URI:URL URN HTTP协议:将超文本从一台主机传输到另一台主机的应用层协议 工作原理请求/响应交互模型 浏览器分析URL 请求DNS解析 DNS将IP地址返回浏览器 浏览器与服务器建立TCP连接 浏览器请求文档:get 服务器发出响应 释放TCP连接 HTTP方法 序号 方法 描述 1 GET 请求指定的页面信息,并返回实体主体 2 HEAD 类似GET,返回信息中只有报头 3 POST 向指定资源提交数据进行处理请求,例如上传文件、提交表单 4 PUT 从客户端向服务器传送的数据取代指定的文档内容 5 DELETE 请求服务器删除指定页面 6 CONNECT 预留给能够将连接改为管道方式的代理服务器 7 OPTIONS 允许客户端查看服务器的性能 8 TRACE 回显服务器收到的请求,主要用于测试或诊断 9 PATCH 对PUT方法的补充,用来对已知资源进行局部...
「解决方案架构师修炼之道」
解决方案架构从战略和战术的视角,对业务解决方案的方方面面进行定义和展望,它涵盖了系统的方方面面,包括但不限于系统基础设施、网络、安全、合规性要求、系统运维、成本和可靠性。 定义需要解决的问题 全球性分布式团队 全球合规性要求 成本和预算 解决方案实施组件 业务需求 IT基础设施需求 技术选型 终端用户需求 解决方案维护 项目时间表 演进 胖桌面 面向服务的架构 微服务架构 益处 满足业务需求和交付质量 选择最佳技术平台 处理解决方案的约束和问题 协助资源和成本管理 管理解决方案交付和项目生命周期 解决非功能性需求 组织中的解决方案架构师解决方案架构师的角色类型 企业解决方案架构师 技术架构师 云架构师 基础设施架构师 网络架构师 数据架构师 安全架构师 DevOps架构师 职责 分析用户的需求:方案设计的核心 定义非功能性需求 性能 安全性与合规性 可恢复性 可维护性 可靠性 可用性 可伸缩性 易用性 干系人的管理 处理架构约束 成本 质量 时间 范围 技术 风险 资源 合规性 技术选型 概念验证和原型开发 设计方案和持续交付 业务需求和愿景 ...
「阿里云运维架构实践秘籍」
云计算只是一个概念,阿里云则是云计算的落地实现。云计算是面向广大用户的,对应的是一个分布式云管控平台,具有稳定性、可弹性扩展、安全性、低成本、易用性等有点。从技术角度看,云平台是虚拟化、分布式、自动化的综合类平台。 云端选型云产品云计算带来的运维变革 人工阶段:人工完成运维 脚本及工具阶段:对于重复的事情通过脚本和工具完成 平台化阶段:用平台界面智能化操作完成日常操作 智能化阶段:自动扩容、故障自愈、AIOps 云计算带来的技术架构变革 单机架构阶段:IOE架构 集群架构阶段:采用虚拟的VIP技术 分布式架构阶段 微服务架构阶段 软件技术选型 硬件相关,嵌入式相关,C/C++ Java/C# 胶水语言:Python 快速构建语言:PHP 高并发语言:go 前后端语言:Javascript/Node.js 系统技术选型云端网络的选型策略 网段 网卡 网络隔离 网络功能 网络实践 入网请求选型的方法 SLB网络 公网IP 弹性EIP DNAT 出网请求选型的方法 公网IP 弹性EIP SNAT WEB服务器选型考虑 稳定性 性能 对负载均衡...
两步构建本地GPT
从chatgpt掀起的ai浪潮真实发展迅猛,从去年年底ChatGpt 3.5发布时候的万人空巷,到现在随便找个机器就能像模像样的跑一个mini版出来。真是令人感叹。 2023.05 摄于河北遵化·清东陵·裕陵 背景大模型是指具有大量参数的深度学习或机器学习模型,这些参数可以通过训练过程自动调整以捕获输入数据中的复杂关系。这类模型通常具有较深的网络结构和较多的神经元,以增加模型的表示能力和学习能力。大模型在诸如自然语言处理、计算机视觉和语音识别等领域取得了显著的成果。 大模型使用了许多高级技术,主要包括以下几个方面: 深度神经网络(Deep Neural Networks,DNNs) 卷积神经网络(Convolutional Neural Networks,CNNs) 循环神经网络(Recurrent Neural Networks,RNNs)和长短时记忆网络(Long Short-Term Memory,LSTM) Transformer 架构 预训练与微调(Pretraining and Fine-tuning) 分布式训练(Distributed Training)...






