请转移到 运维自动化平台2.0
操作WEB化,部署自动化,监控自动化
操作WEB化:
以WEB的形式批量下发任务,部署服务。批量执行,集中展示;
无需SSH到服务器,减少人为操作故障;
权限控制,如普通用户只可以操作某些模块功能;
操作可以追溯,某人什么时候执行了什么操作,记录一目了然;
部署自动化:
最早是ssh到目标机器上=>下载部署包=>拷贝到指定位置=>重启服务
shell/python脚本自动部署,效率低不易维护
使用自动化工具saltstack/ansible/Puppe来部署,效率高易维护
私有云Cloud,Container部署image
监控自动化:
集中监控报警/展示,故障恢复自动化,即故障自愈
如监控可疑IP登录主机报警,可自动踢出用户登录来恢复
任何一个企业运行都有很多配套的公司流程标准,否则很多事情将一团乱麻,根本无法推行;
运维自动化也不例外,实施自动化的前提需要标准规范与流程规范化。
比如如果系统版本,主机名,IP不统一规范,则可能导致satlstack部署执行,zabbix自动化发现,日志监控部署,应用部署等一些列问题。
随着业务规模逐渐增大,运维环境会越来越庞大复杂,这些将驱动使运维工作需要科学规范化的管理。这要求我们用较少的人力、物力资源做更多的工作,必须高效、准确执行任务。
从运维大环境来开,运维IT综合管理已成为主流运维管理发展方向,运维+开发成为运维发展的大趋势。我们不再局限地依靠某个监控产品或部署工具,而是需要运维自动化,提供体系化运维解决方案,包括监控管理、日志管理、备份管理、CMDB资产信息管理、知识库管理、乃至ITSM信息服务流程管理等。
- 开发语言: Python
- 后端框架: Django
- 前端框架: Bootstrap JQuery
- 消息队列:RabbitMQ
- 数据库:MySQL
- 配置工具:Saltstck
- 登录验证:Google Auth
这里用Django admin管理用户用户组及权限,并且用Google Auth进行二次登录验证,保证登录操作的安全性
云主机概况:这里调用CMDB API简要显示各云平台主机数量 监控报警概况: 调用Zabbix API显示各区域机房报警状况,有报警相应地区会闪烁
区域:全球区,中国区
类型:Mysql,Redis ,Mongodb
游戏:所有业务,指定业务
状态:开启,关闭
功能:修改配置,立即备份,失败重试,近期备份耗时统计,历史备份详情
这里按业务分类显示出所有主机,选中主机即可批量下发命令
后端是通过salt-api把任务通过异步的方式下发到所有minon,然后返回结果入库
所有主机结果一目了然,无需单台主机登录执行,也无需登录salt-server手动执行
付费信息到期提醒,域名到期提醒,SSL证书到期提醒
可自定义到期前多少天报警提醒
域名到底时间调用第三方API获取
IT资源借用记录,做到资源借用可追溯
IT资源借用为归还到期邮件提醒报警,提醒借用人归还物品,减轻IT人员重复性工作
openvpn管理后台,给公司员工开通vpn账号及重置密码
openvpn自助管理,用户可以在这里自己修改自己vpn的密码
Everything is GPL v3.0.