模板网站多少钱一个,哈尔滨模板建站品牌,怎样做自己的小说网站,虚拟主机如何建设多个网站简介#xff1a; 封神-核心功能 | 钉钉告警数据网关1. 开发背景 1.1 用户痛点 ①租户侧运维能力弱 问题#xff1a;租户侧#xff0c;客户没有有效途径#xff0c;及时地获取实例级的状态、性能、容量的数据。 现状#xff1a;每日固定时间#xff0c;驻场需要人肉收集数…简介 封神-核心功能 | 钉钉告警数据网关1. 开发背景 1.1 用户痛点 ①租户侧运维能力弱 问题租户侧客户没有有效途径及时地获取实例级的状态、性能、容量的数据。 现状每日固定时间驻场需要人肉收集数据钉钉定时推送给客户。 ②问题排查效率低 问题应用业务有问题云平台产品正常客户并不认可需要帮助客户解决问题。 现状发现应用实例出现性能、容量被打满的问题这个排查过程往往冗长 效率很低。 ③监控能力缺失 问题云平台监控不全容量管理、性能管理等报表能力缺失。 现状驻场需要通过大量人肉巡检或者编写脚本。 ④监控 方式时效性低 问题业务侧总会优先于应用与云平台感知到故障运维非常被动 。 现状客户发现问题通知应用应用检查后再溯源到云平台排查链路串行并且低效。 1.2 解决方案 ①保障业务稳定 通过云产品的服务能力的变化情况及业务仿真模型的建立提前预知客户业务健康度低于基线后便会触发告警。 ②SLA化展示 触发阈值自动报警量化产品健康状况。 2. 开发设计 2.1 系统架构 图1系统架构图 封神系统架构如图1所示分为CLIENT与SERVER端两大模块。 CLINET端部署在经典网铜雀容器内通过定时任务控制去采集云内各产品数据。SERVER端部署在VPC内ECS上系统框架为FLASK分为数据处理与数据存储两大部分。 ①数据处理是指通过提供API接受CLIENT的数据并进行入库操作以及数据的前端展示。 ②数据存储是指借助阿里云RDS数据库对数据进行持久化操作作。 2.2 业务架构 图2业务架构图 封神业务架构如如2所示分为五大板块。 姜子牙租户侧告警主要包括ECS、RDS等云产品实例性能以及业务相关告警。申公豹运维侧告警主要包括云产品健康状态、水位容量等相关告警。雷震子硬件告警主要包括坏盘物理机带外等告警。比 干安全告警主要来自云盾相关安全类告警。杨 戬故障告警主要对各产品数据进行SLA算法处理设置P0,P1等级故障阈值。3. 钉钉告警 3.1 告警分类 机器人创建方式可参考文后资料[1]了解详情。 姜子牙 申公豹 雷震子 比 干 杨 戬 3.2 告警展示 图3姜子牙 图4申公豹 图5雷震子 图6比干 图7杨戬-1 图7杨戬-2 图7杨戬-3 图7杨戬-4 4. 数据网关 数据网关分为两大模块获取数据、接收数据。 获取数据分为告警数据、全量数据、性能数据。 ①告警数据分别对应钉钉机器人推送的告警信息封装成相应的数据格式以API接口形式对外提供数据。 ②全量数据数据库源表数据不做任何加工处理以API接口形式对外提供数据可操作性较高。 ③性能数据产品性能数据会定期存储到时序数据库存储时间长可查询历史性能数据。 接收数据提供对外API接收客户自定义监控数据封装成MARKDOWN格式实时进行钉钉告警。4.1 获取数据 4.1.1 告警数据 4.1.1.1 请求接口 请求方式POST请求 URL地址 http://{ip}:{port}/api/v1/search/monitor ip:封神ecs_ip port:9170 PARAM参数列表可查看文后资料[2]了解详情。 4.1.1.2 DEMO import sys
import requests
url http://{ip}:{port}/api/v1/search/monitor/
data {product:MQ, title:积压告警, stime:2020-01-04 00:00:00, etime:2020-01-04 00:01:00}
res requests.post(urlurl, jsondata)
print res.content curl -H Content-Type:application/json
-X POST -d {type:ALL} http://{ip}:{port}/api/v1/search/monitor/ 4.1.1.3 数据返回 ①当前存在告警 {code:0, data:[{info:0.0.0.0,ecs,95% \n 0.0.0.1,ecs,95% , product:ECS, title:性能告警, level:告警, robot:姜子牙, monitor_time:2020-01-14 00:00:00, columns:IP,产品,值}]} ②当前未存在告警数据(告警恢复正常) {code:0, data:[{info:, product:ECS, title:性能告警, level:告警, robot:姜子牙, monitor_time:2020-01-14 00:00:00, columns:IP,产品,值}]} ③未查询到数据 {code:0, data:[]} ④查询异常 {code:500, data:异常信息} 4.1.2 全量数据 4.1.2.1 请求接口 请求方式POST请求 URL地址 http://{ip}:{port}/api/v1/search/data/ ip:封神ecs_ip port:9170 PARAM参数列表可查看文后资料[2]了解详情。 4.1.2.2 DEMO import sys
import requests
url http://{ip}:{port}/api/v1/search/data/
data {product:MQ, title:TIME, stime:2020-01-04 00:00:00, etime:2020-01-04 00:01:00}
res requests.post(urlurl, jsondata)
print res.content 4.1.2.3 数据返回 4.1.3 性能数据 4.1.3.1 请求接口 请求方式POST请求 URL地址 http://{ip}:{port}/api/v1/influxdb_query/ ip:封神ecs_ip port:9170 PARAM参数为INFLUXDB SQL 4.1.3.2 DEMO import sys
import requests
url http://{ip}:{port}/api/v1/influxdb_query/
data {sql:infudb sql}
res requests.post(url, data)
print res.content 4.1.3.3 数据返回 4.2 接收数据 4.2.1 请求接口 请求方式POST请求 URL地址http://{ip}:{port}/api/v1/insert/third ip:封神ecs_ip port:9170 PARAM 4.2.2 DEMO import sys
import requests
url http://172.0.0.1:9170/api/v1/insert/third/
data {title:ecs性能监控, level:预警, source:云监控, product:ecs, msg:ip:10.0.0.1 cpu:98% ip:127.0.0.1 mem:99%, robot:姜子牙, submitor:高德臣, monitor_time:2021-03-10 16:00:00, details:兄弟 关注下}
res requests.post(urlurl, jsondata)
print res.text 4.2.3 告警展示 图8告警展示图 参考文章 [1] 封神榜部署前置检查https://yuque.antfin-inc.com/docs/share/d3a743db-af85-47d2-89c5-4f22eb1693c5? [2] 获取封神数据-三方APIhttps://yuque.antfin-inc.com/docs/share/2037fbb2-35fa-42ad-8476-ec7502e9ed33?# 原文链接 本文为阿里云原创内容未经允许不得转载。