批量网站建设,网站的开发与建设,河北邯郸封闭最新消息,三大电商平台目录 一、秒杀系统的架构二、SpringCloud Alibaba-Sentinel简介1、熔断降级限流什么是熔断什么是降级异同#xff1a;什么是限流 2、Sentinel 简介官方文档#xff1a;Sentinel 具有以下特征:Sentinel 分为两个部分: 3、Hystrix 与 Sentinel 比较4、整合 FeignSentinel 测试熔… 目录 一、秒杀系统的架构二、SpringCloud Alibaba-Sentinel简介1、熔断降级限流什么是熔断什么是降级异同什么是限流 2、Sentinel 简介官方文档Sentinel 具有以下特征:Sentinel 分为两个部分: 3、Hystrix 与 Sentinel 比较4、整合 FeignSentinel 测试熔断降级Sentinel 和 Hystrix 的原则是一致的:熔断降级设计理念Sentinel 对这个问题采取了两种手段:1、引入依赖2、使用 Nacos 注册中心3、定义 fallback 实现4、定义 fallbackfactory 并放在容器中5、改造 fallback 类接受异常并实现容错方法6、远程接口配置 feign 客户端容错7、开启 sentinel 代理 feign 功能在 application.properties 中配置8、测试降级效果 5、整合 Sentinel 测试限流流量控制什么是流量控制流量控制设计理念1、引入 Sentinel starter2、接入限流埋点3、配置限流规则1、下载控制台2、启动控制台3、启动应用并配置4、控制台配置限流规则并验证5、自定义流控响应6、持久化流控规则 三、项目引用1、下载sentinel,并启动2、自定义流控响应3、全服务引入4、流控模式效果5、熔断降级6、自定义受保护资源7、网关限流8、定制网关流控返回 四、SleuthZipkin链路追踪1、为什么用2、基本术语3、整合 Sleuth1、服务提供者与消费者导入依赖2、打开 debug 日志3、发起一次远程调用观察控制台 4、整合 zipkin 可视化观察1、docker 安装 zipkin 服务器2、导入3、添加 zipkin 相关配置 5、Zipkin 数据持久化 一、秒杀系统的架构 二、SpringCloud Alibaba-Sentinel简介
1、熔断降级限流
什么是熔断
A 服务调用 B 服务的某个功能由于网络不稳定问题或者 B 服务卡机导致功能时间超长。如果这样子的次数太多。我们就可以直接将 B 断路了A 不再请求 B 接口凡是调用 B 的直接返回降级数据不必等待 B 的超长执行。 这样 B 的故障问题就不会级联影响到 A。
什么是降级
整个网站处于流量高峰期服务器压力剧增根据当前业务情况及流量对一些服务和页面进行有策略的降级[停止服务所有的调用直接返回降级数据]。以此缓解服务器资源的压力以保证核心业务的正常运行同时也保持了客户和大部分客户的得到正确的相应。
异同
相同点 1、为了保证集群大部分服务的可用性和可靠性防止崩溃牺牲小我 2、用户最终都是体验到某个功能不可用 不同点 1、熔断是被调用方故障触发的系统主动规则 2、降级是基于全局考虑停止一些正常服务释放资源
什么是限流
对打入服务的请求流量进行控制使服务能够承担不超过自己能力的流量压力
2、Sentinel 简介
官方文档
https://github.com/alibaba/Sentinel/wiki/%E4%BB%8B%E7%BB%8D 项目地址https://github.com/alibaba/Sentinel 随着微服务的流行服务和服务之间的稳定性变得越来越重要。Sentinel 以流量为切入点从流量控制、熔断降级、系统负载保护等多个维度保护服务的稳定性。 默认用户名和密码都是sentinel
Sentinel 具有以下特征:
丰富的应用场景Sentinel 承接了阿里巴巴近 10 年的双十一大促流量的核心场景例如秒杀即突发流量控制在系统容量可以承受的范围、消息削峰填谷、集群流量控制、实时熔断下游不可用应用等。
完备的实时监控Sentinel 同时提供实时的监控功能。您可以在控制台中看到接入应用的单台机器秒级数据甚至 500 台以下规模的集群的汇总运行情况。
广泛的开源生态Sentinel 提供开箱即用的与其它开源框架/库的整合模块例如与 Spring Cloud、Dubbo、gRPC 的整合。您只需要引入相应的依赖并进行简单的配置即可快速地接入 Sentinel。
完善的 SPI 扩展点Sentinel 提供简单易用、完善的 SPI 扩展接口。您可以通过实现扩展接口来快速地定制逻辑。例如定制规则管理、适配动态数据源等。 Sentinel 分为两个部分:
核心库Java 客户端不依赖任何框架/库能够运行于所有 Java 运行时环境同时对 Dubbo / Spring Cloud 等框架也有较好的支持。
控制台Dashboard基于 Spring Boot 开发打包后可以直接运行不需要额外的Tomcat 等应用容器。
Sentinel 基本概念 资源 资源是 Sentinel 的关键概念。它可以是 Java 应用程序中的任何内容例如由应用程序提供的服务或由应用程序调用的其它应用提供的服务甚至可以是一段代码。在接下来的文档中我们都会用资源来描述代码块。
只要通过 Sentinel API 定义的代码就是资源能够被 Sentinel 保护起来。大部分情况下可以使用方法签名URL甚至服务名称作为资源名来标示资源。
规则 围绕资源的实时状态设定的规则可以包括流量控制规则、熔断降级规则以及系统保护规则。所有规则可以动态实时调整。
3、Hystrix 与 Sentinel 比较 4、整合 FeignSentinel 测试熔断降级
https://github.com/alibaba/Sentinel/wiki/%E4%B8%BB%E9%A1%B5 什么是熔断降级除了流量控制以外降低调用链路中的不稳定资源也是 Sentinel 的使命之一。由于调用关系的复杂性如果调用链路中的某个资源出现了不稳定最终会导致请求发生堆积。 Sentinel 和 Hystrix 的原则是一致的:
当检测到调用链路中某个资源出现不稳定的表现例如请求响应时间长或异常比例升高的时候则对这个资源的调用进行限制让请求快速失败避免影响到其它的资源而导致级联故障。
熔断降级设计理念
在限制的手段上Sentinel 和 Hystrix 采取了完全不一样的方法。 Hystrix 通过 线程池隔离 的方式来对依赖在 Sentinel 的概念中对应 资源进行了隔离。这样做的好处是资源和资源之间做到了最彻底的隔离。缺点是除了增加了线程切换的成本过多的线程池导致线程数目过多还需要预先给各个资源做线程池大小的分配。
Sentinel 对这个问题采取了两种手段:
通过并发线程数进行限制 和资源池隔离的方法不同Sentinel 通过限制资源并发线程的数量来减少不稳定资源对其它资源的影响。这样不但没有线程切换的损耗也不需要您预先分配线程池的大小。当某个资源出现不稳定的情况下例如响应时间变长对资源的直接影响就是会造成线程数的逐步 堆积。当线程数在特定资源上堆积到一定的数量之后对该资源的新请求就会被拒绝。堆积的线程完成任务后才开始继续接收请求。
通过响应时间对资源进行降级 除了对并发线程数进行控制以外Sentinel 还可以通过响应时间来快速降级不稳定的资源。当依赖的资源出现响应时间过长后所有对该资源的访问都会被直接拒绝直到过了指定的时间窗口之后才重新恢复。 整合测试 https://github.com/alibaba/spring-cloud-alibaba/blob/master/spring-cloud-alibaba-examples/sentinel-example/sentinel-feign-example/readme-zh.md
1、引入依赖
dependency
groupIdorg.springframework.cloud/groupId
artifactIdspring-cloud-starter-openfeign/artifactId
/dependency
dependency
groupIdcom.alibaba.cloud/groupId
artifactIdspring-cloud-starter-alibaba-sentinel/artifactId
/dependency2、使用 Nacos 注册中心
dependency
groupIdcom.alibaba.cloud/groupId
artifactIdspring-cloud-starter-alibaba-nacos-discovery/artifactId
/dependency3、定义 fallback 实现
在服务消费者中实现 feign 远程接口接口的实现方法即为调用错误的容错方法
public class OrderFeignServiceFallBack implements OrderFeignService {
Override
public RespOrderVo getOrderInfo(String orderSn) {
return null;
}
}4、定义 fallbackfactory 并放在容器中
Component
public class OrderFeignFallbackFactory implements
FallbackFactoryOrderFeignServiceFallBack {
Override
public OrderFeignServiceFallBack create(Throwable throwable) {
return new OrderFeignServiceFallBack(throwable);
}
}5、改造 fallback 类接受异常并实现容错方法
public class OrderFeignServiceFallBack implements OrderFeignService {
private Throwable throwable;
public OrderFeignServiceFallBack(Throwable throwable){
this.throwable throwable;
}
Override
public RespOrderVo getOrderInfo(String orderSn) {
return Resp.fail(new OrderVo());
}
}6、远程接口配置 feign 客户端容错
FeignClient(value gulimall-oms,fallbackFactory
OrderFeignFallbackFactory.class)
public interface OrderFeignService {
GetMapping(/oms/order/bysn/{orderSn})
public RespOrderVo getOrderInfo(PathVariable(orderSn) String
orderSn);
}7、开启 sentinel 代理 feign 功能在 application.properties 中配置
feign.sentinel.enabledtrue测试熔断效果。当远程服务出现问题会自动调用回调方法返回默认数据并且更快的容错方式 1、使用SentinelResource并定义 fallback
SentinelResource(value order,fallback e)Fallback 和原方法签名一致但是最多多一个 Throwable 类型的变量接受异常。 https://github.com/alibaba/Sentinel/wiki/%E6%B3%A8%E8%A7%A3%E6%94%AF%E6%8C%81 需要给容器中配置注解切面
Bean
public SentinelResourceAspect sentinelResourceAspect() {
return new SentinelResourceAspect();
}在控制台添加降级策略 8、测试降级效果
当远程服务停止前几个服务会尝试调用远程服务满足降级策略条件以后则不会再尝试调用远程服务
5、整合 Sentinel 测试限流流量控制
https://github.com/alibaba/spring-cloud-alibaba/blob/master/spring-cloud-alibaba-examples/sentinel-example/sentinel-core-example/readme-zh.md
什么是流量控制
流量控制在网络传输中是一个常用的概念它用于调整网络包的发送数据。然而从系统稳定性角度考虑在处理请求的速度上也有非常多的讲究。任意时间到来的请求往往是随机不可控的而系统的处理能力是有限的。我们需要根据系统的处理能力对流量进行控制。Sentinel 作为一个调配器可以根据需要把随机的请求调整成合适的形状如下图所示 流量控制设计理念
流量控制有以下几个角度: 资源的调用关系例如资源的调用链路资源和资源之间的关系 运行指标例如 QPS、线程池、系统负载等 控制的效果例如直接限流、冷启动、排队等。 Sentinel 的设计理念是让您自由选择控制的角度并进行灵活组合从而达到想要的效果。
1、引入 Sentinel starter
dependency
groupIdcom.alibaba.cloud/groupId
artifactIdspring-cloud-starter-alibaba-sentinel/artifactId
/dependency2、接入限流埋点
HTTP 埋点 Sentinel starter 默认为所有的 HTTP 服务提供了限流埋点如果只想对 HTTP 服务进行限流那么只需要引入依赖无需修改代码。 自定义埋点 如果需要对某个特定的方法进行限流或降级可以通过 SentinelResource 注解来完成限流 的埋点示例代码如下
SentinelResource(resource)
public String hello() {
return Hello;
}当 然 也 可 以 通 过 原 始 的 SphU.entry(xxx) 方 法 进 行 埋 点 可 以 参 见 Sentinel 文 档 https://github.com/alibaba/Sentinel/wiki/%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8#%E5%AE%9A%E4%B9%89%E8%B5%84%E6%BA%90。
3、配置限流规则
Sentinel 提供了两种配置限流规则的方式代码配置 和 控制台配置。
通过代码来实现限流规则的配置。一个简单的限流规则配置示例代码如下更多限流规
则配置详情请参考 Sentinel 文档。https://github.com/alibaba/Sentinel/wiki/%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8
#%E5%AE%9A%E4%B9%89%E8%A7%84%E5%88%99
ListFlowRule rules new ArrayListFlowRule();
FlowRule rule new FlowRule();
rule.setResource(str);
// set limit qps to 10
rule.setCount(10);
rule.setGrade(RuleConstant.FLOW_GRADE_QPS);
rule.setLimitApp(default);
rules.add(rule);
FlowRuleManager.loadRules(rules);
通过控制台进行限流规则配置1、下载控制台
http://edas-public.oss-cn-hangzhou.aliyuncs.com/install_package/demo/sentinel-dashboard.jar
2、启动控制台
执行 Java 命令 java -jar sentinel-dashboard.jar 完成 Sentinel 控制台的启动。 控制台默认的监听端口为 8080。
3、启动应用并配置
增加配置在应用的 /src/main/resources/application.properties 中添加基本配置信息 spring.application.namesentinel-example server.port18083 spring.cloud.sentinel.transport.dashboardlocalhost:8080
4、控制台配置限流规则并验证
访问 http://localhost:8080 页面。
如果您在控制台没有找到应用请调用一下进行了 Sentinel 埋点的 URL 或方法因为Sentinel 使用了 lazy load 策略。 任意发送请求可以在簇点链路里面看到刚才的请求可以对请求进行流控 测试流控效果
5、自定义流控响应 6、持久化流控规则
默认的流控规则是保存在项目的内存中项目停止再启动流控规则就是失效。我们可以持久化保存规则 https://github.com/alibaba/Sentinel/wiki/%E5%8A%A8%E6%80%81%E8%A7%84%E5%88%99%E 6%89%A9%E5%B1%95#datasource-%E6%89%A9%E5%B1%95 生产环境使用模式 我 们 推 荐 通 过 控 制 台 设 置 规 则 后 将 规 则 推 送 到 统 一 的 规 则 中 心 客 户 端 实 现ReadableDataSource 接口端监听规则中心实时获取变更 解决方案 DataSource 扩展常见的实现方式有: 拉模式客户端主动向某个规则管理中心定期轮询拉取规则这个规则中心可以是RDBMS、文件甚至是 VCS 等。这样做的方式是简单缺点是无法及时获取变更 推模式规则中心统一推送客户端通过注册监听器的方式时刻监听变化比如使用Nacos、Zookeeper 等配置中心。这种方式有更好的实时性和一致性保证。
推荐模式使用 Nacos 配置规则 1、引入依赖
dependency
groupIdcom.alibaba.csp/groupId
artifactIdsentinel-datasource-nacos/artifactId
version1.6.3/version
/dependency2、编写配置类 https://github.com/alibaba/Sentinel/wiki/%E5%8A%A8%E6%80%81%E8%A7%84%E5%88%99%E 6%89%A9%E5%B1%95#%E6%8E%A8%E6%A8%A1%E5%BC%8F%E4%BD%BF%E7%94%A8-nacos- %E9%85%8D%E7%BD%AE%E8%A7%84%E5%88%99
Configuration
public class SentinelConfig {
public SentinelConfig(){
//1、加载流控策略
ReadableDataSourceString, ListFlowRule flowRuleDataSource new
NacosDataSource(127.0.0.1:8848, demo, sentinel,
source - JSON.parseObject(source, new
TypeReferenceListFlowRule() {}));
FlowRuleManager.register2Property(flowRuleDataSource.getProperty());
//2、加载降级策略
ReadableDataSourceString, ListDegradeRule degradeRuleDataSource
new NacosDataSource(127.0.0.1:8848, demo, sentinel,
source - JSON.parseObject(source, new
TypeReferenceListDegradeRule() {}));
DegradeRuleManager.register2Property(degradeRuleDataSource.getProperty());
//3、加载系统规则
ReadableDataSourceString, ListSystemRule systemRuleDataSource
new NacosDataSource(127.0.0.1:8848, demo, sentinel,
source - JSON.parseObject(source, new
TypeReferenceListSystemRule() {}));
SystemRuleManager.register2Property(systemRuleDataSource.getProperty());
//4、加载权限策略
ReadableDataSourceString, ListAuthorityRule
authorityRuleDataSource new NacosDataSource(127.0.0.1:8848, demo,
sentinel,
source - JSON.parseObject(source, new
TypeReferenceListAuthorityRule() {}));
AuthorityRuleManager.register2Property(authorityRuleDataSource.getProperty(
));
}
}参照 https://github.com/alibaba/Sentinel/wiki/Dynamic-Rule-Configuration 查看更多控制规则 3、在 nacos 中创建 dataId并使用 json 格式 4、添加一条流控规则测试
[
{ resource: /ums/member/list, limitApp: default, grade: 1, count: 5, strategy: 0, controlBehavior: 0, clusterMode: false
}
]配置含义说明 https://github.com/alibaba/Sentinel/wiki/%E6%B5%81%E9%87%8F%E6%8E%A7%E5%88%B6 resource资源名即限流规则的作用对象 count: 限流阈值 grade: 限流阈值类型QPS 或并发线程数 limitApp: 流控针对的调用来源若为 default 则不区分调用来源 strategy: 调用关系限流策略 controlBehavior: 流量控制效果直接拒绝、Warm Up、匀速排队 5、系统规则降级规则等均可添加
[
{ resource: /ums/member/list, limitApp: default, grade: 1, count: 5, strategy: 0, controlBehavior: 0, clusterMode: false
},{ highestSystemLoad: -1, highestCpuUsage: 0.99, qps: 2, avgRt: 10, maxThread: 10
}
]6、最终效果 Sentinel 控制台改变流控规则不能推送到 nacos 中Nacos 中改变流控规则可以实时观察到变化
第 2 步 API 的方式可以直接变为配置方式在 application.properties 中配置
spring.cloud.sentinel.datasource.ds.nacos.server-addr127.0.0.
1:8848
spring.cloud.sentinel.datasource.ds.nacos.data-idsentinel
spring.cloud.sentinel.datasource.ds.nacos.group-iddemo
spring.cloud.sentinel.datasource.ds.nacos.rule-typeflow
spring.cloud.sentinel.datasource.ds1.nacos.server-addr127.0.0
.1:8848
spring.cloud.sentinel.datasource.ds1.nacos.data-idsentinel
spring.cloud.sentinel.datasource.ds1.nacos.group-iddemo
spring.cloud.sentinel.datasource.ds1.nacos.rule-typesystem
ds,ds1 是随便写的。三、项目引用
1、下载sentinel,并启动 默认用户名和密码都是sentinel
2、自定义流控响应
3、全服务引入
4、流控模式效果
5、熔断降级
6、自定义受保护资源
7、网关限流
8、定制网关流控返回
四、SleuthZipkin链路追踪
1、为什么用
微服务架构是一个分布式架构它按业务划分服务单元一个分布式系统往往有很多个服务单元。由于服务单元数量众多业务的复杂性如果出现了错误和异常很难去定位。主要体现在一个请求可能需要调用很多个服务而内部服务的调用复杂性决定了问题难以 定位。所以微服务架构中必须实现分布式链路追踪去跟进一个请求到底有哪些服务参与参与的顺序又是怎样的从而达到每个请求的步骤清晰可见出了问题很快定位。
链路追踪组件有 Google 的 DapperTwitter 的 Zipkin以及阿里的 Eagleeye 鹰眼等它们都是非常优秀的链路追踪开源组件。
2、基本术语
Span跨度基本工作单元发送一个远程调度任务 就会产生一个 SpanSpan 是一个 64 位 ID 唯一标识的Trace 是用另一个 64 位 ID 唯一标识的Span 还有其他数据信息比如摘要、时间戳事件、Span 的 ID、以及进度 ID。
Trace跟踪一系列 Span 组成的一个树状结构。请求一个微服务系统的 API 接口这个 API 接口需要调用多个微服务调用每个微服务都会产生一个新的 Span所有由这个请求产生的 Span 组成了这个 Trace。
Annotation标注用来及时记录一个事件的一些核心注解用来定义一个请求的开始和结束 。这些注解包括以下
cs - Client Sent -客户端发送一个请求这个注解描述了这个 Span 的开始
sr - Server Received -服务端获得请求并准备开始处理它如果将其 sr 减去 cs 时间戳便可得到网络传输的时间。
ss - Server Sent 服务端发送响应–该注解表明请求处理的完成(当请求返回客户端)如果 ss 的时间戳减去 sr 时间戳就可以得到服务器请求的时间。
cr - Client Received 客户端接收响应-此时 Span 的结束如果 cr 的时间戳减去cs 时间戳便可以得到整个请求所消耗的时间。 官方文档 https://cloud.spring.io/spring-cloud-static/spring-cloud-sleuth/2.1.3.RELEASE/single/spring-cloud-sleuth.html 如果服务调用顺序如下 那么用以上概念完整的表示出来如下 Span 之间的父子关系如下
3、整合 Sleuth
1、服务提供者与消费者导入依赖
dependency
groupIdorg.springframework.cloud/groupId
artifactIdspring-cloud-starter-sleuth/artifactId
/dependency2、打开 debug 日志
logging:
level:
org.springframework.cloud.openfeign: debug
org.springframework.cloud.sleuth: debug3、发起一次远程调用观察控制台
DEBUG [user-service,541450f08573fff5,541450f08573fff5,false] user-service服务名 541450f08573fff5是 TranceId一条链路中只有一个 TranceId 541450f08573fff5是 spanId链路中的基本工作单元 id false表示是否将数据输出到其他服务true 则会把信息输出到其他可视化的服务上观察
4、整合 zipkin 可视化观察
通过 Sleuth 产生的调用链监控信息可以得知微服务之间的调用链路但监控信息只输出到控制台不方便查看。我们需要一个图形化的工具-zipkin。Zipkin 是 Twitter 开源的分布式跟踪系统主要用来收集系统的时序数据从而追踪系统的调用问题。zipkin 官网地址如下 https://zipkin.io/ 1、docker 安装 zipkin 服务器
docker run -d -p 9411:9411 openzipkin/zipkin
2、导入
dependency
groupIdorg.springframework.cloud/groupId
artifactIdspring-cloud-starter-zipkin/artifactId
/dependencyzipkin 依赖也同时包含了 sleuth可以省略 sleuth 的引用
3、添加 zipkin 相关配置
spring:
application:
name: user-service
zipkin:
base-url: http://192.168.56.10:9411/ # zipkin 服务器的地址
#关闭服务发现否则 Spring Cloud 会把 zipkin 的 url 当做服务名称
discoveryClientEnabled: false
sender:
type: web # 设置使用 http 的方式传输数据
sleuth:
sampler:
probability: 1 # 设置抽样采集率为 100%默认为 0.1即 10%发送远程请求测试 zipkin。
服务调用链追踪信息统计 服务依赖信息统计 5、Zipkin 数据持久化
Zipkin 默认是将监控数据存储在内存的如果 Zipkin 挂掉或重启的话那么监控数据就会丢失。所以如果想要搭建生产可用的 Zipkin就需要实现监控数据的持久化。而想要实现数据持久化自然就是得将数据存储至数据库。好在 Zipkin 支持将数据存储至 内存默认 MySQL Elasticsearch Cassandra Zipkin 数据持久化相关的官方文档地址如下 https://github.com/openzipkin/zipkin#storage-component
Zipkin 支持的这几种存储方式中内存显然是不适用于生产的这一点开始也说了。而使用MySQL 的话当数据量大时查询较为缓慢也不建议使用。Twitter 官方使用的是 Cassandra作为 Zipkin 的存储数据库但国内大规模用 Cassandra 的公司较少而且 Cassandra 相关文档也不多。 综上故采用 Elasticsearch 是个比较好的选择关于使用 Elasticsearch 作为 Zipkin 的存储数 据库的官方文档如下 elasticsearch-storage https://github.com/openzipkin/zipkin/tree/master/zipkin-server#elasticsearch-storage
zipkin-storage/elasticsearch
https://github.com/openzipkin/zipkin/tree/master/zipkin-storage/elasticsearch 通过 docker 的方式
docker run --env STORAGE_TYPEelasticsearch --env ES_HOSTS192.168.56.10:9200
openzipkin/zipkin-dependencies使用 es 时 Zipkin Dependencies 支持的环境变量