付给招聘网站的费用怎么做分录,坪山网站设计的公司,电子商务网站建设卷子,中山营销网站建设联系方式简介#xff1a;本文主要介绍netflix conductor的基本概念和主要运行机制。 作者 | 夜阳 来源 | 阿里技术公众号
本文主要介绍netflix conductor的基本概念和主要运行机制。
一 简介
netflix conductor是基于JAVA语言编写的开源流程引擎#xff0c;用于架构基于微服务的流…简介本文主要介绍netflix conductor的基本概念和主要运行机制。 作者 | 夜阳 来源 | 阿里技术公众号
本文主要介绍netflix conductor的基本概念和主要运行机制。
一 简介
netflix conductor是基于JAVA语言编写的开源流程引擎用于架构基于微服务的流程。它具备如下特性
允许创建复杂的业务流程流程中每个独立的任务都是由一个微服务所实现。基于JSON DSL 创建工作流对任务的执行进行编排。工作流在执行的过程中可见、可追溯。提供暂停、恢复、重启等多种控制模型。提供一种简单的方式来最大限度重用微服务。拥有扩展到百万流程并发运行的服务能力。通过队列服务实现客户端与服务端的分离。支持 HTTP 或其他RPC协议进行数据传送
二 基本概念
1 Task
Task是最小执行单元承载了一段执行逻辑如发送HTTP请求等。
System Task被conductor服务执行这些任务的执行与引擎在同一个JVM中。Worker Task被worker服务执行执行与引擎隔离开worker通过队列获取任务后执行并更新结果状态到引擎。Worker的实现是跨语言的其使用Http协议与Server通信。
conductor提供了若干内置SystemTask: 功能性Task HTTP发送http请求JSON_JQ_TRANSFORMjq命令执行一般用户json的转换具体可见jq官方文档KAFKA_PUBLISH: 发布kafka消息 流程控制Task SWITCH原Decision条件判断分支类似于代码中的switch caseFORK启动并行分支用于调度并行任务JOIN汇总并行分支用于汇总并行任务DO_WHILE循环类似于代码中的do whileWAIT一直在运行中直到外部时间触发更新节点状态可用于等待外部操作SUB_WORKFLOW子流程执行其他的流程TERMINATE结束流程以指定输出提前结束流程可以与SWITCH节点配合使用类似代码中的提前return语句 自定义Task 对于System TaskConductor提供了WorkflowSystemTask 抽象类可以自定义扩展实现。对于Worker Task可以实现conductor的client Worker接口实现执行逻辑。
2 Workflow
Workflow由一系列需要执行的Task组成conductor采用json来描述Task的流转关系。除基本的顺序流程外借助内置的SWITCH、FORK、JOIN、DO_WIHLE、TERMINATE任务还能实现分支、并行、循环、提前结束等流程控制。
3 InputOutput
Task的输入是一种映射其作为工作流实例化的一部分或某些其他Task的输出。允许将来自工作流或其他Task的输入/输出作为随后执行的Task的输入。
Task有自己的输入和输出输入输出都是jsonobject类型。Task可以引用其他Task的输入输出使用${taskxxx.output}的方式引用。引用语法为json-path除最基础的${taskxxx.output}的值解析方式外还支持其他复杂操作如过滤等具体见json-path语法。启动Workflow时可以传入流程的输入数据Task可以通过${workflow.input}的方式引用。
Task实现原子操作的处理以及流程控制操作Workflow定义描述Task的流转关系Task引用Workflow或者其它Task的输入输出。通过这些机制conductor实现了JSON DSL对流程的描述。
三 整体架构 主要分为几个部分
Orchestrator: 负责流程的流转调度工作Management/Execution Service: 提供流程、任务的管理更新等操作TaskQueues: 任务队列Orchestrator解析出来的待执行Task会放到队列中Worker: 任务执行worker从TaskQueues中获取任务通过Execution Service更新任务状态与结果数据Database: 元数据运行时数据库用于保存运行时的Workflow、Task等状态信息以及流程任务定义的等原信息Index: 索引数据库用于存储执行历史
四 运行模型
1 Task状态转移
SCHEDULED待调度task放到队列中还没有被poll出来执行时的状态IN_PROGRESS执行中被poll出来执行但还没有完成时的状态COMPLETED执行完成FAILED执行失败 CANCELLED被中止时为此状态一般出现在两种情况 手动中止流程时正在运行中的task会被置为此状态多个fork分支当某个分支的task失败时其它分支中正在运行的task会被置为此状态2 任务队列
任务的执行同步的系统任务除外都会先添加到任务队列中是典型的生产者消费者模式。
任务队列是一个带有延迟、优先级功能的队列每种类型的Task是一个单独的队列此外如果配置了domain、isolationGroup还会拆分成多个队列实现执行隔离decider service是生产者其根据流程配置与当前执行情况解析出可执行的task后添加到队列任务执行器(SystemTaskWorker、Worker)是消费者其长轮询对应的队列从队列中获取任务执行
队列接口可插拔conductor提供了Dynomite 、MySQL、PostgreSQL的实现。
3 核心功能实现机制
conductor调度的核心是decider service其根据当前流程运行的状态解析出将要执行的任务列表将任务入队交给worker执行。
decide主要流程简化如下详细代码见WorkflowExecutor.java的decide方法 其中调度任务处理流程简化如下详细代码见WorkflowExecutor.java的scheduleTask方法 decide的触发时机
最主要的触发时机
新启动执行时会触发decide操作系统任务执行完成时会触发decide操作Workder任务通过ExecutionService更新任务状态时会触发decide操作
流程控制节点的实现机制
1Task TaskMapper
对于每一个Task来说都有Task和TaskMapper两部分:
Task任务的执行逻辑代码它的作用是Task的执行TaskMapper任务的映射逻辑代码它通过Task的定义配置、当前实例的执行状态等信息返回实际需要执行的Task列表
对于一般的任务来说TaskMapper返回的是就是Task本身补充一些执行实例的状态信息。但是对于控制节点来说会有不同的逻辑。
2条件分支(SWITCH)的实现机制
SWITCH用于根据条件判断执行不同的分支。
实际上该节点的Task不做任何操作TaskMapper根据分支条件判断出要走的分之后返回对应分支的第一个Task。
SwitchTaskMapper.java getMappedTasks方法关键代码
// 待调度的Task list最终返回结果
ListTask tasksToBeScheduled new LinkedList();
// evalResult是分支条件变量的值(case)
// decisionCases是一个Map结构key为分支的case值value为对应分支的任务定义list分支内的任务定义会有多个
// 根据分支变量的实际值获取对应分支的任务定义list
ListWorkflowTask selectedTasks taskToSchedule.getDecisionCases().get(evalResult);
// default的逻辑如果获取不到对应的分支或者分支为空则用默认的分支
if (selectedTasks null || selectedTasks.isEmpty()) {selectedTasks taskToSchedule.getDefaultCase();
}
if (selectedTasks ! null !selectedTasks.isEmpty()) {// 获取分支的第一个(下标0)task返回给decider service去做调度decider会把任务添加到队列里交给worker去执行WorkflowTask selectedTask selectedTasks.get(0);// 调用了deciderService的getTasksToBeScheduled方法此方法里又获取到TaskMapper调用了getMappedTasks。这里采用了递归调用的方式解析嵌套的TaskListTask caseTasks taskMapperContext.getDeciderService().getTasksToBeScheduled(workflowInstance, selectedTask, retryCount, taskMapperContext.getRetryTaskId());tasksToBeScheduled.addAll(caseTasks);switchTask.getInputData().put(hasChildren, true);
}
return tasksToBeScheduled;
3并行(FORK)的实现机制
FORK用于开启多个并行分支。
实际上该节点的Task不做任何操作TaskMapper返回所有并行分支的第一个Task。 ForkJoinTaskMapper.java getMappedTasks关键代码
// 待调度的Task list最终返回结果
ListTask tasksToBeScheduled new LinkedList();
// 配置中的所有fork分支
ListListWorkflowTask forkTasks taskToSchedule.getForkTasks();
for (ListWorkflowTask wfts : forkTasks) {// 每个分支取第一个TaskWorkflowTask wft wfts.get(0);// 调用了deciderService的getTasksToBeScheduled方法此方法里又获取到TaskMapper调用了getMappedTasks。这里采用了递归调用的方式解析嵌套的TaskListTask tasks2 taskMapperContext.getDeciderService().getTasksToBeScheduled(workflowInstance, wft, retryCount);tasksToBeScheduled.addAll(tasks2);
}
return tasksToBeScheduled;
总的来说分支(SWITCH)、并行(FORK)节点本身没有执行逻辑其通过TaskMapper返回到实际要执行的Task然后交给Decider Service处理。
重试的实现机制
重试和其延迟时间设置都是借助任务队列的功能实现的。
重试将任务重新添加到任务队列
重试的延迟时间添加到任务队列时设置延迟时间延迟时间过后任务才能在队列中被poll出来执行
五 完整性保障机制
由于调度过程中可能会出现因机器重启、网络异常、JVM崩溃等偶发情况这些会导致的decide过程意外终止流程执行不完整展现出如流程一直运行中实际已经没有在调度或者其它状态错误等异常现象。
1 WorkflowReconciler
针对这种情况conductor有一个WorkflowReconciler会定期尝试decide所有正在运行中的流程修复流程执行的一致性。此外它还有一个作用是校验流程超时时间。
2 decideQueue
那么WorkflowReconciler是如何获取到当前运行中的流程呢答案是decideQueue。 decideQueue和任务队列相同也是一个具有延迟功能的队列其存放的是正在执行中的流程的实例id。在任务开始执行时包括新启动执行、重试执行、恢复执行、重跑执行等会将实例id push到decideQueue中在执行结束成功、失败时会从decideQueue中删除实例id。
3 ExecutionLockService
WorkflowReconciler会定期尝试decide所有正在运行中的流程用于超时判断、维护流程一致性。但是流程本身正常执行也会触发decide如果同一个执行同时触发两个decide可能会导致状态混乱执行卡住等问题。
conductor采用了锁来解决这个问题其提供了单机LocalOnlyLock基于信号量实现、redis分布式锁基于redission实现、zookeeper分布式锁三种实现。
decide方法中最开始会尝试获取锁如果获取失败则直接返回。通过锁来保障不会对同一个流程实例并发执行decide。
if (!executionLockService.acquireLock(workflowId)) {return false;
}
由于锁是可配置的可能会导致一个误区单台机器的话不用配置锁。其实单机也是需要配置锁的因为WorkflowReconciler和流程正常执行会产生冲突可能会导致偶发的流程状态混乱问题。
原文链接 本文为阿里云原创内容未经允许不得转载。