Flink State 管理与恢复

网友投稿 246 2022-11-17

Flink State 管理与恢复

Flink 是一个默认就有状态的分析引擎,例如 WordCount 案例可以做到单词的数量的累加,其实是因为在内存中保证了每个单词的出现的次数,这些数据其实就是状态数据。但是如果一个 Task 在处理过程中挂掉了,那么它在内存中的状态都会丢失,所有的数据都需 要重新计算。从容错和消息处理的语义(At -least-once 和 Exactly-once)上来说,Flink 引入了 State 和 CheckPoint。

State 一般指一个具体的 Task/Operator 的状态,State 数据默认保存在 Java 的堆内存中。

CheckPoint(可以理解为 CheckPoint 是把 State 数据持久化存储了)则表示了一个 Flink Job 在一个特定时刻的一份全局状态快照,即包含了所有 Task/Operator 的状态。

Flink 有两种常见的 State 类型,分别是: (1)keyed State(键控状态) (2)Operator State(算子状态)

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:SpringBoot+JPA 分页查询指定列并返回指定实体方式
下一篇:Flink中State管理与恢复之CheckPoint的参数设置
相关文章

 发表评论

暂时没有评论,来抢沙发吧~