c语言sscanf函数的用法是什么
265
2022-11-26
Kafka核心API——Producer生产者
Producer异步发送演示
在上文中介绍了AdminClient API的使用,现在我们已经知道如何在应用中通过API去管理Kafka了。但在大多应用开发中,我们最常面临的场景就是发送消息到Kafka,或者从Kafka中消费消息,也就是典型的生产/消费模式。而本文将要演示的就是如何使用Producer API将消息发送至Kafka中,使应用成为一个生产者。
Producer API具有以下几种发送模式:
异步发送 异步阻塞发送 异步回调发送
接下来,使用一个简单的例子演示一下异步向Kafka发送消息。首先,我们需要创建一个Producer实例,并且必须配置三个参数,分别是Kafka服务的ip地址及端口号,以及消息key和value的序列化器(消息体以key-value结构形式存在)。
在本例中,消息的key和value均为String类型,所以使用StringSerializer这个字符串类型的序列化器。代码示例:
/**
* 创建Producer实例
*/
public static Producer
在new KafkaProducer时,构造器里做了什么:
读取Properties里的配置项,初始化ProducerConfig 基于ProducerConfig初始化一些配置字段 初始化MetricConfig监控度量指标配置以及MetricsReporter报告器列表和Metrics存储库 从配置中加载partitioner负载均衡器,当有多个partition时就是通过这个负载均衡器去将消息均匀的分发到不同的partition中 从配置中加载消息key和value的序列化器(Serializer) 初始化RecordAccumulator,一个类似于计数器的东西,用于计算消息批次的。因为Producer并不是接收到一条消息就发送到一条消息,而是达到一定批量后按批次发送的,所以需要有一个计数器来存储和计算批次。 初始化用于发送消息的Sender,然后会为其创建一个守护线程,并启动
Tips:
如果细看了KafkaProducer构造器的源码,就会发现其所有的属性都是final的,并且均在构造器中完成了初始化,不存在不安全的发布或共享变量,这也就变相说明了KafkaProducer是线程安全的
然后调用Producer中的send方法即可实现异步发送。代码示例:
/**
* 演示Producer异步发送
*/
public static void producerAsyncSend() {
String topicName = "MyTopic";
String key = "test-key";
String value = "this is test message!";
try (Producer
在producer.send(record)里主要做了以下事情:
使用序列化器去序列化消息的key和value 计算分区,即计算消息具体进入哪一个partition,也就是一个负载均衡的过程 计算批次,判断是否需要创建新的批次,然后都需要调用accumulator.append向批次中追加消息 当批次满了,调用sender.wakeup在守护线程中去发送消息
Producer异步阻塞发送演示
send方法会有一个Future类型的返回值,当我们调用Future的get方法时,就会阻塞当前线程,此时就达到了异步阻塞发送消息的效果,即发送消息是异步的,获取结果是阻塞的。我们可以通过这种方式去获取Future里存储的元数据信息。代码示例:
/**
* 演示Producer异步阻塞式发送
*/
public static void producerAsyncBlockSend() throws Exception {
String topicName = "MyTopic";
String key = "test-key";
String value = "this is test message!";
try (Producer
运行以上代码,控制台输出内容如下:
hasTimestamp: true, timestamp: 1589637627231, hasOffset: true, offset: 5, partition: 1, topic: MyTopic
Producer异步回调发送演示
如果想要在发送完消息后获取结果,比起直接调用Future的get方法更好的方式是使用异步回调的消息发送形式。
在send方法中支持传入一个回调函数,当消息发送完毕后,会调用回调函数并将结果当作参数传入,此时我们就可以在回调函数中对结果进行处理。代码示例:
/**
* 演示Producer异步回调发送
*/
public static void producerAsyncCallbackSend() throws Exception {
String topicName = "MyTopic";
String key = "test-key";
String value = "this is test message!";
try (Producer
运行以上代码,控制台输出内容如下:
hasTimestamp: true, timestamp: 1589639553024, hasOffset: true, offset: 7, partition: 1, topic: MyTopic
自定义Partition负载均衡器
在某些特殊的业务场景下我们经常会有自定义负载均衡算法的需求,在Kafka中可以通过实现Partitioner接口来自定义Partition负载均衡器。
本例中所实现的负载均衡算法比较简单,就是使用key的hashcode去对partition的数量进行取余得出partition的索引,代码示例:
package com.zj.study.kafka.producer;
import org.apache.kafka.clients.producer.Partitioner;
import org.apache.kafka.common.Cluster;
import java.util.Map;
/**
* 自定义Partition负载均衡器
*
* @author 01
* @date 2020-05-17
**/
public class MyPartitioner implements Partitioner {
@Override
public int partition(String topic, Object key,
byte[] keyBytes, Object value,
byte[] valueBytes, Cluster cluster) {
int partitionsNum = cluster.partitionsForTopic(topic).size();
int hashCode = key.hashCode();
// hashCode如果是负数则需要转换为正数
hashCode = hashCode < 0 ? Math.abs(hashCode) : hashCode;
return hashCode % partitionsNum;
}
@Override
public void close() {
}
@Override
public void configure(Map
然后在创建Producer实例时,指定MyPartitioner的包名路径即可。代码示例:
/**
* 创建Producer实例
*/
public static Producer
Kafka的消息传递保障
我们首先要了解一下消息的传递语义,一般存在三种类型语义:
At most once(最多一次):消息传递过程中有可能丢失,丢失的消息也不会重新传递,其实就是保证消息不会重复发送或者重复消费 At least once(至少一次):消息在传递的过程中不可能会丢失,丢失的消息会重新传递,其实就是保证消息不会丢失,但是消息有可能重复发送或者重复被消费 Exactly once(正好一次):这个是大多数场景需要的语义,其实就是保证消息不会丢失,也不会重复被消费,消息只传递一次
在Kafka中主要通过消息重发和ACK机制来保障消息的传递,消息重发机制主要是提高消息发送的成功率,并不能保证消息一定能发送成功。我们可以通过在创建Producer实例时,设置retries配置项来开启或关闭消息重发机制,代码示例:
// 设置的值为0表示关闭,大于0则表示开启 properties.setProperty(ProducerConfig.RETRIES_CONFIG, "0");
另一个消息传递保障机制就是ACK机制,Kafka中的ACK机制有三种模式,需要通过配置去指定。这三种配置的含义如下:
acks=0: Producer发送消息到发送端的buffer中就直接返回了,至于这个消息有没有真的发送到Broker Server,Producer不关心,即使消息发送失败,上面说的消息重发机制也不起作用,所以在这种场景下,可能就会丢失消息了(这就有点类似于UDP,只管发,不管对方有没有接收到消息) acks=1: Producer发送的消息一定要存储到对应的分区的Leader副本日志文件中才算消息发送成功,要是失败的话,则会尝试retry。在这种模式下,只有当消息已经存储在Leader副本中,但是消息还没有被Follower副本同步的时候,如果Leader副本所在的broker server挂了,消息才会丢失 acks=all: Producer发送的消息一定要存储到对应的分区的所有的在ISR列表中的副本日志文件中才算消息发送成功,要是失败的话,则会尝试retry。这种场景下消息就很难丢失了,除非所有的副本所在的Broker Server都挂了
同样的该配置项可以在创建Producer实例时进行设置,代码示例:
properties.setProperty(ProducerConfig.ACKS_CONFIG, "all");
上面的三种取值可以根据实际的业务场景来进行设置,消息的可靠性越强的,性能肯定就会越差。这三种取值就是在消息的可靠性以及性能两个方面做一个权衡:
性能要求高,但可靠性要求低的,可以选择acks=0 性能和可靠性都希望能够兼顾的,就选择acks=1 若允许牺牲性能来保证高可靠的场景,则选择acks=all
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~