详解Java中Collector接口的组成

网友投稿 252 2023-01-01

详解Java中Collector接口的组成

一、Collector常常出现的地方

java8引入了stream,Collector是与stream一起出现的,配合stream使用的好帮手,如果用过stream,我们应该都有写过这样的代码

例子1:

lists.stream()....collect(Collectors.toList());

例子2:

lists.stream().collect(groupingBy(String::length));

这两个例子中,toList()和groupingBy()返回的都是一个Collector对象,那么问题来了,什么是Collector?

二、什么是Collector

Collector其实是一个泛型接口,通过这个接口可以定义一系列的聚合操作,按照官方文档的说法,Collector其实是提供mutable reduction operation,即可改变的减少操作。

常见的聚合操作有:

1.用StringBuilder拼接字符串

2.计算元素综合的数据,比如sum, min, max, or average

这个reduction在Google翻译是减少的意思,但是我不太对得上这个意思,觉得形容成聚合操作会更容易理解一点。

关于聚合操作,我们会在很多语言中遇到,比如mysql里面的group by操作,sum(),min(),max(),Count(),anyValue(),这些叫做aggregate function,即聚合操作

我理解这些操作的是类似的,只不过这些是在数据库里面进行的,collector是在java代码层进行的,他们的本质都是一样的,他们都进行了多对一的转换,将一系列的数据变成一个数据或者几团数据。

三、Collector的使用

Collector是一个接口,它还有一个静态工具类Collectors,Collectors提供了很多常见的聚合操作的实现,通常来说我们调用Collectors里面的方法就够了,如果想要更多更复杂的实现也可以自定义一个collector,定义Collector的话,我们需要先了解Collector的组成

3.1 Collector的泛型类型

collector是一个泛型接口,那我们先从泛型的元素开始分析

Collector

这个接口有三种类型,T代表流中元素的类型,A是中间结果容器的类型,R是最后返回的类型

比如一个字符串数组strings,对它进行这个操作

strings.stream()....collect(Collectors.toList());

toList()方法返回的Collector中,T就是String类型,A是List类型,R是List类型,如果不能理解可以继续往下看

3.2 Collector 的组成

collector由四个方法组成和一个特性组成

组成

作用

Supplier

创建一个新的结果容器

pigBYShVbQ

accumulator

将一个新的元素(流中的元素)加入到结果容器中

combiner

接受两个中间的结果容器,将它们合并成一个(并行流的时候)

finisher

将结果容器转换成另一个类型(可选的)

characteristics 是一个枚举特性集合,决定某些操作过程的特性,比如是否是并行的,是否需要转换结果容器,是否是有序的,这些特性用来进行简化操作,提供更好的性能。

一共有三个特性,在定义的时候可以选几个来组成这个集合,它们是:

CONCURRENT :意味着这个同一个容器可以被多个线程调用accumulator方法进行操作

UNORDERED:意味着这个聚合操作不会保留元素的出现顺序,一般是来说最后的结果容器是无序的(比如Set)才会使用

IDENTITY_FINISH:意味着finisher方法是Function.identity(),可以被省略,如果设置了的话,需要A类型可以能强制地转换成R类型,否则会抛出异常。

关于Collector的四个方法,这里用一个流程图来解释这个过程

3.3 举例解释Collector四个方法

下面通过Collectors里面提供的常见方法来详细地说明Collector的组成

3.3.1 Example1- toList()

首先来看toList()方法的组成

public static Collector> toList() {

return new CollectorImpl<>((Supplier>) ArrayList::new, List::add,

(left, right) -> { left.addAll(right); return left; },

CH_ID);

}

对于这个方法实现来说

supplier是 () -> ArrayList::new,提供的容器类型(A)是ArrayList

accumulator是List::add,将元素item加入到arrayList容器中,即

(intermediateCollector, item) -> intermediateCollector.add(item)

combiner是将两个容器arrayList合并

(left, right) -> { left.addAll(right); return left;}

finisher是啥也不做,combiner之后的结果就直接返回来,所以R也是ArrayList的类型

characteristic是

Collections.unmodifiableSet(EnumSet.of(Collector.Characteristics.IDENTITY_FINISH));

IDENTITY_FINISH这个特性是说,不执行finisher函数,直接返回combiner之后的结果容器

3.3.2 Example2- joining()

joining有三个方法重载,我们这里先看最直观的一个,它的实现是

public static Collector joining() {

return new CollectorImpl(

StringBuilder::new, StringBuilder::append,

(r1, r2) -> { r1.append(r2); return r1; },

StringBuilder::toString, CH_NOID);

}

supplier是StringBuilder::new,即:

() -> new StringBuilder();

容器A的类型是StringBuilder

accumulator是StringBuilder::append, 即

(intermediate, current)-> intermediare.append(current);

combiner是

(r1, r2) -> { r1.append(r2); return r1; }

即对于两个中间的结果stringBuilder来说,combiner做的事情就是合并两个stringBuilder,变成一个stringBuilder

finisher是StringBuilder::toString,对于最后的容器StringBuilder,finisher会将它转换成String的类型,因此R的类型是String

characteristic是一个emptySet(),不包含任何特性

Collections.emptySet();

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:反射机制:getDeclaredField和getField的区别说明
下一篇:圆通快递物流查询单号跟踪官网(圆通速递官网查询单号跟踪物流)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~