RDD行动操作算子 --- count类

网友投稿 295 2022-08-25

RDD行动操作算子 --- count类

count统计RDD中元素的个数。

@Test def countTest: Unit ={ val rdd = sc.parallelize(Seq(1,2,3,4,5,6)) val result: Long = rdd.count() println(result) //6 }

countByKey 与count类似,但是是以key为单位进行统计。注意:此函数返回的是一个map,不是int。

@Test def countByKeyTest: Unit ={ val rdd: RDD[(String, Double)] = sc.parallelize(Seq(("薯片",8.0),("可乐",3.0),("面包",4.5))) val result: collection.Map[String, Long] = rdd.countByKey() println(result) //Map(面包 -> 1, 可乐 -> 1, 薯片 -> 1) }

countByValue统计一个RDD中各个value的出现次数。返回一个map,map的key是元素的值,value是出现的次数。

@Test def test(): Unit ={ var seq = Seq(("a",1),("b",2),("c",3),("a",2)) var source = sc.parallelize(seq) var result = source.countByValue() print(result) //Map((b,2) -> 1, (c,3) -> 1, (a,1) -> 1, (a,2) -> 1) }

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:RDD行动操作算子 --- foreach(遍历)、collect
下一篇:不搞悲情营销,重在三品一标!(商家为了促进消费把三品一标)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~