在Spark中,过滤函数返回一个由源数据集中满足条件的元素组成的新数据集。只检索满足给定条件的元素。
在这个例子中,我们过滤给定的数据,并检索除了35之外的所有值。
$ spark-shell
scala> val data = sc.parallelize(List(10,20,35,40))
scala> data.collect
scala> val filterfunc = data.filter(x => x!=35)
scala> filterfunc.collect
这里,我们得到了期望的输出。
本文链接:http://so.lmcjl.com/news/20184/