饭可以一日不吃，觉可以一日不睡，书不可以一日不读——毛泽东

通常,当程序计算出一个resultRDD时,我们想知道这个RDD中包含多少个分区, 以及每个分区中包含了那些record。我们可以使用mapPartionsWithIndex()来输出这些数据。

(单选) 以下Spark mapPartitionsWithIndex 算子输出正确的是( )

/**
     * mapPartitiosWithIndex(func)
     用法: rdd2=rdd1.mapPartitiosWithIndex(func)
     语义: 对rdd1中每个分区进行func操作,输出新的一组数据
          分区中的数据带有索引
     * */
  public static  void  mapPartitiosWithIndex()
  {
      //创建SparkConf
      SparkConf conf = new SparkConf().setAppName("map").setMaster("local");
      //创建javaSparkContext
      JavaSparkContext sc = new JavaSparkContext(conf);
      JavaRDD<Integer> rdd = sc.parallelize(Arrays.asList(1, 2, 3, 4, 5, 6,7,8,9), 3);
      JavaRDD<String> mapPartitionsWithIndex = rdd
              .mapPartitionsWithIndex(new Function2<Integer, Iterator<Integer>, Iterator<String>>() {

                  private static final long serialVersionUID = 1L;

                  @Override
                  public Iterator<String> call(Integer index, Iterator<Integer> iterator) throws Exception {
                      //return null;

                      List<String> list = new ArrayList<>();

                      Integer odd=0;
                      Integer even=0;

                      while (iterator.hasNext()) {
                          Integer value=iterator.next();
                          if(value%2==0)
                              even+=value;
                          else
                              odd+=value;

                          //list.add("partition" + index + ":" + iterator.next());
                      }

                      //将(pid,odd)存放到list中
                      list.add("partition:" + index + "," +"value:"+ odd);

                      //将(pid,odd)存放到list中
                      list.add("partition:" + index + "," +"value:"+ even);


                      return list.iterator();
                  }
              }, true);

      mapPartitionsWithIndex.foreach(x->System.out.println(x));
      sc.stop();
  }

A. partition:0,value:1 partition:0,value:2 partition:1,value:3 partition:1,value:4 partition:2,value:5 partition:2,value:6

B. partition:0,value:4 partition:0,value:2 partition:1,value:5 partition:1,value:10 partition:2,value:16 partition:2,value:8

C. partition:0,value:2 partition:0,value:2 partition:1,value:5 partition:1,value:10 partition:2,value:16 partition:2,value:8

D. partition:0,value:4 partition:0,value:2 partition:1,value:7 partition:1,value:10 partition:2,value:16 partition:2,value:8

答案: B

;

results matching ""

No results matching ""