数据科学家是一个比计算机科学家懂更多统计学，比统计学家懂更多计算机科学的人。 – Josh Blumenstock

D:\word.txt 中有如下数据:

(单选) 以下Spark代码执行后输出结果正确的是( )

import org.apache.spark.api.java.*;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.function.Function;

public class TestSparkJava {

    public static void main(String[] args) {
        String logFile = "D:\\word.txt";
        SparkConf conf = new SparkConf().setMaster("local").setAppName("Demo");
        JavaSparkContext sc = new JavaSparkContext(conf);

        JavaRDD<String> logData = sc.textFile(logFile).cache();

        long numAs = logData.filter(new Function<String, Boolean>() {
            public Boolean call(String s) { return s.contains("0"); }
        }).count();

        long numBs = logData.filter(new Function<String, Boolean>() {
            public Boolean call(String s) { return s.contains("1"); }
        }).count();

        System.out.println("Lines with 0: " + numAs + ", lines with 1: " + numBs);

        sc.stop();
    }
}

A. Lines with 0: 3, lines with 1: 4

B. Lines with 0: 8, lines with 1: 9

C. Lines with 0: 9, lines with 1: 8

D. Lines with 0: 4, lines with 1: 3

答案: A

;

results matching ""

No results matching ""