练习一:依照书中的操作步骤,编写一个用于计算学生平均成绩的MapReduce应用程序,并将程序打包提交到Hadoop集群中运行。
练习二:动手编写一个MapReduce应用程序,统计某网站每日新增的用户数量。例如,已知有以下用户访问历史数据,第一列为用户访问网站的日期,第二列为用户名:
2020-01-01,user1 2020-01-01,user2 2020-01-01,user3 2020-01-02,user1 2020-01-02,user2 2020-01-02,user4 2020-01-03,user2 2020-01-03,user5 2020-01-03,user6
现需要根据上述数据统计每日新增的用户数量,期望的统计结果为:
2020-01-01,3 2020-01-02,1 2020-01-03,2