10.16

发布时间 2023-10-18 19:52:21作者: 王者归来蔡徐
今日代码:500行
今日时间:4小时
学习内容:今天大数据学习了MapReduce知识,人机交互学习了css的选择器知识。写了一下大数据作业

词频统计任务编程实践,任务要求:在Linux系统本地创建两个文件,即文件wordfile1.txt和wordfile2.txt,文件wordfile1.txt的内容格式如下,需要将zhangsan换成自己名字的英文全拼:

zhangsan loves Spark

zhangsan loves Hadoop

文件wordfile2.txt的内容如下:

 

Hadoop is good

Spark is fast

请对这两个小数据集样本编写MapReduce词频统计程序,并截图给出统计结果,可参考相关教程https://dblab.xmu.edu.cn/blog/2481/。(满分20分)