Hadoop集群启动后,可以通过浏览器Web界面查看HDFS集群的状态信息,访问IP为NameNode所在服务器的IP地址,访问端口默认为9870。例如,本书中NameNode部署在节点centos01上,IP地址为192.168.170.133,则HDFS Web界面访问地址为http://192.168.170.133: 9870。若本地Windows系统的hosts文件中配置了域名IP映射,且域名为centos01,则可以访问http://centos01: 9870,如图4-6所示。
从图4-6中可以看出,HDFS的Web界面首页中包含了很多文件系统基本信息,例如系统启动时间、Hadoop的版本号、Hadoop的源码编译时间、集群ID等,在【Summary】一栏中还包括了HDFS磁盘存储空间、已使用空间、剩余空间等信息。
HDFS Web界面还提供了浏览文件系统的功能,单击导航栏的【Utilities】按钮,在下拉菜单中单击【Browse the file system】选项,即可看到HDFS系统的文件目录结构,默认显示根目录下的所有目录和文件,并且能够显示目录和文件的权限、拥有者、文件大小、最近更新时间、副本数等信息。如果需要查看其他目录,可以在上方的文本框中输入需要查看的目录路径,按回车键即可进行查询,如图4-7所示。
图4-6 HDFS Web主界面
图4-7 HDFS Web界面文件浏览
此外,还可以从HDFS Web界面中直接下载文件。单击文件列表中需要下载的文件名超链接,在弹出的窗口中单击【Download】超链接,即可将文件下载到本地,如图4-8所示。
图4-8 HDFS Web界面文件下载