原文链接 : http://zeppelin.apache.org/docs/0.7.2/interpreter/hdfs.html

译文链接 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030805

贡献者 : 片刻 ApacheCN Apache中文网

概述

Hadoop文件系统是hadoop项目的分布式,容错文件系统的一部分,通常用作Hadoop MapReduceApache SparkAlluxio等底层文件系统等分布式处理引擎的存储。

配置

属性默认描述
hdfs.urlhttp://localhost:50070/webhdfs/v1/WebHDFS的URL
hdfs.userHDFSWebHDFS用户
hdfs.maxlength1000获取的最大行结果行数

该解释器使用HTTP WebHDFS接口连接到HDFS。它支持应用于HDFS的基本shell文件命令,它目前只支持浏览。

  • 您可以使用ls [PATH]ls -l [PATH]列出目录。如果路径丢失,则列出当前目录。 ls支持用于人类可读文件大小的-h标志。
  • 您可以使用cd [PATH]通过给出相对或绝对路径来更改当前目录。
  • 您可以调用pwd来查看当前目录。

提示:使用(Ctrl +。)进行自动完成。

创建解释器

在笔记本中,要启用HDFS解释器,请单击齿轮图标并选择HDFS

WebHDFS REST API

您可以通过针对提供给解释器的WebHDFS终端运行curl命令来确认您是否可以访问WebHDFS API。

这是一个例子:

  1. $> curl "http://localhost:50070/webhdfs/v1/?op=LISTSTATUS"