如果你想要有点挑战性,你可以在物理集群上安装 ozone。搭建一个 Ozone 集群需要了解它的各个组件,Ozone 既能和现有的 HDFS 集群并存运行,也可以独立运行。在这两种模式下,需要运行的 Ozone 组件是相同的。
将 ozone-<version> 安装包解压到目标目录,因为 Ozone 的 jar 包需要部署到集群的所有机器上,所以你需要在所有机器上进行此操作。
Ozone 依赖名为 ozone-site.xml
的配置文件, 运行下面的命令可以在指定目录生成名为 ozone-site.xml
的配置文件模板,然后你可以将参数替换为合适的值。
ozone genconf <path>
我们来看看生成的文件(ozone-site.xml)中都有哪些参数,以及它们是如何影响 ozone 的。当各个参数都配置了合适的值之后,需要把该文件拷贝到 ozone directory/etc/hadoop
。
示例如下:
<property>
<name>ozone.metadata.dirs</name>
<value>/data/disk1/meta</value>
</property>
示例如下:
<property>
<name>ozone.scm.names</name>
<value>scm.hadoop.apache.org</value>
</property>
示例如下:
<property>
<name>ozone.scm.datanode.id.dir</name>
<value>/data/disk1/meta/node</value>
</property>
示例如下:
<property>
<name>ozone.om.address</name>
<value>ozonemanager.hadoop.apache.org</value>
</property>
Setting | Value | Comment |
---|---|---|
ozone.metadata.dirs | 文件路径 | 元数据存储位置 |
ozone.scm.names | SCM 服务地址 | SCM的主机名:端口,或者IP:端口 |
ozone.scm.block.client.address | SCM 服务地址和端口 | Ozone 内部服务使用(如 OM) |
ozone.scm.client.address | SCM 服务地址和端口 | 客户端使用 |
ozone.scm.datanode.address | SCM 服务地址和端口 | Datanode 使用 |
ozone.om.address | OM 服务地址 | Ozone handler 和 Ozone 文件系统使用 |
hdds.datanode.dir | 文件路径 | datanode中数据存储位置 |
在启动 Ozone 集群之前,需要依次初始化 SCM 和 OM。
ozone scm --init
这条命令会使 SCM 创建集群 ID 并初始化它的状态。
init
命令和 Namenode 的 format
命令类似,只需要执行一次,SCM 就可以在磁盘上准备好正常运行所需的数据结构。
ozone --daemon start scm
SCM 启动之后,我们就可以创建对象存储空间,命令如下:
ozone om --init
OM 初始化完成之后,就可以启动 OM 服务了:
ozone --daemon start om
此时 Ozone 的命名服务 OM 和 块服务 SCM 都已运行。
注意: 如果 SCM 未启动,om --init
命令会失败,同样,如果磁盘上的元数据缺失,SCM 也无法启动,所以请确保 scm --init
和 om --init
两条命令都成功执行了。
接下来启动 Datanode,在每个 Datanode 上运行下面的命令:
ozone --daemon start datanode
现在 SCM、OM 和所有的 Datanode 都已启动并运行。
恭喜!你成功地搭建了一个完整的 ozone 集群。
如果你想简化操作,可以直接运行:
ozone scm --init
ozone om --init
start-ozone.sh
这么做的前提是,workers
文件已经正确编写,并且配置好了到各个 Datanode 的 ssh,这和 HDFS 的配置方式相同,具体方法请查看 HDFS 文档。