Linux环境ZooKeeper安装配置及使用

1,637 阅读2分钟

Linux环境ZooKeeper安装配置及使用

1. 认识ZooKeeper

(1)ZooKeeper介绍

  • “动物管理员”
  • 官网:zookeeper.apache.org/
  • 介绍:Apache ZooKeeper致力于开发和维护开源服务器,实现高度可靠的分布式协 调。
  • ZooKeeper是一种集中式服务,用于维护配置信息,命名,提供分布式同步和提供组服务。所有这些类型的服务都以分布式应用程序的某种形式使用。每次实施它们都需要做很多工作来修复不可避免的错误和竞争条件。由于难以实现这些类型的服务,应用程序最初通常会吝啬它们,这使得它们在变化的情况下变得脆弱并且难以管理。即使正确完成,这些服务的不同实现也会在部署应用程序时导致管理复杂性。

(2)zookeeper作用

  • 存储+监听

(3)Zookeeper角色

  • 主从结构
    • 1)Leader领导者->主
    • 2)Follower追随者->从
    • 3)zookeeper由一个领导者多个追随者组成
  • **zookeeper集群中只要有半数以上的节点存活,zookeeper集群就能正常工作。(高可用)**所以搭建zk集群最好搭建奇数台(3,5,11)。

4)zookeeper功能

  • 大数据中使用zookeeper业务:
    • 1)做统一的配置管理
    • 2)做统一的命名服务
    • 3)做统一的集群管理
    • 4)做服务器的动态上下线感知(代码)

2. 准备工作

(1)集群规划

  • hadoop01、hadoop02和hadoop03三个节点上部署ZooKeeper。
  • 上传安装包zookeeper-3.4.10.tar.gz
  • 具备java环境

3. 安装流程

(1)单节点安装——hadoop01

  • 解压zookeeper安装包到目标目录下: $ tar -zxvf zookeeper-3.4.10.tar.gz -C 目标目录
  • 在zookeeper的根目录zookeeper-3.4.10/下创建zkData: $ mkdir -p zkData
  • 重命名zookeeper-3.4.10/conf目录下的zoo_sample.cfg为zoo.cfg作为配置文件: $ mv zoo_sample.cfg zoo.cfg

(2)配置zoo.cfg文件

  • 修改dataDir路径为创建的zkData路径: dataDir=/XXXXXX/zookeeper-3.4.10/zkData

  • 增加集群信息:

      #######################cluster##########################  
      server.1=hadoop01:2888:3888  
      server.2=hadoop02:2888:3888  
      server.3=hadoop03:2888:3888  
    
    • 2888:zookeeper服务之间通信端口
    • 3888:zookeeper选举机制端口
    • 2181:zookeeper客户端用于连接zookeeper服务器

(3)配置参数解读

  • Server.A=B:C:D。
    • A是一个数字,表示这个是第几号服务器;
    • B是这个服务器的ip地址;
    • C是这个服务器与集群中的Leader服务器交换信息的端口;
    • D是万一集群中的Leader服务器挂了,需要一个端口来重新进行选举,选出一个新的Leader,而这个端口就是用来执行选举时服务器相互通信的端口。
  • 集群模式下配置一个文件myid,这个文件在dataDir目录下,这个文件里面有一个数据就是A的值,Zookeeper启动时读取此文件,拿到里面的数据与zoo.cfg里面的配置信息比较从而判断到底是哪个server。

(4)集群操作

  • 在zookeeper-3.4.10/zkData目录下创建一个myid的文件: touch myid
  • 编辑myid文件:(注意myid除编号外不能有任何多余内容,包括空格和空行) vi myid 在文件中添加与server对应的编号:如1
  • 拷贝配置好的zookeeper到其他机器上
    • scp -r zookeeper-3.4.10/ hadoop02:$PWD
    • scp -r zookeeper-3.4.10/ hadoop03:$PWD
  • 分别修改myid文件中内容为2、3

(5)选举机制

  • 目前有5台服务器,每台服务器均没有数据,它们的编号分别是1,2,3,4,5,按编号依次启动,它们的选择举过程如下:
    • 服务器1启动,给自己投票,然后发投票信息,由于其它机器还没有启动所以它收不到反馈信息,服务器1的状态一直属于Looking。
    • 服务器2启动,给自己投票,同时与之前启动的服务器1交换结果,由于服务器2的编号大所以服务器2胜出,但此时投票数没有大于半数,所以两个服务器的状态依然是LOOKING。
    • 服务器3启动,给自己投票,同时与之前启动的服务器1,2交换信息,由于服务器3的编号最大所以服务器3胜出,此时投票数正好大于半数,所以服务器3成为领导者,服务器1,2成为小弟。
    • 服务器4启动,给自己投票,同时与之前启动的服务器1,2,3交换信息,尽管服务器4的编号大,但之前服务器3已经胜出,所以服务器4只能成为小弟。
    • 服务器5启动,后面的逻辑同服务器4成为小弟。

4. 命令行操作

(1)配置环境变量:

  • 修改配置文件: vi /etc/profile
  • 增加以下内容:
    • export ZOOKEEPER_HOME=zookeeper安装路径
    • export PATH=PATH:PATH:ZOOKEEPER_HOME/bin
  • 声明环境变量:
    • source /etc/profile

(2)启动zookeeper集群

  • $ bin/zkServer.sh start

(3)查看zookeeper状态

  • $ bin/zkServer.sh status

(4)启动客户端

  • $ bin/zkCli.sh

(5)退出客户端

  • $ quit

(6)连接其它机器客户端操作

  • $ connect 主机名:2181

(7)查看历史操作记录

  • $ history

(8)查看当前节点的内容

  • $ ls /

(9)创建节点

  • $ create /节点名 数据信息

(10)查看节点的值

  • $ get /节点名

(11)创建节点的可选项

  • $ create [-s] [-e] path data acl
    • [-e] 短暂节点,退出客户端后消失。
    • [-s] 序号,可创建节点名相同的节点,序号依次累加。

(12)修改节点值

  • $ set path data [version]
    • [version] 版本
    • 注意:设置版本号 必须从0开始

(13)删除节点

  • $ delete path

(14)创建子节点

  • $ create /节点名/子节点名 数据信息

(15)递归删除

  • $ rmr /节点名

(16)监听

  • 获得监听:$ get path watch
  • 获得当前节点下增减变化:$ ls path watch

(17)查看当前节点状态

  • $ stat /节点名

5. 节点状态信息

  • czxid:zookeeper事务id
  • ctime:节点创建时间
  • mZxid:最后更新的czxid
  • mtime:最后修改的时间
  • pZxid:最后更新子节点的czxid
  • cversion:子节点的变化号、子节点修改次数
  • dataVersion:数据变化号
  • aclVersion:访问控制列表的变化号
  • ephemeralOwner:临时节点判断
  • dataLength:节点数据长度
  • numChildren:子节点个数