使用 Solr 为应用提供搜索服务 (3)Solr Cloud

891 阅读3分钟
原文链接: www.jianshu.com

Solr Cloud是Solr官方提供一个高性能、高可用性、可容错的集群方案。在Solr Cloud里面,数据都被分割成多个“块”或者叫做“shards”(分片),使数据能够存放在多台物理机器上,并且使用replicas(复制块)提供的冗余来实现可伸缩性和容错性,该系统使用一个或多个Zookeeper服务来帮助管理整个集群结构保证了所有的索引和搜索请求能够正确的被路由到不同的节点。

前言

通过上篇文章,我们已经成功搭建出一台单节点的Solr服务了,要搭建Solr Cloud非常简单,我们只需要复制节点就可以了。在单节点中,一个Core 对应一份 配置文件,而在Solr Cloud中 逻辑分区称为Collection(可以回顾下第一篇文章),它由所有节点(Core)组成,这样就出现了一个问题,配置文件如何同步?各节点之间如何通信?建立索引及查询如何分布到各节点?要实现这些Solr Cloud的解决方案是使用Zookeeper(分布式协调服务)来管理它们。

方案

由于笔者只有一台Server供使用,我们就以端口来区别不同的节点(实际搭建时使用4台Server更换IP即可),这次要搭建一个4节点,2分片+2副本的Solr Cloud,而Zookeeper我们也选择了单节点,生产环境下请使用Zookeeper集群来保证高可用性,具体情况参考下图表格。

服务 IP/Port
Solr Node 1 172.16.1.202:8983
Solr Node 2 172.16.1.202:8984
Solr Node 3 172.16.1.202:8985
Solr Node 4 172.16.1.202:8986
Zookeeper Node 1 172.16.1.202:2181

提示:本文IP/端口仅供参考,实践中应替换为实际上的Server IP/Port

搭建

//1.下载、安装、启动Zookeeper
$ wget http://apache.fayea.com/zookeeper/zookeeper-3.4.6/zookeeper-3.4.6.tar.gz
$ tar -zxvf zookeeper-3.4.6.tar.gz
//将它移动到你喜欢的目录下,进入zookeeper-3.4.6/目录下
//复制一份配置文件
$ cp ./conf/zoo_sample.cfg ./conf/zoo.cfg
//启动它
$ ./bin/zkServer.sh start

//2.复制Solr 节点(注意把已经启动的节点停掉)
//创建solr-cloud目录(这里以home目录为根目录)
$ cd ~
$ mkdir solr-cloud
//将solr-5.5.3移动到solr-cloud目录下
$ mv solr-5.5.3 solr-cloud/
$ cd solr-cloud/
//创建节点目录node1
$ mkdir node1
//将单节点solr-home文件夹复制过来
$ cp -rf  ~/solr-home/ node1/
//其实只需要solr.xml,我们可以把test-core配置文件删了,稍后我们上传到Zookeeper由它管理。
$ rm -rf node1/solr-home/test-core/
//复制出其它3个节点
$ cp -rf node1/ node2/
$ cp -rf node1/ node3/
$ cp -rf node1/ node4/
//最终应该是下面这样的目录结构
$ ls
node1  node2  node3  node4  solr-5.5.3
//3.启动节点
//进入solr-5.5.3目录下
$ cd solr-5.5.3
//启动node1
$ ./bin/solr start -z 172.16.1.202:2181 -s ~/solr-cloud/node1/solr-home/ -p 8983
//启动node2
$ ./bin/solr start -z 172.16.1.202:2181 -s ~/solr-cloud/node2/solr-home/ -p 8984
//启动node3
$ ./bin/solr start -z 172.16.1.202:2181 -s ~/solr-cloud/node3/solr-home/ -p 8985
//启动node4
$ ./bin/solr start -z 172.16.1.202:2181 -s ~/solr-cloud/node4/solr-home/ -p 8986
//我们可以通过status查看下Solr Server的状态,如果成功启动你可以看到4个节点的信息。
$ ./bin/solr status

//4.将配置文件托管给Zookeeper
$ ./bin/solr zk -upconfig -z 172.16.1.202:2181 -n test-conf -d ~/solr-home/test-core/conf/

//5.创建Collection(名字为test-collection,2片,2副本)
$ ./bin/solr create_collection -c test-collection -n test-conf -shards 2 -replicationFactor 2

这时我们不管访问8983、8984、8985、8986中的任一节点,我们都可以通过Cloud菜单来观察Solr Cloud内部各节点的状态。


Solr Cloud HTML UI

我们在任意节点添加的文档都会被分割同步到其他节点,我们在任意一个节点进行查询都会经过负载均衡、合并后返回统一的响应。

至此,Solr Cloud的搭建就结束了。

下篇文章:使用SoloJ将Solr接入应用

我只是官方文档的搬运工,如果你要使用Solr 强烈建议阅读官方文档,写的非常完善,传送门