Skip to content

curvefs cluster deployment

wanghai01 edited this page Jul 11, 2023 · 5 revisions

使用 CurveAdm 部署 CurveFS 集群

第 1 步:环境准备

第 2 步:在中控机上安装 CurveAdm

第 3 步:导入主机列表

用户需导入部署集群和客户端所需的机器列表,以便在之后的各类配置文件中填写部署服务的主机名, 请确保在之后各类配置文件出现的主机名都已导入,详见主机管理

1. 准备主机列表

$ vim hosts.yaml
global:
  user: curve
  ssh_port: 22
  private_key_file: /home/curve/.ssh/id_rsa

hosts:
  - host: server-host1
    hostname: 10.0.1.1
  - host: server-host2
    hostname: 10.0.1.2
  - host: server-host3
    hostname: 10.0.1.3
  - host: client-host
    hostname: 10.0.1.4

2. 导入主机列表

$ curveadm hosts commit hosts.yaml

第 4 步:准备集群拓扑文件

我们根据常见的场景,给用户准备了不同的拓扑文件模板,用户可根据需求自行选择,并进行编辑调整:

  • 单机部署

    所有服务都运行在一台主机,一般用于体验或测试

  • 多机部署

    通用的多机部署的基础模板,可用于生产环境或测试

关于拓扑文件中的各项配置项,请参考 CurveFS 集群拓扑

$ vim topology.yaml
kind: curvefs
global:
  container_image: opencurvedocker/curvefs:latest
  log_dir: ${home}/curvefs/logs/${service_role}
  data_dir: ${home}/curvefs/data/${service_role}
  variable:
    home: /tmp
    machine1: server-host1
    machine2: server-host2
    machine3: server-host3

etcd_services:
  config:
    listen.ip: ${service_host}
    listen.port: 2380
    listen.client_port: 2379
  deploy:
    - host: ${machine1}
    - host: ${machine2}
    - host: ${machine3}

mds_services:
  config:
    listen.ip: ${service_host}
    listen.port: 6700
    listen.dummy_port: 7700
  deploy:
    - host: ${machine1}
    - host: ${machine2}
    - host: ${machine3}

metaserver_services:
  config:
    listen.ip: ${service_host}
    listen.port: 6800
    listen.external_port: 7800
    metaserver.loglevel: 0
  deploy:
    - host: ${machine1}
    - host: ${machine2}
    - host: ${machine3}
      config:
        metaserver.loglevel: 3

第 5 步:添加集群并切换集群

1. 添加 'my-cluster' 集群,并指定集群拓扑文件

$ curveadm cluster add my-cluster -f topology.yaml

2. 切换 'my-cluster' 集群为当前管理集群

$ curveadm cluster checkout my-cluster

第 6 步:部署集群

$ curveadm deploy

如果部署成功,将会输出类似 Cluster 'my-cluster' successfully deployed ^_^. 的字样。

📢 注意:

部署时默认会运行预检模块来提前检测那些可能导致用户部署失败的因素,以提高用户部署的成功率,当出现预检失败时,用户需要根据报告的错误码以及其提供的解决方案一步步排除问题, 并最终通过所有预检。当然用户也可以通过添加 -k 选项跳过预检,但是这是我们极其不推介的,因为这将给之后的实际部署留下隐患,并产生难以排查的问题。

第 7 步:查看集群运行情况

$ curveadm status

CurveAdm 默认会显示服务 ID、服务角色、主机地址、已部署的副本服务数量、容器 ID、运行状态:

Get Service Status: [OK]

cluster name      : my-cluster
cluster kind      : curvefs
cluster mds addr  : 10.0.1.1:6700,10.0.1.2:6700,10.0.1.3:6700
cluster mds leader: 10.0.1.1:6700 / 505da008b59c

Id            Role        Host          Replicas  Container Id  Status
--            ----        ----          -------   ------------  ------
c9570c0d0252  etcd        server-host1  1/1       ced84717bf4b  Up 45 hours
493b7831907c  etcd        server-host2  1/1       907f8b84f527  Up 45 hours
8438cc5ecb52  etcd        server-host3  1/1       44eca4798424  Up 45 hours
505da008b59c  mds         server-host1  1/1       37c05bbb39af  Up 45 hours
e7bfb934182b  mds         server-host2  1/1       044b56281928  Up 45 hours
1b322781339c  mds         server-host3  1/1       b00481b9872d  Up 45 hours
2912bbdbcb48  metaserver  server-host1  1/1       8b7a14b872ff  Up 45 hours
b862ef6720ed  metaserver  server-host2  1/1       8e2a4b9e16b4  Up 45 hours
ed4533e903d9  metaserver  server-host3  1/1       a35c30e3143d  Up 45 hours
  • 若想查看其余信息,如监听端口、日志目录、数据目录等,可添加 -v 参数
  • 对于同一台主机上的复制服务来说,其状态默认是折叠的,可添加 -s 参数来显示每一个副本服务

第 8 步:验证集群健康状态

集群服务正常运行,并不意味着集群的健康,所以我们在每一个容器内内置了 curvefs_tool 工具。 该工具不仅可以查询集群的健康状态,还提供了许多其他特性,如显示各组件详细状态、创建/删除文件系统等。

首先,我们需要进入任意一个服务容器内(服务 ID 可通过 curveadm status 查看):

$ curveadm enter <Id>

在该容器内执行以下命令查看:

$ curvefs_tool status

如果集群健康,在输出的最后会出现 cluster is healthy 的字样。

Clone this wiki locally