如何修改 Rancher Server 的 IP 地址

网友投稿 323 2022-11-02

如何修改 Rancher Server 的 IP 地址

作者简介王海龙, SUSE Rancher 中国社区技术经理,负责 Rancher 中国技术社区的维护和运营。拥有 8 年的云计算领域经验,经历了 OpenStack 到 Kubernetes 的技术变革,无论底层操作系统 Linux,还是虚拟化 KVM 或是 Docker 容器技术都有丰富的运维和实践经验。

注意:

本指南适用于 v2.5 及 v2.5 以下的 Rancher 版本,不适用 v2.6操作前请务必做好备份

前 言

Rancher 管理的每个下游用户集群都有一个 cluster agent,它建立了一个 tunnel,并通过这个 tunnel 连接到 Rancher server 中相应的集群控制器(Cluster controller)。Cluster agent,也称为 cattle-cluster-agent,是在下游用户集群中运行的组件,其重要的作用之一是在下游用户集群和 Rancher server 之间(通过到集群控制器的 tunnel)就事件、统计信息、节点信息和健康状况进行通信并上报。

当 Rancher server 的 IP 发生变化,cattle-cluster-agent 无法通过 tunnel 连接到 Rancher server 时,你可以在下游集群的 cattle-cluster-agent 容器中查看到如下日志:

time="2022-04-06T03:42:22Z" level=info msg="Connecting to wss://35.183.183.66/v3/connect with token jhh9rx4zmgkrw2mz8mkvsmlnnx6q5jllnqb8jnr2vdxcgglglqbdjz"time="2022-04-06T03:42:22Z" level=info msg="Connecting to proxy" url="wss://35.183.183.66/v3/connect"time="2022-04-06T03:42:32Z" level=error msg="Failed to connect to proxy. Empty dialer response" error="dial tcp 35.183.183.66:443: i/o timeout"time="2022-04-06T03:42:32Z" level=error msg="Remotedialer proxy error" error="dial tcp 35.183.183.66:443: i/o timeout"

35.183.183.66 为原 Rancher server IP Rancher UI 显示集群状态为  Unavailable :

可以看出,Rancher server 的主机 IP 发生变化后,Rancher agent 无法通过原来的 Rancher server IP 去连接,所以我们需要更新 Rancher agent 连接 Rancher server 的 IP 地址。

重建 Rancher agent

使 Rancher agent 连接到新 Rancher server IP

更新 server-url

因为 Rancher server 节点的 IP 地址发生变化,所以需要将 Rancher server 的 server-url 更新为正确的主机 IP。我们可以从 Settings 中找到 server-url 的选项。

获取下游集群的 kubeconfig

重新创建 Rancher agent 需要通过 kubectl 连接下游集群,所以在操作前,首先获取下游集群的 kubeconfig 文件。可以从以下三种方式中任选其一:

如果已经从 Rancher UI 上下载了下游集群的 kubeconfig。Rancher 已经和下游集群失联,所以无法继续使用 rancher api 连接下游集群。但可以通过切换 context 直接连接到下游集群 kube-apiserver,继续操作下游集群,参考: 直接使用下游集群进行身份验证(Rancher server 容器的 secret 中获取,参考:kubeconfig:

docker run --rm --net=host -v $(docker inspect kubelet --format '{{ range .Mounts }}{{ if eq .Destination "/etc/kubernetes" }}{{ .Source }}{{ end }}{{ end }}')/ssl:/etc/kubernetes/ssl:ro --entrypoint bash $(docker inspect $(docker images -q --filter=label=io.cattle.agent=true) --format='{{index .RepoTags 0}}' | tail -1) -c 'kubectl --kubeconfig /etc/kubernetes/ssl/kubecfg-kube-node.yaml get configmap -n kube-system full-cluster-state -o json | jq -r .data.\"full-cluster-state\" | jq -r .currentState.certificatesBundle.\"kube-admin\".config | sed -e "/^[[:space:]]*server:/ s_:.*_: \"> kubeconfig_admin.yaml

重新生成 Rancher agent 定义

在 UI 中生成 API 令牌(User -> API & Keys)并保存 Bearer Token;本例为: token-rfv84:86v2wxpzh8mtgvzxpsnwnvrx5nlc424tf8tvrnpzckdxdpt2vfltqq

生成 agent 定义(需要 curl, jq)

# Rancher URLRANCHERURL="Cluster IDCLUSTERID="c-s8t7s"# TokenTOKEN="token-rfv84:86v2wxpzh8mtgvzxpsnwnvrx5nlc424tf8tvrnpzckdxdpt2vfltqq"# Valid certificatescurl -s -H "Authorization: Bearer ${TOKEN}" "${RANCHERURL}/v3/clusterregistrationtokens?clusterId=${CLUSTERID}" | jq -r '.data[] | select(.name != "system") | .command'# Self signed certificatescurl -s -k -H "Authorization: Bearer ${TOKEN}" "${RANCHERURL}/v3/clusterregistrationtokens?clusterId=${CLUSTERID}" | jq -r '.data[] | select(.name != "system") | .insecureCommand'

成功执行后,将生成一个执行定义的命令,例如:

root@ip-172-31-6-210:~# curl -s -k -H "Authorization: Bearer ${TOKEN}" "${RANCHERURL}/v3/clusterregistrationtokens?clusterId=${CLUSTERID}" | jq -r '.data[] | select(.name != "system") | .insecureCommand'curl --insecure -sfL | kubectl apply -f -

应用定义

在具有 kubectl 和 kubeconfig 的主机上执行上一步生成的重新配置 Rancher agent 的命令:

root@ip-172-31-6-210:~# curl --insecure -sfL | kubectl apply -f -clusterrole.rbac.authorization.k8s.io/proxy-clusterrole-kubeapiserver unchangedclusterrolebinding.rbac.authorization.k8s.io/proxy-role-binding-kubernetes-master unchangednamespace/cattle-system unchangedserviceaccount/cattle unchangedclusterrolebinding.rbac.authorization.k8s.io/cattle-admin-binding unchangedsecret/cattle-credentials-6f51cbe createdclusterrole.rbac.authorization.k8s.io/cattle-admin unchangeddeployment.apps/cattle-cluster-agent configureddaemonset.apps/cattle-node-agent configured

验证

稍等片刻,cattle-cluster-agent 和 cattle-node-agent 将会重新运行:

root@ip-172-31-6-210:~# kubectl -n cattle-system get podsNAME READY STATUS RESTARTS AGEcattle-cluster-agent-77f864c76f-qrjs2 1/1 Running 0 38scattle-node-agent-znrv5 1/1 Running 0 4s

业务集群状态重新变为 Active:

后 记

非常不建议修改 Rancher server 的 IP 地址,甚至修改 server-url 也可能带来隐患。

即使是单节点安装的 Rancher server,也建议通过域名注册下游集群,这样后续可以从单节点迁移到高可用;或者在 Rancher server 节点 IP 变动后,只需要修改对应的 IP 映射即可。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Java毕业设计实战之生活旅行分享平台的实现
下一篇:I2C接口的上拉电阻问题
相关文章

 发表评论

暂时没有评论,来抢沙发吧~