常见问题¶
虚拟机(virtnest)包含 apiserver 和 agent 两个部分,遇到问题时应从这两部分进行排查。
页面 API 报错¶
若页面请求 API 报错 500 或 cluster 资源不存在,首先应检查 Global 集群中虚拟机相关服务的日志,寻找是否 kpanda 的关键词。 若存在,需确认 kpanda 相关服务是否运行正常。
VM 无法正常使用¶
若创建的 VM 无法正常使用,原因多样。以下是排查方向:
VM 创建失败¶
VM 创建失败时,应在目标集群中查看 VM 的详细信息:
如果详细信息涉及存储,如 PVC、PV、SC 等,请检查 SC 状态。 问题未解决时,应咨询开发人员。
如果详细信息涉及设备,如 KVM、GPU 等,请核实目标集群节点是否完成了依赖条件检查。 若所有依赖已安装,应咨询开发人员。
VM 创建成功但无法使用¶
若 VM 创建成功但无法使用,应在 DCE 页面检查 VM 的 VNC 页面是否正常。 若显示但仅限启动信息,请检查依赖条件。 若依赖条件齐全,应咨询开发人员。
若 VNC 页面显示异常,应使用以下命令查看 VM 详细信息:
当详细信息涉及存储信息,如 PVC、PV、SC 等,应检查 SC 状态。 问题未解决时,应咨询开发人员。
VNC 可以启动但网络无法访问¶
按照下面流程进行排查,将相关信息记录下来,反馈给开发人员。 在 VM 所在集群中执行以下操作:
-
获取 VM 的 Pod IP
-
在节点上执行 ssh 登录你的 VM
如果无法访问,请咨询开发人员。
-
检查 VM 使用的网络模式
如果是默认网络模式(masquerade),咨询开发人员。
如果是 bridge + ovs,需要确认以下信息。
- 检查 Spiderpool 是否安装成功,并且确保安装在
kube-system
命名空间下。 - ovs 安装成功,并且 ovs bridge 配置成功。
若以上信息确认无误,请咨询开发人员。
- 检查 Spiderpool 是否安装成功,并且确保安装在