GKE Kubernetes MySQL Input/output error Ext4Error(GKE Kubernetes MySQL输入/输出错误Ext4Error)
问题描述
我在Kubernetes分区集群上部署了一个MySQL数据库(状态集),在Google Cloud平台上作为服务(GKE)运行。
分区群集由类型为e2-Medium的3个实例组成。
由于以下错误,MySQL容器无法启动。
上次查看的事件。
节点。
我还注意到rnfh节点内存不足。
MySQL Mainfest
MySQL存储类清单:
为什么Kubernetes尝试将Pod调度到内存不足的节点?
更新
我已向MySQL
清单添加了请求和限制,以改进Qos Class
。现在Qos Class
为Guaranteed
。
遗憾的是,Kubernetes仍在尝试调度到内存不足rnfh
节点。
推荐答案
我又运行了几个测试,但无法复制。
要正确回答这个问题,我们需要更多的日志。不确定你是否还留着它们。如果我能猜到哪个是这个问题的根本原因,我会说它与PersistentVolume有关。
在其中一个Github issue - Volume was remounted as read only after error #752中,我发现其行为与OP的行为非常相似。
您已经为您的MySQL创建了special
存储类。您已设置reclaimPolicy: Retain
,因此未删除PV。当Statefulset
Pod(具有相同后缀-0
)重新创建(由于连接错误、数据库上的一些问题而重新启动,很难说)时,它会尝试重新认领此卷。在提到的Github问题中,用户也有非常相似的情况。也有inode #262147: comm mysqld: reading directory lblock
问题,但在下面也有条目[ +0.003695] EXT4-fs (sda): Remounting filesystem read-only
。可能在重新装载时更改了权限?
您的volumeClaimTemplates
包含的另一件事
PersistentVolume
可以被一个节点用作ReadWriteOnce
,也可以被多个节点仅用作ReadOnlyMany
。有可能使用Read-Only
评估模式在不同节点中重新创建POD。
它适合OP的评论:
两天前,由于我不知道的原因,Kubernetes重新启动了容器,并一直尝试在rnfa机器上运行它。容器可能已从另一个节点逐出。
另外,可能会更新节点或群集(取决于是否打开了自动更新选项),这可能会强制重新启动Pod。
'/var/lib/mysql/': Input/output error
问题可能指向数据库损坏,如前面提到的here。
cordoning
受影响的节点解决。有关cordon
和drain
之间差异的其他信息,请参阅here。
与添加一样,要将实例分配给特定节点或具有指定标签的节点,可以使用Affinity
这篇关于GKE Kubernetes MySQL输入/输出错误Ext4Error的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!