重启etcd可能导致数据不一致BUG分析

Posted by 唐聪 on Friday, April 24, 2020

TOC

重启etcd可能导致数据不一致BUG分析

背景

近期我们遇到一个严重BUG,开启鉴权后,重启etcd就可能导致数据不一致,根本原因是鉴权相关操作未做幂等性,consistent index未持久化,重启会导致命令重放, 进而导致鉴权版本号不一致,放大导致mvcc数据不一致,客户端表现写进去数据读取不到。

问题详细描述如下: issue

为了解决以上问题以及提高后续定位不一致问题的效率,我们提了以下几个PR。

内容

详情参考详细分析文章.