TOC
业务背景和痛点
斗鱼直播作为业界领先的游戏直播平台,每天为数以亿计的互联网用户提供优质的游戏直播观看、互动和娱乐等服务。
随着近年直播市场的火热,斗鱼直播平台作为业内口碑和体验俱佳的互联网公司,用户量也出现井喷式增长。海量用户给平台带来的稳定性技术挑战也越发强烈,斗鱼的老架构如下图所示,无论是业务支撑还是架构设计,均存在一定的风险和隐患。
为了给用户带来更好的可用性体验,斗鱼急需解决单一数据中心的问题,将老架构从单数据中心升级到多数据中心。
多数据中心挑战
在实现单活升级为多活的过程中,为了确保无故障的迁移升级,我们面临一系列挑战,比如:
- 有状态服务 etcd、zookeeper 等如何多数据中心同步?
- 应用彼此之间存在 1 个复杂的树状或网状依赖关系,应该从哪里开始迁移?
- 按什么维度来划分目标的边界,怎么避免业务焊死在一起,造成无从下手的局面?
- 如果迁移后出现问题,如何快速恢复,并且不牵连已迁移成功的业务?
因单活升级到多活的过程中,涉及系统众多,本文将是斗鱼直播多活改造系列的第一篇,只聚焦于注册中心模块,因此我们先和你介绍下注册中心背后的 etcd 和 zookeeper。
zk/etcd 承担的角色
…..