
当今互联网系统架构
日趋复杂,稳定性风险也在升高
不可见的隐患及宕机因素一直潜伏着
如何应对那些不可见的“黑天鹅”,
让事后的总结可以少一些字数和次数
2022年10月28日-29日
GOPS 全球运维大会
2022 · 上海站,
5位B站讲师一次性揭秘
“713故障”后,如何直面“至暗时刻”
从容灾、多活、高可用到
演练、应急响应、风险治理的
降本增效之路!

武安闯
bilibili 基础架构部
SRE 负责人
01
个人简介
武安闯,2016年加入B站,深度参与B站微服务拆分、云原生改造、高可用建设、SRE转型和稳定性体系落地等项目。当前主要关注B站在线业务的SRE稳定性体系建设和推广,对SRE的实践有深入的探索与思考。
02
主题简介
SRE有那些高可用能力来保护业务可用性?去年713我们为什么崩了?故障后我们多活是如何优化的?本次分享不仅会为大家介绍我们的稳定性建设,还会分享我们基于 Google SLO 方法论来量化可用性的运营实践。

王志广
bilibili
DBA 负责人
01
个人简介
王志广,十年以上数据库运维经验,曾在多家大型互联网公司任职,主导和参与了多家数据库私有云建设、数据库多活、数据库架构从商业数据库到开源数据库的迁移。2020年加入B站,主导了B站新一代数据库可用系统BRM、MongoDB私有云等项目。目前主要负责B站数据库多活、数据库服务治理等。目前主要专注于B站数据库多活、数据库服务治理等。
02
主题简介
B站数据库从单机房到同城多活演进。

刘昊
bilibili
SRE 体系负责人
01
个人简介
刘昊,2017年加入B站,先后负责B站运营研发、中间件研发和SRE体系等方向,构建了B站的统一作业&流程&鉴权服务,主导了数据库&缓存相关中间件的自研落地。目前负责B站SRE体系和转型的整体性建设,落地推进事件运营、运维数据中台建设。
02
主题简介
当今的组织在更复杂的技术环境中处理更多的变化,导致更高的中断和事故风险。稳定性作为SRE团队的最核心关注点,贯穿到日常工作的方方面面。那么在提升业务服务和基础架构稳定性的过程中,有哪些核心的方法、关键流程和可量化指标呢?在本次分享中,我们将以事件切入点,基于对事件的运营,通过科学有效的方法和手段来将业务的稳定性具象化,并给出明确的提升稳定性的具体手段和评估衡量标准。

王岩
bilibili 基础架构部
CDN 运维负责人
01
个人简介
王岩,2017年加入B站,负责DCDN、图片 CDN 的稳定性、多活建设和产品运营 ,深度参与点直播 CDN 架构优化以及成本优化项目;目前主要关注强化 DCDN 的流量管控能力以及 CDN 基建成本优化。
02
主题简介
如何降低单用户的VV带宽成本?百万量级异构物理资源如何协同?降费大杀器背后的降本逻辑?本次分享带你解密B站的廉价资源降本之路。

张鹤
bilibili SRE 专家
01
个人简介
张鹤,现就职于哔哩哔哩,负责在线业务SRE相关的工作,主导容量管理平台,混沌平台相关的功能规划和架构设计,参与B站S11,跨年晚会,拜年祭相关的活动保障工作。
主题简介
随着云原生概念的普及,Docker 和 Kubernetes 这两大系统已经被广泛应用于各大公司的云计算平台中,PaaS 相关的容量管理也被提上日程,在稳定的大前提下提高整体资源使用率,快速发现业务存在的容量瓶颈成为一件比较重要的事情,PaaS 容量管理提供一站式容量管理,数据查询运营平台。
你以为这样就完了?
GOPS 全球运维大会
2022 · 上海站
还有更多精彩内容
在等着你

精彩议题抢先看(持续更新中···)

联系我们
商务合作
周静:130 7118 2180 (微信同号)
白小婷:132 6958 7068(微信同号)
门票咨询
李伟:130 2108 2989(微信同号)
白小婷:132 6188 5689(微信同号)
渠道合作
刘欣:158 0111 5386(微信同号)
高维:185 4893 3915(微信同号)
报名通道
长按下方二维码
立享9折优惠 ⏬

历届GOPS大会精彩回顾:
访问大会官网:https://www.bagevent.com/event/8239219?bag_track=JC