网易云信:如何保障一场千万级大型直播
风险预案这块,包含了各类资源故障、上下行链路质量、地区性网络故障、CDN异常流量水位等在内的场景应对,其中资源故障包含了机器宕机、机架整体断电、堆叠交换机宕机、机房外网出口不可用,我们均进行了风险预案演练覆盖。下面列举几点网易云信大型直播解决方案中的部分预案机制: ·如果因为误操作等导致非正常解密等,网易云信可在推流不中断的情况下,动态中止流加密,客户端无任何感知影响。 ·某家cdn在某地区运营商出现大面积故障瘫痪,该地区相应运营商线路的QoS指标会大幅度下降并触发报警,网易云信将故障cdn在该地区运营商进行黑名单处理,动态停止对其的调度,将流量调度至正常提供服务的cdn厂商。 ·在两路热流均正常的情况下,但是正在分发的一路出现质量问题,方案可支持手动触发主备切换,让监控数据质量更好的另一路流参与分发,客户端感知时间在1s以内。 ·因为一些不可抗因素,某机房出现大面积故障整体不可用,触发链路报警,此时我们会紧急将流切至另一机房,故障感知与恢复的时间在一分钟内。 四、结 语 依靠网易云信的千万级大型直播方案,此次活动圆满完成,整体推流链路可靠稳定,下行流量分配合理,相关故障预案完整充分并真实发挥作用。干货万千,纸短情长,欢迎登陆网易云信官网咨询网易云信大型直播方案,了解更多技术细节。 作者介绍 费曼,网易智企服务端开发工程师。硕士毕业于华中科技大学电信系,2016年加入网易云信,热衷于大规模分布式系统和音视频相关技术,爱好文学、体育和电影。 (编辑:应用网_阳江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |