上QQ阅读APP看书,第一时间看更新
1.1 事故
之前一段时间,TrainBot仍在进行内部测试,并且暂时只开放给少量客户,所以流量一直在可承受范围内。所有功能都运转正常,系统响应也非常快。为了庆祝TrainBot的发布并推广自己的在线培训课程,Baysoft Training公司将所有的培训课程以二五折销售。然而,这次促销给TrainBot造成了一次远远超出公司预期的流量涌入。Web流量达到之前的300%,运行状况越来越糟糕。网络资源也开始无法正常访问,服务器CPU和内存的占用率达到90%~95%,数据库服务器由于高的I/O速率和大量争用问题勉强正常运行。结果,大部分Web请求的响应开始变慢,大部分第一次访问TrainBot的客户完全无法访问网站。之后没过多久,服务器因为不堪重负而彻底崩溃。