今天早上7:00開始的從阿里云虛擬機到物理機的切換(詳見切換至物理機驗證“黑色1秒”是否與虛擬機有關),由于遭遇阿里云網絡問題提前結束,14:38更改了DNS解析將流量切換回虛擬機。
網絡問題是我們在14:30左右發現的,當時用瀏覽器打不開網站。用Firefox測試,顯示連接超時。
Ping發現很多丟包:
780 packets transmitted, 737 packets received, 5.5% packet loss
round-trip min/avg/max/stddev = 9.142/10.310/25.092/1.248 ms
從服務器上的Windows性能監視器看請求量沒有明顯變化,可能是部分網絡線路的用戶受影響。我們用的是上海電信的網絡,用其他網絡測試,可以正常訪問。
不知道園子里有多少朋友受到了這個網絡問題的影響,如果您遭遇了,請諒解由此給您帶來的麻煩!
我們通過IIS日志進一步分析了物理機的網絡情況。物理機用的是云服務器的公網網絡,沒有走SLB的網絡。
分析的時間段是7:10-14:30,分析的指標是time-taken。time-taken的記錄開始于http.sys接收到來自客戶端的請求的第一個字節,結束于在將響應內容發送給客戶端后,http.sys收到客戶端對最后一個TCP包的ACK或者客戶端重置了TCP連接,所以time-taken包含了網絡延遲。
【IIS日志分析情況】
請求總數:9787509(978萬),超過10秒的請求數:25331(占比0.26%),超過1分鐘的請求數:4058,最長time-taken:545秒(9分鐘)。
這個網絡情況不容樂觀。而如果走SLB,網絡情況會好很多。
【物理機測試情況】
未出現黑色1秒,但由于觀察時間不夠,不能最終確認。
在物理機上觀察到QPS為1149時,CPU占用只有18%(32核)。而在虛擬機上,QPS達800時,CPU就100%(8核)。
文章列表