服務(wù)器維護(hù)分成兩種,緊急維護(hù)和日常維護(hù)。
1、緊急維護(hù)
緊急維護(hù)一般就是硬件故障或者嚴(yán)重Bug。這個(gè)時(shí)候是各個(gè)團(tuán)隊(duì)最緊張的時(shí)候。每個(gè)團(tuán)隊(duì)都忙個(gè)不停。
運(yùn)營團(tuán)隊(duì)會(huì)發(fā)布公告,安慰玩家,統(tǒng)計(jì)損失,編寫故障報(bào)告,評(píng)定故障等級(jí)等等
策劃團(tuán)隊(duì)可能會(huì)考慮Bug的影響程度,決定要不要回檔,或者賠償什么,賠償會(huì)不會(huì)影響經(jīng)濟(jì)系統(tǒng)等等。
程序團(tuán)隊(duì)最重要的是縮小Bug的影響,比如熱更新屏蔽玩法,然后解決Bug。有時(shí)候硬件故障會(huì)導(dǎo)致整個(gè)服務(wù)器某些結(jié)點(diǎn)負(fù)載不均衡,或者萬一數(shù)據(jù)庫服務(wù)器掛了就得趕緊切數(shù)據(jù)庫。
QC團(tuán)隊(duì)會(huì)繼續(xù)測試一下,包括改好的版本,QC老大一般有一票否決權(quán)決定某個(gè)版本是不是放。
SA團(tuán)隊(duì)會(huì)有人值班緊跟,如果硬件問題就聯(lián)系IT去換啊之類的。
2、日常維護(hù)
日常維護(hù)就流程化多了
運(yùn)營團(tuán)隊(duì)會(huì)提前放出更新內(nèi)容,做好新玩法預(yù)熱
策劃會(huì)最后在內(nèi)服上跑一跑玩法看看有沒有問題,然后等著正式開服以后去論壇看玩家反應(yīng)
程序一般就是更新代碼,部署到服務(wù)器內(nèi)部測試,如果架構(gòu)有改動(dòng),就和SA配合一起跑腳本改架構(gòu)。同時(shí),另一撥人會(huì)跑一堆腳本,包括和計(jì)費(fèi)的對(duì)賬腳本,導(dǎo)數(shù)據(jù)的腳本,更新各種榜單的腳本,預(yù)熱數(shù)據(jù)庫和cache的腳本等等。每個(gè)人也會(huì)對(duì)自己的模塊再測試一遍,然后會(huì)盯著各種警報(bào)
QC團(tuán)隊(duì)也會(huì)在服務(wù)器上面把本周新玩法和主流程再測試一遍。
其他支持團(tuán)隊(duì)就是日常配合工作。
另外看到很多答案都說重啟服務(wù)器,其實(shí)我想說,我們真的很少重啟服務(wù)器的。每次重啟代價(jià)都很大。除非硬件更新或者特殊情況是不會(huì)重啟服務(wù)器的。
其實(shí)一般意義上講服務(wù)器重啟可以理解為兩種,一種是硬件重啟,一種是服務(wù)器進(jìn)程重啟。硬件重啟比較少,服務(wù)器進(jìn)程重啟基本上是必須的。
很多人問為什么硬件重啟代價(jià)很大。感覺大家的回答。我直接把評(píng)論補(bǔ)充上來。
如果是自動(dòng)啟動(dòng)的程序的話沒有問題,但是服務(wù)器很多系統(tǒng)配置和軟件設(shè)置都要開機(jī)后重新折騰,同時(shí),還要和其他的服務(wù)器通信,恢復(fù)到啟動(dòng)前的狀態(tài),或者從其他服務(wù)器同步信息,正確處理關(guān)機(jī)期間的各種操作,事情多,任務(wù)重,出錯(cuò)概率大,都不愿意重啟吧。
還有人提問為什么維護(hù)了這么長時(shí)間。我想說,請(qǐng)去客服專區(qū)或者論壇發(fā)帖,會(huì)有一大波運(yùn)營人員過來安撫你的。
還有人抱怨一個(gè)禮拜維護(hù)兩次這種。我想說EVE這種神作是每天早上維護(hù)一次呢。維護(hù)也是為了大家能更好地游戲啊。(吐槽一下誰讓EVE用的是Windows服務(wù)器呢。)