輕松創建全面的運維系統 在市場競爭日益白熱化的形勢下,如何屹立不倒仍是很多企業頭痛的問題。那么一個企業想要擴大版圖,實現帝國規模擴張,在內部運作里必然是少不了網絡運維系統作為支撐后盾,而企業擁有了一個全面的運維系統后也可以減輕運維工程師的負擔。那么一個全面的運維系統應該是怎么樣的?應該怎么做?從哪里開始呢?來看看網強公司總結的經驗。 HOW—怎樣的運維系統才算全面? 一個全面的運維系統,應該包括五個要素:效率、穩定、安全、體驗和成本。 在這5個要素中,效率和穩定應是每個運維人最基礎的本職工作,在此前提下,再進行安全、體驗和成本3個要素考量,一個全面的運維系統將應運而生。 WHAT—具體內容以及執行操作方向 1.效率 這里重點指的是日常運維例行工作的效率,這些是指運維最基礎的工作:資源分配與回收、域名配置、VIP配置、持續集成與發布、應用部署、應用擴容與縮容等。而我們提過的運維自動化,大多是集中在這些工作上,因為這些工作偏日常和重復。 2.穩定(質量) 可以通過監控、全鏈路、強弱依賴、限流降級、容量評估、預案平臺等措施,讓業務運行更加穩定。做好這一點,需要有相對比較獨立、專業的監控和穩定性平臺來支持。 這部分目標是最大程度地保障系統的穩定性和運行質量。即使出現問題,也能夠快速發現、快速響應、快速(自動)恢復。 3.安全 安全,是橫向與運維同等甚至更加重要的專業領域。但同時又是跟運維緊密相關的,運維同樣要關注安全,因為安全出現導致的問題,往往也會給運維帶來沉重的防護和修復成本。我們經常提到的安全類關鍵詞,各類主機安全、DB安全、Web安全、應用安全等等,與此相關的還有漏洞、DDos、CC等。 4.體驗 這里提到的體驗,指的是終端用戶的訪問體驗。對于非功能或非產品的使用體驗,運維最需要關注的是訪問速度。開發人員,可能更多的注意力會放在自己負責的代碼以及該部分的性能問題,不會關注到端到端全流程的性能和體驗。而運維可以站在全局的角度來審視和治理整個端到端的全鏈路性能情況,并給出對應的性能優化建議。 5.成本 成本問題,也就是技術ROI(投入產出比)的問題。當系統規模和體量變大之后,掌控在運維手中的各類資源,將成為整個研發團隊支出的主要占比。如果沒有很好的成本控制意識和策略,資源體量將會持續增大,甚至是翻倍或指數級的增長,對于公司成本會是非常大的負擔和壓力。 那么運維工作者需要考慮到服務器CPU資源利用率的提升(引申出來各種虛擬化、容器或云資源的使用)、IDC&CDN流量帶寬使用的管控,還有人力的投入和成本的管控。如何使得系統能夠更高效地被充分利用起來,如何能夠最大限度的減少成本支出,是我們必須要去考慮的問題。 以上可以發現網絡運維范疇其實能夠延伸到很大的范圍;或者這樣來說,只要最終是跟線上業務運行相關的工作,都是運維要關注的焦點。如果運維僅僅是片面和狹隘地給自己限定一個范圍,無法做到提前統籌和規劃,會很容易變成被動響應的角色。