如何零基礎(chǔ)快速入門運(yùn)維?如何成為運(yùn)維技術(shù)大牛?成為運(yùn)維經(jīng)理需要什么樣的能力?我想很多運(yùn)維工程師都會(huì)有這樣的思考和問題。要知道"不想成為將軍的士兵,不是好士兵(拿破侖)"。
下面就隨達(dá)妹一起來看看運(yùn)維工作都需要干些什么。。。
1. 域名
從買域名開始,要買多個(gè)域名,50個(gè)甚至100個(gè)。分為主域名和推廣域名(給推廣鏈接用的)。要從godaddy上買域名,因?yàn)檫@里的域名穩(wěn)定,不會(huì)出現(xiàn)被攻擊等事情。同時(shí)還要買域名保護(hù),這樣互聯(lián)網(wǎng)用戶ping這個(gè)域名就解析不到真實(shí)的服務(wù)器地址。
同時(shí)域名解析的操作不要在godaddy上進(jìn)行,要把解析的操作放在cloudflare上或者dnspod上進(jìn)行操作,也可以放到zndns上(這個(gè)dns可以做到一個(gè)域名解析多個(gè)IP地址,根據(jù)就近原則,把最快的IP地址解析給用戶。)也可以自己搭建dns服務(wù)器,在godaddy上只想到自己搭建的dns服務(wù)器就可以了。這樣,修改dns指向的時(shí)候會(huì)更快。
2. CDN
一定要買cdn服務(wù)。如果出現(xiàn)部分用戶訪問不了就使用cdn服務(wù)??梢詮腸loudflare上購(gòu)買cdn服務(wù),這樣域名解析到cdn上,然后cdn解析到肉盾擊還是那個(gè),然后肉盾擊指向核心服務(wù)器上。Cdn充當(dāng)一個(gè)緩存和轉(zhuǎn)發(fā)的作用,大流量攻擊的時(shí)候他可以防御至少200G的攻擊。Cdn是全球緩存的。
3. 圖片服務(wù)器
在國(guó)內(nèi)租用幾臺(tái)服務(wù)器做圖片緩存服務(wù)器即可,這樣提高訪問速度。其實(shí)nginx本身就是一個(gè)圖片緩存服務(wù)器。
圖片服務(wù)器和其他服務(wù)器要分開,肉盾擊可做圖片緩存。
4. 服務(wù)器機(jī)房
選擇機(jī)房太重要了,要服務(wù)質(zhì)量好的,還要高防好的,還要可靠性高的,還要相應(yīng)及時(shí)的,還要能隨時(shí)可以查看服務(wù)器狀態(tài)的,最重要還要服務(wù)態(tài)度好了。
機(jī)房要買香港九河(用戶核心服務(wù)器),美國(guó)圣安娜機(jī)房(用于肉盾擊)(雖然慢,但是安全高防做的真好,大流量攻擊的時(shí)候,這里的機(jī)房還是可以訪問,所以,雞蛋不要放在一個(gè)籃子里頭,要各個(gè)等級(jí)都有才叫好的,國(guó)內(nèi)機(jī)房快,但是高防效果差,美國(guó)機(jī)房慢但是高防效果好)
5. 主頁
一個(gè)主頁,就是招商或成為打廣告的網(wǎng)站,可以租用云主機(jī),這樣被打死就被打死吧。里面可以有一個(gè)鏈接,指向游戲首頁,這個(gè)鏈接可以是帶端口號(hào)的,那就簡(jiǎn)單了。
也可以是不帶端口號(hào)的,這時(shí)候就一定要用cdn服務(wù)器,或者使用免備案機(jī)房,把肉盾擊放在免備案機(jī)房,因?yàn)閲?guó)內(nèi)搭建網(wǎng)站都是要備案的,博彩這個(gè)行業(yè)是被禁止的,為了避免域名或者IP地址被和諧了(gwf)所以要用免備案機(jī)房。
或者就把肉盾擊也放到香港或者臺(tái)灣或者韓國(guó)等等機(jī)房。這樣用戶可以不使用端口號(hào),直接用域名就可以訪問咱們的網(wǎng)站。
6. 監(jiān)控系統(tǒng)
要個(gè)網(wǎng)站要有監(jiān)控系統(tǒng),實(shí)時(shí)監(jiān)控服務(wù)器是否有攻擊,功過查看日志是否激增,還要把日志放到日志服務(wù)器上(syslog服務(wù)),使用cacti服務(wù)可以把日志放到cacti上。網(wǎng)速是一定要查看的,網(wǎng)速激增則證明一定是有攻擊。
每天要看日志,要用日志分析軟件,看看訪問源是單一訪問源還是多個(gè)不同的訪問源.監(jiān)控服務(wù)器要有報(bào)警功能,一旦情況異常就要立刻報(bào)警,然后起床處理攻擊。
7. 防攻擊
攻擊一般看情況而定,一般的攻擊都是直接攻擊域名。小量的攻擊可以通過nginx和iptables本身的防御功能就防掉。大量的攻擊由于直接把網(wǎng)絡(luò)帶寬占用滿了,服務(wù)器無法正常相應(yīng),只能依靠機(jī)房的高防了。
所以要買大量的高防,建議至少200G。如果攻擊源是單一IP或者幾個(gè)IP,那么就讓機(jī)房把這幾個(gè)IP給屏蔽就可以了。遇到cc或者ddos攻擊,只能靠機(jī)房解決。一臺(tái)服務(wù)器被打死后,需要立刻把域名指向另一臺(tái)服務(wù)器,(或者直接把域名指向百度)。
大量的攻擊還要使用cdn,讓cdn直接指向核心服務(wù)器就可以了,這樣能快一點(diǎn),讓用戶還可以玩??傊罅髁抗羰遣荒芡耆乐沟?。
8. 冗余
一個(gè)網(wǎng)站一定要有冗余,比如現(xiàn)在是1000人同時(shí)訪問的并發(fā)量,一定要讓網(wǎng)站的負(fù)載達(dá)到2000人的并發(fā)量,要不然一搞活動(dòng),網(wǎng)站負(fù)載不了那么多人就完了。
9. 服務(wù)器
服務(wù)器的配置,要用三網(wǎng)卡,一個(gè)用于用戶連接,對(duì)外的訪問(要好的網(wǎng)卡)。一個(gè)用于內(nèi)網(wǎng)服務(wù)器之間的訪問使用。一個(gè)用于ssh管理,這樣大量攻擊的時(shí)候咱們還可以操作服務(wù)器。
每個(gè)網(wǎng)卡還要多個(gè)IP地址,這樣防止某個(gè)IP被屏蔽了。國(guó)內(nèi)網(wǎng)絡(luò)和國(guó)外網(wǎng)絡(luò)經(jīng)常會(huì)有IP不好用的情況。硬盤至少要鏡像(raid 1),cpu要兩路的,雙電源,總之不要有單點(diǎn)故障。至于肉盾擊的配置可以低一些,甚至臺(tái)式機(jī)的配置都可以,但是網(wǎng)絡(luò)一定要好,尤其是和核心服務(wù)器之間的網(wǎng)絡(luò)一定要好。
10. 數(shù)據(jù)庫
數(shù)據(jù)庫要做主從復(fù)制,要有異地備份,nginx服務(wù)器要做集群,就是upstream。前臺(tái)(提供用戶訪問頁面)和后臺(tái)(員工管理界面)要用兩臺(tái)不同的機(jī)器,不要互相影響。其余的服務(wù)可以使用一臺(tái)虛擬機(jī)完成。
這樣可以省錢,郵箱直接買google的gmail企業(yè)郵箱就好了,非常好用,最好沒人一個(gè)?;蛘吖緝?nèi)部搭建自己的聊天軟件(最好還錢買聊天軟件)。
11.測(cè)試環(huán)境
測(cè)試環(huán)境要三套,開發(fā)人員電腦上自己的環(huán)境,要局域網(wǎng)一套測(cè)試環(huán)境,互聯(lián)網(wǎng)一套測(cè)試環(huán)境,生產(chǎn)環(huán)境。局域網(wǎng)的測(cè)試環(huán)境一定要穩(wěn)定,可以買一個(gè)機(jī)柜等等的網(wǎng)絡(luò)設(shè)備放在一起,不要用普通電腦。局域網(wǎng)要有svn或git的代碼管理工具。充分測(cè)試后在上傳到生產(chǎn)環(huán)境。
12. 肉盾擊和核心服務(wù)器
肉盾擊和核心服務(wù)器之間一定要可以使用ping命令,這樣可以看看那個(gè)IP地址不能使用了,網(wǎng)絡(luò)連通性都可以看出來。
13. 運(yùn)維人員
至少兩個(gè),如果有運(yùn)維經(jīng)理一個(gè)運(yùn)維人員就夠了。這樣所有運(yùn)維工作必須有操作文檔,兩個(gè)人互相協(xié)調(diào)工作,不需要倒班,但是24小時(shí)待命。網(wǎng)管一個(gè)就夠了。
普通的運(yùn)維部門大概就這樣,如果是大的網(wǎng)絡(luò)架構(gòu),會(huì)有自己的數(shù)據(jù)中心機(jī)房到時(shí)候在安排人手。
14. Linux系統(tǒng)優(yōu)化和安全
要有優(yōu)化和安全配置,比如說nginx基于cpu的優(yōu)化,每個(gè)程序基于cpu和內(nèi)存的限制。
所有密碼要有3個(gè)月就修改一次,尤其是域名的賬號(hào)和郵箱密碼,域名是最重要也是最脆弱的環(huán)節(jié)。
15. 局域網(wǎng)
局域網(wǎng)一定要穩(wěn)定,可以買兩條網(wǎng)線,至少10M帶寬,還要買一個(gè)移動(dòng)wifi,給員工手機(jī)上網(wǎng)。
16. 機(jī)房
如果是大型網(wǎng)絡(luò)架構(gòu),那得有自己的核心機(jī)房,就不是租用機(jī)房了,每個(gè)崗位都是若干人組成的,包括運(yùn)維工程師,數(shù)據(jù)庫管理工程師,網(wǎng)絡(luò)工程師,安全工程師,存儲(chǔ)備份系統(tǒng)工程師,運(yùn)維經(jīng)歷負(fù)責(zé)協(xié)調(diào)各個(gè)部門間的工作。目前就是一個(gè)運(yùn)維就能完成所有的工作。
17. 運(yùn)維工具
運(yùn)維的工具要統(tǒng)一,比如連接數(shù)據(jù)庫使用sqlyog工具,連接服務(wù)器使用crt工具,密碼管理用keepass,上傳服務(wù)器代碼使用winscp工具,等等。這樣運(yùn)維人員之間工作比較好協(xié)調(diào)。
另外運(yùn)維一定要有大量時(shí)間學(xué)習(xí),每天都要上網(wǎng)找新技術(shù),好的資料,最好要懂英文,因?yàn)楹玫募夹g(shù)文檔都是英文寫的。這樣對(duì)運(yùn)維工作很有幫助,而且運(yùn)維技術(shù)實(shí)力會(huì)有很大的進(jìn)步的,為迎接更大的需求做準(zhǔn)備。
18. 災(zāi)備預(yù)案
最后一定要有預(yù)案,就是服務(wù)器一旦出現(xiàn)重大問題,就是解決不了了,這個(gè)時(shí)候就不要去解決這臺(tái)服務(wù)器,使用預(yù)案,把啟用備用方案,盡快讓網(wǎng)站可用。
平時(shí)多做預(yù)案演習(xí),還要多做備份的還原操作,因?yàn)橛械膫浞莶豢捎茫@是常見現(xiàn)象。別到關(guān)鍵時(shí)刻備份不能用,整個(gè)網(wǎng)站就完了。
19. 服務(wù)器安全
要有一整套的安全配置,包括用戶安全,應(yīng)用安全,系統(tǒng)安全,文件安全等。這樣防止服務(wù)器被黑客侵入。
20. 高并發(fā)測(cè)試
一定要做高并發(fā)測(cè)試,模擬同時(shí)在線用戶2000人,看服務(wù)器的負(fù)載情況,要有服務(wù)器高并發(fā)配置,網(wǎng)絡(luò)方面是機(jī)房的事情,但是得選擇最合適的IP地址,最適合的機(jī)房,及出口帶寬。
高并發(fā)是服務(wù)器架構(gòu)的事情,不是單單一臺(tái)服務(wù)器的事情。該花錢的地方一定要花,可以省錢的地方要知道怎么省錢。
21. 運(yùn)維信息
運(yùn)維所有信息兩個(gè)人共享,包括密碼和服務(wù)器配置步驟,由運(yùn)維經(jīng)理帶領(lǐng)團(tuán)隊(duì),打造成一個(gè)互相學(xué)習(xí),技術(shù)實(shí)力雄厚,目標(biāo)一致的和諧團(tuán)隊(duì)。讓每個(gè)人在團(tuán)隊(duì)中都得到自己想要的。
運(yùn)維經(jīng)理的為人就很重要,要不然留不住人,大家心不往一起使勁。運(yùn)維工作技術(shù)不是最重要的,因?yàn)檫@個(gè)職位現(xiàn)學(xué)現(xiàn)用也來得及,所以工作態(tài)度/為人和經(jīng)驗(yàn)是最重要的。
22. 服務(wù)器日志
對(duì)服務(wù)器建立日志,所有服務(wù)器的所有操作都要有記錄,并且寫清時(shí)間操作內(nèi)容。對(duì)生產(chǎn)服務(wù)器操作之前一定要做風(fēng)險(xiǎn)評(píng)估及解決方案。
23. 運(yùn)維工作
應(yīng)用上線后,運(yùn)維工作才剛開始,具體工作可能包括:升級(jí)版本上線工作、服務(wù)監(jiān)控、應(yīng)用狀態(tài)統(tǒng)計(jì)、日常服務(wù)狀態(tài)巡檢、突發(fā)故障處理、服務(wù)日常變更調(diào)整、集群管理、服務(wù)性能評(píng)估優(yōu)化、數(shù)據(jù)庫管理優(yōu)化、隨著應(yīng)用PV增減進(jìn)行應(yīng)用架構(gòu)的伸縮、安全、運(yùn)維開發(fā)工作。