了解最新公司動態及行業資訊
【IT168點評】目前,國內IT運維仍處于消防初級階段。除了骯臟的工作,這是很累的工作,而且每天都很累。什么樣的網絡中斷、應用卡頓、響應速度慢、服務器宕機、各種突發故障都可能導致業務交易失敗,查找系統運行日志特別費時費力。維吾爾族人員急忙轉身。作為運維工程師,你有沒有遇到過非常辛苦的經歷?社區內的網友們一直在喊叫,個個都在訴說著自己的傷心往事。 ()
回憶剛加入公司時的情景,“剛加入平臺的時候,有很多問題等著我去處理,DMZ被ARP攻擊,所有服務器無法正常通信。平臺每三五點就有問題,客服態度很好,半夜給我打電話,還好大部分問題都可以遠程處理,不然每次都要跑公司,就差一點了辛苦了。那天晚上我不用睡覺了。今年的五一是我一生中最難熬的時候。,休息三天,兩天半夜被吵醒,還得跑公司人一晚上。后來,我試圖查殺服務器上的ARP病毒,但是該軟件將業務程序作為木馬殺死,天哪!我在想我是否要在試用期之前被解雇。幸好發現有備份程序,我復制了備份程序,啟動它,就可以了凱德我心情好多了。還有一次,公司的平臺網站突然不能訪問了。后來經過各種排查,發現公網IP被屏蔽了。我問中國電信。原因是國內IP使用了國外域名。國內IP必須使用國內域名,域名需要備案后才能使用。解封 IP 還要一個月,所以我和開發者加班加點把平臺遷移到亞馬遜。”
經過三年的運維,我遇到了很多困難,但既然做了這件事,我就必須認真對待。他說,“我咬了幾次牙,堅持了下來。我既然做運維,也是一個重點行業的運維,管理著單位的幾個核心系統,必須24天開機。”小時,30秒內接聽,30分鐘內接聽,30天內到達現場,單位每周末晚上8點黃金時間打個電話,看我們的電話是否暢通。一個月接不到3次電話,我們就會被炒魷魚。外包很差。
說說我遇到過的最苦澀最無奈的案例。作為一個底層的硬件運維工程師,難免會被應用運維欺負,因為他們發現應用和業務有點慢或者真的有問題。如果有問題,他們指責它是硬件和網絡問題,所以讓我們檢查一下。曾經,業務對FTP業務的反應太慢了。讓我們檢查一下原因。我們檢查了各個方面,沒有發現任何問題。業務方面不得不讓我們檢查。更換了備件,CPU,電源,主板,主機起來了,生意也活不下去了。后來換了整機。是的,整機,業務還是死機,然后業務遷移到另一臺主機上,業務還是上來的。不,我們已經覺得沒必要說什么了,而且已經證明和硬件沒有關系,但是人們仍然不承認FTP有問題。以上所有工作都是在下午 6 點到凌晨 3 點之間完成的。因為以上證明硬件沒有問題,所以必須按規定更換整機。我們想,雖然現在FTP還沒有啟動(凌晨3:00),但業務方并不著急,想快點更換整機。后來領導怕麻煩,就先動手吧。我把它擦掉了。以后換業務會比較麻煩。我又申請停業了,又寫了實施方案。我說服了領導。后來快4點了,其他主機又開始營業了,我們就陸續回家了。但早上8:00,突然接到電話,說要趕緊趕到現場,換成整機。 CNM!”
從事運維工作5年多的雙十一也在吐槽:“每天不去救火的路上,你就是在救火。想一想,很辛苦了,24小時待命,只能在家附近放假。四處閑逛,最激動的就是數據庫里的數據丟失了,公司大老板驚慌了。更難沒有備份。當時我想死啊~~我們公司也很重視雙十一,但是我們對上線的架構做了一些前瞻性的規劃,比如比如流量控制,部署ESB消息隊列,服務降級,合理調整批處理計劃。為了避開各個電商支付請求的業務高峰~所以雙十一的加班就是在睡覺。如果有的話問題,監控組的同事ca n 去休息室喊~ 最大的問題是單筆交易。某個高峰的時候交易時間稍微長一些,也沒有core crash()之類太刺激的東西,對于運維工具,我感覺比較定制,畢竟每個公司的業務不一樣,當然對于一些基本的需要的話,還是可以通過一些開源工具來解決的,比如cacti,等等。我覺得監控應該不僅僅是監控基礎資源,更多的應該是監控業務,比如監控業務流程,每個人的響應時間業務等等。只有這樣才能把運維工作做的更好~就這些了。其實還有很多細節是我們運維工程師需要掌握的,比如你負責的系統最大容量,存儲IOPS多少會成為瓶頸或者影響業務的性能,是否可根據業務發展等順利進行線上擴容。”
更震撼的是一位運維工程師離開我們的故事,“我記得我負責之前公司的門戶架構的設計和實現,然后我和導演不爽,他緊急招了幾個系統工程師和一個dba接替我的工作,一步步把db、媒體資產和負載均衡設備從我的工作中分離出來~我記得當時的數據庫管理員剛入職行業,而且我也沒有做運維工作~他來的第二天,主任就讓他投產了,結果三個生產數據庫集群中的兩個都被關閉了,最后我晚上打車到機房通過linux救援模式恢復,系統參數恢復到環境正常運行,還有一次重啟了其中一個db但沒有告訴我重啟化。結果,應用程序有時可以被訪問,有時訪問超時。導演堅持說我的web集群配置有問題。我當時就想起來了。我從晚上 8 點或 9 點到凌晨 2 點收到它。已經快凌晨3點了。 dba把我拉下來,悄悄告訴我他昨天下班后重啟了db,并沒有告訴我重啟web服務。什么生產會出現這種問題,最后通過重啟所有的web集群解決了。正是這次生產事故讓我意識到是時候離開這里了。當然,我沒有應dba的要求告訴任何人這件事。我覺得現在找工作不容易,沒必要讓別人丟了工作。其實我這里想表達的要點如下:
文章一、作為運維人員,你必須對生產系統保持敬畏,對你正在執行的命令有深刻的理解;
二、公司就像一個營地,我們只是一個士兵,我們不必為別人的錯誤買單~如果不是你的問題,就大膽說吧。既然是屌絲,那我們在工作中向誰示弱呢~~
第一家三、公司是我們的父母,當然要感恩。當然,每家公司都有其不盡人意的地方。是時候離開了。 ~ 但走之前保持你的風度
文章四、即使這家公司的領導是個混蛋,他仍然是你的領導。就算他不把重任交給你,沒能找到你的亮點,至少請尊重他的立場,否則你會喜歡我,我會輸得一塌糊涂~我付出了太多,但我無法分享公司從成立到發展壯大所帶來的豐厚回報。記住永遠不要與領導作對,即使你掌握了它。如果你擁有公司所有的技術,不要自以為是。暫時不可替代并不意味著永遠不可替代。作為領導者,殺一個人太容易了,否則他就不是領導者,所以你至少應該時刻對領導者假裝謙虛。有禮貌~這樣你會感覺像水里的鴨子。 "
從入職時的初級運維工程師到轉業時的高級運維工程師,他們在企業中扮演著怎樣的角色?談到前景,有人高興,有人悲傷!
確實表現出一種不慌不忙的風范。”工作之余,他目光遠大,在緊急救災救災中,通常要做好計劃和監控it運維外包,以減少突發事件的發生。當突發事件發生時發生時,需要果斷的判斷力和技巧。處理能力。”
說白了,“運維工程師在業務正常的時候就是閑人,偶爾需要發布和部署新平臺,出現問題就得趕緊解決問題,因為越多時間越長,能力越差,老大。心情不好就會被炒魷魚。因此,運維工程師在企業中起著舉足輕重的作用。維修工程師能力不錯,但是在老大眼里,他可能覺得自己花錢買了個閑人,看不出你怎么穩定一個經常出問題的平臺,操作種類很多,一個大公司有專門的運維部門,有的負責業務運維,有的負責網絡運維,也有負責硬件運維的維護和開發運維。
我非常看好運維工程師的職業前景。其實,辛苦是低級的運維。當你成為高級運維、運維主管、運維經理、運維總監后,你會發現,越往上走的越少,越不需要半夜起床處理,至少對于普通的事情。 “
但他的臉色卻是平靜的:“a.運維工程師應該在企業中扮演管家的角色,至少要保證企業系統(硬件和軟件)的日常正常運行,并且在同時可以對企業信息化建設進行前瞻性規劃和運營(購買硬件/引入各種系統/提出系統集成等),能夠充當系統開發者和用戶之間的橋梁和潤滑劑(操作的好處是系統用戶比系統用戶更懂開發,員工更懂系統)
b.對其他行業不熟悉,但是在旅游行業,由于業務比較復雜,但是從業者的進入門檻低,所以業務系統的開發者一直在抱怨用戶愚蠢/懶惰/亂操作等。 ,我也從同行那里了解到,基本上每個旅行社都是這樣,每個旅行社的系統使用深度基本上都很淺。他們只使用信息錄入和同步的功能,深入的流程監管基本上不是幾家公司能做到的。差異往往是因為運維團隊跟不上,不能起到橋梁的作用
c。運維團隊所知道的最專業的就是順豐。據用友小伙伴介紹,順豐運維團隊在對接用友開發團隊時,已經第一時間準備好所有材料。 ,甚至一些用友用戶都沒有注意到;
d。我覺得運維工程師的職業前景會越來越重要,因為隨著企業信息化越來越普及和深入,對運維工程師的要求也會越來越高。值類型也會越來越突出;”
正經話,為運維工程師喝彩,“我之前和一個EMC老工程師聊過一個公司裁員的事情,他說如果一個公司達到了運維裁員的程度it運維外包,那么這個公司快要死了,好的運維工程師確實能把系統維護得很好,不是因為工程師解決各種疑難故障的能力高,而是因為他們有良好的運維習慣,比如詳細記錄各種變化再小,應先應用,再操作,最后記錄,便于日后故障排查。
目前只有非常大的公司才會重視運維人員。其他公司把運維人員當做苦力,待遇不高。他們不怕人員流失。你可以走了。您可以在離開之前與其他人清除情況。這種公司不明白,不管怎么交接,新維護人員熟悉系統需要一段時間,交接過程中容易漏掉問題。久而久之,遺留的問題會越來越多,以后問題爆發的時候就很難處理了。
我建議,如果你做運維,盡量去一些大公司和專業公司,這樣你接觸到的知識和流程更專業,更規范,有利于以后發展。正所謂近朱為紅。 "
臺上一分鐘,臺下十年。有沒有什么“萬能”的工具可以解救運維人員的痛苦?大家已經開始提建議了。最受關注的是監控工具,其次是幫助文檔。
:“監控還是比較大的,用cacti,然后就是ssh客戶端putty,上傳下載等Linux工具,還有性能和進程查看命令,mysql相關命令集等。”
:“最常用的工具自然是SSH工具。我個人比較喜歡用它,因為它可以和xftp一起使用,而且好用。另外,這個工具的優點是它不需要公共網絡IP。建立遠程桌面連接。有了這個工具,我可以在家里遠程處理問題,而且這個軟件還有一個移動客戶端。當我在外面玩的時候,我也可以遠程解決平臺上的小問題,因為我通常不會出門不用帶筆記本電腦,而且很難找到電腦來處理,所以用這個工具還是蠻方便的。
還有一個遠程桌面工具RD,它是微軟開發的一款移動客戶端軟件。它可用于從手機連接到服務器。因為習慣了,所以用的比較少。如果你管理 MYSQL,我推薦它。這是一個圖形界面管理工具,非常好用。我推薦用它來監控,它幫我發現了很多問題,而且它有自己的報警功能,可以一起使用。
:“網絡分析工具,比如監控軟件,比如,等等。目前主要用于監控網絡設備和服務器的流量和負載,準備學習。”
除了監控工具外,補充一句:“如果真的是萬能工具,就是幫助文檔,不管是給自己、同事還是前臺用戶,只要不斷積累,就會變成越來越實用了,特別是團隊內部的幫助文檔,盡量把每一個解決思路都寫出來,慢慢的你會發現大部分問題可以用幾個常用的思路來解決。之前的團隊甚至在我離開之前就開始了。實習生能做日常維護是因為有幫助文檔,很多操作都很傻,但是這些都需要團隊的不斷積累。”
本話題由大華IT專欄發起。更多話題討論詳情,請點擊鏈接:
2015第六屆中國數據庫技術大會(DTCC)將于4月16-18日在北京新云南皇冠假日酒店舉行。將有一個關于數據庫操作和維護的專題會議。大咖將為您帶來最新的尖端科技。歡迎大家報名: