文章出處

 

我們在上一篇博客中設定了架構的目標,只有一個,就是可維護性。完全沒有提性能,這是故意的。

 

似乎程序員都是急性子,或許是被windows冗長的開機時間折磨夠了,有可能是因為提升性能的效果是最顯而易見的……總之,我發現,絕大部分程序員對性能的關注和熱情是無與倫比的!

  • C#剛剛推出的時候,就有人搖頭晃腦的說,“嗯,自動垃圾回收,性能不行吧?”
  • DataSet橫空出世,馬上有很多人寫代碼,在DataSet里插入幾百萬條數據,證明DataSet的性能問題
  • Linq當然更要被罵了,尼瑪用反射?反射是什么,同學們知道么?性能大老虎呀!更不用說那些自動生成的sql了,有我手寫的高效么?
  • ……

所以直到今天,我仍然看到很多程序員無怨無悔的用存儲過程來構建他們的系統,一個存儲過程可以有幾千行!然后,他們很無辜的問,“業務層有什么用?究竟能干些什么呢?”

 

在帶團隊的時候,我最怕講的就是性能有關的問題。你要是不談性能呢,那代碼有時候真心看不下去;你要是強調性能呢,不知道他會給你整出什么幺蛾子出來。其實這就是一個“度”的掌握,所以非常難以用語言予以表示清楚。所以無數次挫敗之后,我只好咬牙切齒的說,“你的代碼,只有一個評判標準,可維護性。性能的問題先不管!”這個答案似乎并不能服眾——尤其是對有上進心的程序員而言。

 

所以,我先專篇講性能,希望能幫助大家更清楚的認識這個問題。

 

一、性能不是不重要,而是他沒有可維護性重要。要理解這一點,首先要理解可維護性的重要(請再讀上一篇我花數周找bug的段子);然后要明白:解決性能問題,我們可以有很多代碼以外行之有效的方法,而可維護性基本上就只能靠代碼了;最后,還是要牢記:沒有犧牲,就沒有勝利!

二、所以,在絕大多數情況下,當性能和可維護性相沖突的時候,性能讓位于可維護性。我們采用其他辦法來彌補代碼性能不夠高的問題。

 

空洞的說教沒有意義。我們還是舉例來說明吧!

 

破壞可讀性

 

前段時間我review代碼的時候發現,這個程序員用Linq之后老是用First()而不是Single(),我就奇怪了,按業務邏輯,返回的值就應該是一個,難道可能會是多個,多個應報異常,不應該取First()就完事了呀?想了一會兒,問這個程序員,他的回答讓我瞬間一種無力感,“First()性能更高呀!”以下為對話實錄:

 

“你怎么知道First()性能更高呢?”我問。

“First()嘛,取了第一個合格的值就返回,就不會繼續查下去了;Single()的話,就會一直查,查出所有數據,然后再取其中的一個。”

“你確定?你知道有一種東西叫做索引不?”

“啊?……”

然后我簡單的告訴他,索引是一種樹狀結構,可以讓查詢更快等等。

“但我還是覺得應該用First()”,他想了一會兒,還是很堅定。

“為什么?”,我不明白了。

“就算有索引加快了查詢速度,但用First()在加快了速度上更快呀!更快總是沒錯的吧?”

“……”,我真不知道該怎么說了,最后突然靈光一閃,“好吧,那你說說,微軟為什么要搞一個Single()方法出來呢?就為了搞出來誤導你們?讓用First()的產生優越感,嘲笑用Single()的?”

他陷入了沉思。

 

評論里還在糾結Single()/First()的同學,請大聲的吼三遍:可讀性!可讀性!!可讀性!!!

發現同學們還在糾結這個細節。好吧,再解釋一下:

1、你怎么知道數據庫用的就是MSSQL呢?你怎么知道就是用的關系數據庫呢?NoSQL不行么?所以,你怎么就知道Single()/First()具體是怎么執行的呢?比如我就要寫個Linq實現,把所有的數據全取出來,然后再在內存里排序,最后取First呢?

2、這里我們考慮可讀性,意思是:讀代碼時,看到Single()就能瞬間知道coder的意思是取唯一的一個;看到First()就知道coder的意思是要取第一個。和性能沒關系,如果一定要糾纏性能,那好:你要確定唯一性,當然要做檢查(包括不唯一時拋異常),這個性能損失是應該的呀;你要取第一個,當然要進行排序,排序也會有性能損失呀!

 

我剛入行的時候,還很是收藏了幾篇文章,比如《高性能編程的十大準則》之類的,里面的內容大致就是,“總是使用StringBuilder,不要使用‘+’;總是使用……,不要使用……”。這類文章下面總是有一堆人叫好,“不錯!”,“謝謝分享!”但慢慢的,我就對這些文章產生了懷疑(也應該感謝園子里的老趙,csdn里面的sp1234之類的大神);直到很后來,我才明白為什么這種說法是膚淺的;而只有通過上面的對話,我才能清晰的把我的理解說出來。

 

所有這些犧牲性能的簡單封裝,都是有其目的的;而其中一個很重要的目的,就是為了提高可讀性。你為了性能,故意不使用這些現成的封裝,通常,喪失的就是可讀性。

 

想當然

 

繼續上面這個例子。最開始的時候,這個程序員關于性能的考慮其實是想當然的。這種想當然的情形很多,大致有這幾種:

  1. 自己的理解完全就是錯的
  2. 自己的理解不能算錯,但實際上底層已經對該問題做了優化
  3. 自己的理解沒錯,底層也沒優化

第1、2種比較好理解,第3種為什么也說他“想當然”呢?因為沒有和硬件環境相契合。

 

最簡單的例子就是“緩存”。比如面試的時候,問你一個問題,“緩存能不能提高性能?”請注意,這是一個陷阱。答案應該是:“不一定”。幾乎所有的人都認為,緩存可以迅速改善性能,是因為今天計算機的CPU和磁盤運行速度,遠跟不上內存的發展。但即使如此,無節制的緩存,一樣可以拖垮整個系統。

 

類似的例子還有很多。你沾沾自喜,我節約了一次磁盤讀寫的時候,你同時增加了CPU的負荷;你優化了算法,減少了CPU的運算,但其實增加了內存的壓力……天下沒有免費的午餐。同樣的代碼,隨著數據的增加,硬件的改變,會呈現出截然不同的性能表現。

 

所以,開發過程中,很多的“優化”,其實只是你的想當然。與其這樣想當然的優化,不如在拿到性能測試結果之后再有的放矢的進行優化。這時候,又回到了我們之前說的,是不是代碼的可讀性更重要?這樣你才能迅速的找到該優化的瓶頸啊!否則,一堆亂七八糟看都看不懂的代碼,你怎么去優化,你連該優化的點都找不到。

 

難以維護

 

另一個搞笑的例子是關于我自己的。創業家園項目里有一個功能:顯示博客正文的同時提供一個上一頁下一頁的鏈接。慣常的做法就是直接在數據庫里查就是了,但我總覺得不對,這樣做兩次查詢有必要么?能不能優化?于是我想到了一個“絕妙”的點子:為什么不直接在博客里存儲上一篇和下一篇的Id呢?這樣我一次性數據往返就能取到所有數據了嘛!各位同學是不是覺得我這個主意很棒?

 

噩夢由此開始了。

 

首先,我們是想在發布博客的時候,設置他的上一篇和下一篇。但是,上一篇好設置,下一篇呢?還沒有啊!怎么弄,就只好在博客發布的時候,設置他的前一篇,同時設置他前一篇的后一篇。

然后,我們新添加了一個功能,除了上一篇下一篇以外,還需要在當前博客所在分類中的上一篇和下一篇。怎么辦?再加字段唄。所以,博客里就有了Previous, PreviousInCategory, Next, NextInCategory。這時候,就感覺到有點不妥,但還可以接受。

接著,出現了一個問題,上一篇下一篇博客被刪除了,怎么辦?這個過程,就相當于從一個雙向鏈表里移出一個節點一樣麻煩。頭開始有點大了。

再接著,博客除了發布刪除以外,還有各種其他狀態,比如被屏蔽。而且被屏蔽之后,能否顯示和當前用戶又有關系。當前用戶是普通用戶,不能閱讀;當前用戶是作者自己,就能夠閱讀。怎么辦?首先,屏蔽的時候,要設置上一篇下一篇;屏蔽取消的時候,還是要設置上一篇下一篇。然后,上一篇下一篇得根據當前用戶不同變化的這個問題,基本上就傻眼了……

 

最后流著淚把辛辛苦苦折騰了好久的代碼全改回來,就通過數據庫查唄,多么清晰簡潔的邏輯啊!性能問題?首先,這樣做造成了性能問題么?然后,就算有問題,用一個緩存能解決不?

 

合理浪費堆硬件

 

說了這么多,不知道有沒有引起同學們的反思。可能大家還是過不去心里那道坎:明明有一種性能更高的方法我們為什么不用?

 

因為浪費唄!

 

什么?你有沒有搞錯?我的代碼,至少省了一塊內存條!那是你還沒從“窮學生”的角色里轉換過來。你花一周的時間對代碼進行了優化(就先不考慮你的優化帶來的維護成本增加了),為老板省下了一塊內存條的錢。你以為老板會拍著你的肩膀表揚你么?老板打不死你!

 

兄弟,賬不是你那樣算的。你是學生的時候,你的時間成本是0;但你進入工作崗位,每一天都是要發工資的。

 

通過代碼來調高性能,是一種無奈——對硬件性能不夠的妥協(參考:80年代游戲開發者的辛苦困境。這樣寫性能就高,但為什么現在沒有誰再這么寫代碼了?)。否則,絕大多數情況下,堆硬件比優化代碼的效果好得多,而且便宜得多。硬件的成本按摩爾定律往下降,我們程序員的工資也能按摩爾定律減么?

 

明明window 10 比window 95更耗性能,為什么今天沒人用window 95?為什么VS 2013要10G的空間我們都還屁顛屁顛的趕緊裝上?為什么現在大家都用C#,沒人用匯編?我們站在人類文明積累的今天,就應該理所當然的享受這一切成果。有打火機你不用,你要鉆木取火。如果你是因為要學貝爺荒野求生裝逼,可以理解;如果你說你是因為怕浪費天然氣,我……我……我怎么說你呢?“給做打火機的一條活路,行不?”同樣的,程序員大神同學,你就當做好事,給下面寫底層做硬件的一條活路吧!你的代碼都是010001000010000001010101……了,你讓其他人怎么活啊?

 

最后,我突然想到的一個程序員為什么對性能如此敏感瘋狂,對可維護性毫不在意的一個可能原因:

  • 性能很好理解,卡得要死和跑得飛快;可維護性很不好理解,至少得跑個兩三年才能體現,那時候,誰知道爺在哪里偷著樂呢
  • 性能上不來,程序員只有羞愧的低著頭,都是我的錯;需求有變更,開口就罵,“哪個SB又要改……”;

大家覺得是不是這樣的?所以,愿意把代碼百煉成鋼繞指柔的人少。想來,是一種莫名的悲哀和凄涼。

 

最后最后,有一些我能想到的名言警句供大家參詳:

  • 過早的優化是萬惡之源
  • 優化首先需要找到性能“瓶頸”。否則,任何人都可以隨手一指,“這段代碼需要優化”。
  • 可讀性更強的代碼總是更好優化
  • 硬件永遠比軟件便宜

 

忘了說我的項目了。目前主要集中在創業家園項目的開發上,正試圖從svn轉成git源代碼控制。不太懂Git,說起來都是淚,懂的同學幫幫忙吧!


文章列表




Avast logo

Avast 防毒軟體已檢查此封電子郵件的病毒。
www.avast.com


arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()