談談如何從本質上理解SQL語句、存儲過程與ORM之間的聯系和取舍
sql語句又叫ad hoc sql, ad hoc是拉丁語,意思是for this,可以翻譯為“按每一次情況的辦理”。
存儲過程就是stored procedure, 簡寫為sp。
ORM就是對象-關系映射,比如Hibernate。
大多數的.NET程序都是會圍繞sql服務器展開,經常要面臨在這些技術間進行選擇。所以我們需要來理解這些技術的本質。
一,演變
剛開始的時候,只有sql語句,即可以用交互模式一句一句執行, 也可以用批模式執行,多行sql語句一次提交執行。
很快人們發現用批模式執行的一堆sql語言可以用過程的形式,事先存放到數據庫里面,這就變成了存儲過程。
隨著面向對象技術的成熟,從程序中可以自動生成sql語句,這就是ORM。
二,性能
很多人會說存儲過程比sql語句性能好,其實這個說法并不精確。
如果我們把一堆sql,以批的方式一次送入到服務器,那么服務器,會對這一堆sql進行緩存,當下一次再度執行的時候,就好像調用一個”匿名“的存儲過程一樣。
在這種情況下,性能差不多。
但是,如果我們不注意,很有可能,把可以一次提交的sql,變成了多次提交,甚至是每個循環做了一次提交,那么性能就很差了。
也就是說如果使用sql,只要寫法得當,性能和sp區別不大。
同樣的道理,ORM的性能取決于ORM的Sql生成算法, 和用戶使用的時候,對生成算法的控制,比如利用好Lazy laoding等,在某些情況下,甚至可以不通過sql,畢竟沒有sql比最優化的sql還要快。
三,可維護性
可維護性是選擇sql,sp,orm最主要的因素。
這里面有點”玄“,因為不同的場景會得出不同的結論,俗稱“It depends"。
剛開始的時候,sql的維護性看起來是最差,因為它往往散布在程序的每個角落。而存儲過陳都放在數據庫中,有清晰接口。
但是如果我們做一次重構,情況居然會顛倒過來。
首先,存儲過程完全可以照搬到C#中,sp的名字直接變成method的名字,sp的參數表直接變成method的參數表,(其實就是Command模式)。
其次,把這些methdod放到一個文件或者文件夾中。(所謂的DAL層,如果喜歡層的話)
通過這個重構,我們獲得了以下的好處:
1,首先是過程的調用和過程的定義放到了一起,修改起來比較方便。IDE都有定義跳轉功能。
2,過程的調用和定義同時進行版本控制,不會出現不匹配的情況。減少了sp的參數表和調用的不匹配,包括拼寫,類型,參數次序
3,單元測試非常方便
當然sp也有存在的價值,比如所謂的安全性,后面會提到。比如友好的調試環境,對于中小型項目,和初級程序員來說,也是很好的選擇。
ORM則將可維護性提升身到了一個新的高度,它試圖將sql屏蔽起來,在操作對象的同時,自動就把數據庫的事情給辦了。
ORM有兩種模式,一種是ActiveRecord, 一種是Datamapper,前者從數據庫中讀取定義,后者在程序中定義。不過由于前者往往用migration來生成數據庫,其實也是定義在程序里面的。好的ORM都有"leaking"的設計,也就是留了個”后門“,讓你有機會用sql來控制。
微軟的linq從某個角度類說,也是一種ORM, 它的設計思想可能是因為它覺得寫sql語句比寫c#代碼效率高,所以提供直接在C#中寫sql語句的機制,再自動生成真正的sql。不過,ORM真正價值在于它可以在恰當的時候,完全拋棄sql,比如比如讀用cache,寫用queue。而微軟的linq,完全是“無厘頭”的風格,在O中用R的寫法,難道是RRM, 唯一的好處只是鎖定程序和程序員在微軟的平臺上。
四,安全性
對企業來說,安全性有的時候比性能更重要,由于存儲過程在數據庫上多加了一道屏障,所以很多企業會把存儲過程作為首選。
ORM可以說是安全性最差的, 因為只有到程序運行起來,你才能知道,會產生什么樣的sql。
但是保證安全有許多方法和方面,比如部署前的測試, 數據庫的備份,對表的權限的設置。等。用sp來保證安全,只是多個選項中的一個。
在startup型企業中,高級程序員往往起到主導作用, 所以他們會不猶豫的選擇ORM。
在傳統企業中,如果DBA或者技術主管比較強勢,往往會采用sp。