文章出處

寫在前面

寫這篇博文的靈感來自《如何開始DDD(完)》,很感謝young.han兄這幾天的堅持,陸陸續續寫了幾篇有關于領域驅動設計的博文,讓園中再次刮了一陣“DDD探討風”,我現在不像前段時間那樣“瘋狂”了,寫博文需要靈感,就像這篇一樣。那篇博文除去其他的一些問題探討,留給我印象最深的就是:領域服務中使用倉儲,下面摘自文中我的一段評論:

  1. 領域服務中去調用倉儲,這一點是我一直所糾結的地方,我現在做的項目是領域服務中是不參雜著倉儲的,這個操作是在應用層中,比如:_userRepository.Add(user);
  2. 兄臺接下來說的觀點,首先要明確一點的是:倉儲應不應該在領域服務中進行調用???我上次寫了那篇文章,其實到最后也沒討論出個結果,反正我現在所做的是,領域服務不實現倉儲調用。你可以結合測試驅動開發就知道沒什么了,DDD+TDD,其實領域模型最好的業務體現是在哪?不是在領域模型,而是領域模型的單元測試,它是很好的描述這個業務用例,如果你的領域模型的單元測試出了問題,那就是領域模型出了問題,其實兄臺可以試著寫下你這個業務場景下的領域模型的單元測試,也就是一個業務用例的單元測試,看看會發生什么?還有就是應用層的偽代碼。

文中Luminji兄這樣回復我:“領域服務不用倉儲,那我們怎么單元測試領域服務?僅此一點,就說明領域服務必用倉儲。反之,倒是上層,如控制器這里不應該用倉儲。”其實原本大家的焦點不應該放在倉儲上面的,而應該放在領域驅動設計的核心-領域模型上,為此我還曾寫了幾篇關于領域模型設計的博文,但是一個完整的應用程序不只是包含領域模型,還有其他的東西需要進行探討,雖然它不像領域模型那么重要,但同樣必不可少。

Luminji兄的評論,讓我意識到需要把領域驅動設計中的其他概念明確探討下了,如果對一些概念模糊不清,或者不能很好的明確其職責,這樣就很容易導致我們在領域驅動設計的過程中陷入一些困境,就像我之前所掉進的坑-《設計窘境:來自 Repository 的一絲線索,Domain Model 再重新設計》。

以下內容只是個人對倉儲概念及其問題進行探討,并非是結論總結,僅供各位仁兄參考。

《實現領域驅動設計》

在進行正文探討之前,我先啰嗦幾句。

《實現領域驅動設計》這本書,我在之前覺得沒必要閱讀,因為當時認為學習領域驅動設計,只要精讀下 Eric Evans 的經典著作《領域驅動設計-軟件核心復雜性應對之道》就可以了,但是DDD是需要進行實踐的,Eric Evans 只是提出領域驅動設計這個概念,有關于其實現,書中并沒有花很大的精力去講解,而《實現領域驅動設計》這本書正是彌補了這一點。

這兩本書的閱讀順序,當然是先閱讀《領域驅動設計》,然后再閱讀《實現領域驅動設計》,如果你是第一次讀第一本書,它會顛覆你對軟件設計的一些看法,然后讓你不能自拔的“愛上它”,不知道你有沒有,反正我是這樣,然后你在做一些應用程序設計的時候,會嘗試使用領域驅動設計,雖然有些步履蹣跚,但是走出第一步是很重要的。關于閱讀第二本書,我的建議是,在閱讀之前,先根據第一本書中的指導,自己嘗試去實踐領域驅動設計,最好是做一些實際業務場景的應用,在這個過程中,完全按照自己對領域驅動設計的想法去實現,雖然可能會掉進一些深坑,但是我覺得只有這樣你才會理解的更加深刻。至于為什么自己實踐過領域驅動設計再去閱讀第二本書?因為實踐過后閱讀的話,你會與作者產生一些共鳴,這是很奇妙的感覺,就像譯者-騰云這樣所說:

《實現領域驅動設計》這本書,我現在也只讀了第十二章-資源庫(譯者把 Repository 翻譯為資源庫,和倉儲是一個意思,我更喜歡倉儲這個名詞,后面就用它來表示 Repository 了),閱讀倉儲這一章的時候,我是帶著問題進行閱讀的,也就是倉儲的職責是什么?它的歸宿究竟在哪?但是很可惜,我在這一章節中并沒有找到我要尋找的答案,因為作者主要講解的是倉儲的實現,但是我發現了其他一些有意思的東西,下面希望和各位仁兄分享下(或許有點偏離主題了,但是我覺得應該會蠻有意義的)。

倉儲(Repository) VS 數據訪問對象(DAO)

有關于倉儲的概念,我不止在一篇博文中進行說明,但是這邊既然和數據訪問對象進行比較的話,還是要聲明一下,下面來自《領域驅動設計》書中的定義:

Repository(倉儲):協調領域和數據映射層,利用類似與集合的接口來訪問領域對象。

也可以像 dudu 這樣進行直白的理解:Repository 是一個獨立的層,介于領域層與數據映射層(數據訪問層)之間。它的存在讓領域層感覺不到數據訪問層的存在,它提供一個類似集合的接口提供給領域層進行領域對象的訪問。Repository 是倉庫管理員,領域層需要什么東西只需告訴倉庫管理員,由倉庫管理員把東西拿給它,并不需要知道東西實際放在哪。

倉儲是領域驅動設計中產生的概念,也就是說,如果你的應用程序不是基于領域驅動設計的,那在設計中使用倉儲是不是有點不倫不類呢?首先,就像 Eric Evans 所定義中明確的那樣:協調領域和數據映射層,兩個關鍵字領域數據映射層,這里面的領域是指領域模型(實體和值對象),這是橋的一頭,另一頭就是數據映射層,也就是我們常說的 ORM 工具,在 .NET 領域也就是我們常用的 EntityFramework,很多人認為 EntityFramework 就包含倉儲,好像之前有人發表過博文闡述過這個問題,但是你看下倉儲的定義,就會發現這不是一個概念的問題。除了這兩個關鍵詞,還有一個動詞就是協調,倉儲協調的是什么?怎么協調的?這個概念需要明確下,橋的一頭-領域模型(主要是實體對象),這個就不多說了,橋的另一頭-ORM(對象關系映射),因為我們大部分情況下使用的是關系型數據庫,如何對數據進行管理?當然 DAO 是一種(這邊先不多說),還有就是使用 ORM,它可以讓你很方便的進行數據和對象映射轉換,如果你的項目是基于事務腳本模式設計的,那就沒必要使用 ORM 工具了,因為使用簡單的 SQL 更合適,說了這么多,好像都沒說到重點,其實倉儲協調的是 ORM 中的“O”,也就是對象的概念,它是在數據映射層之上的,是一種概念,而不是一種實現,這個概念很重要。

有時候,倉儲和數據訪問對象會當作同義詞來看待,因為他們都提供了對持久化機制的抽象,在 DAO 中比較好理解,倉儲中的持久化機制主要體現在 ORM 中,但是這并不屬于倉儲,更不屬于 DAO,所以有時候我們認為所有的持久化抽象稱為 DAO,并不是很準確,我們需要確定的是這種模式是否得到了真正的實現。

倉儲和 DAO 是不同的,一個 DAO 主要從數據庫表的角度來看待問題,并且提供 CRUD 操作,這種模式適用于事務腳本程序中,這是因為,這些與 DAO 相關的模式通常只是對數據庫表的一層封裝。而另一方面,倉儲和數據影射器(ORM)則更加偏向于對象,因此通常被用于領域模型中。

還有一點內容就是存儲過程的探討,在《實現領域驅動設計》書中,作者也提到了,他不建議我們在基于領域驅動設計的應用中去使用存儲過程,因為我們的建模團隊并不能很好的理解存儲過程所使用的語言,此外,通常來說他們也看不到存儲過程的實現,而這些都是有餑于 DDD 目標的,但是有時候使用存儲過程是為了程序性能,這是一個取舍的問題,就像我們使用 ORM 一樣,我們需要對這個概念進行明確清楚,以防止我們在領域驅動設計的過程中參雜一些其他的東西。

有關倉儲和數據訪問對象的探討,最后的結論是,通常來說,你可以將倉儲當作 DAO 來看待,但是請注意一點,在設計倉儲時,我們應該采用面向集合的方式,而不是面向數據訪問的方式。這有助于你將自己的領域當作模型來看待,而不是 CRUD 操作。

以下幾段話來自netfocus兄:

  1. 倉儲是面向領域的,倉儲定義的目的不是db驅動的,倉儲管理的數據的最小粒度是聚合根,這兩點和DAO有很大不同;
  2. 倉儲用于實現聚合的生命周期,聚合創建后,如果不用了,會放回倉儲,需要用時,再從倉儲取出來(也就是喚醒聚合的意思);所以倉儲就是聚合的溫床。按照倉儲的定義,它是一個集合,所以我們只會為倉儲提供類似集合的接口,比如Add,Remove,Get這種操作;因為集合沒有Save的說法,所以倉儲上不需要有Save,更不會有Commit,也不會有Delete等概念。因為是集合,所以可以理解為一個無限大的內存空間,我們不關心集合是否太大,也不關心背后的持久化,這些不是DDD該思考的東西,我們可以用Dapper來實現,也可以用Mongo,也可以用EF。
  3. Save, Delete, Commit這些都是持久化的概念,最多在應用層表達。

關于倉儲(Repository),你必須知道的幾個概念。

1,倉儲的兩種設計方式:面向集合和面向持久化

面向集合和面向持久化,這兩種類型的倉儲設計方式,在《實現領域驅動設計》中有很詳細的講解,作者還附帶了幾個具體的實現,比如 Hibernate 實現、TopLink 實現等等,這個必須贊一個,感興趣的朋友,可以進行閱讀下。這面我簡單說明下,這兩種設計方式的不同之處,舉個最直白的例子。

面向集合方式:

this.UserRepository.Add(user);

面向持久化方式:

this.UserRepository.Save(user);

可能很多朋友看到這,會不以為然,需要明確一點,在領域驅動設計中,不論是變量或是方法的命名規則都非常重要,因為其代碼就是代表著一種通用語言,你要讓人家可以看懂。在面向集合方式中,新對象的添加使用的是 Add,而在面向持久化方式中,不論是新對象的添加或是修改,都是使用的 Save,如果是基于 Unit Of Work(工作單元),會有 Commit。

2,不允許同一聚合實例多次添加到倉儲中

關于這一點其實很多人都知道,因為聚合存在唯一性,倉儲是管理它的集合,所以不可能在集合中存在多個同一聚合。另外在面向集合方式實現中,當從倉儲中獲取一個對象并對其進行修改時,我們并不需要“重新保存”該對象到倉儲中,因為集合維護了對該對象的引用,而修改將直接作用在該對象上。

3,倉儲實現方法返回類型建議為 void

我們在定義倉儲接口的時候,一般會這樣定義:

bool Add(TAggregateRoot aggregateRoot);

比如添加聚合實例的方法返回值為 bool 類型,但是有時候返回 true 并不一定代表著該聚合實例成功添加到倉儲中了,因此,對于倉儲來說,返回 void 可能會是更好的方式。那如何判斷該聚合實例成功添加到倉儲中了呢?我們一般會在倉儲實現中進行異常捕獲,這一點內容,在書中有講解,我們可以自定義異常信息,友好的拋出一個異常。

4,對聚合實例的批量操作,最好不要使用 addAll() 和 removeAll() 方法

有時候我們在單個事務中,對多個聚合實例進行添加或刪除的時候,為了方便,我們會使用 addAll() 和 removeAll() 方法,但是,我們使用這種方式,并不能對單個聚合實例操作進行監控,建議方式是循環調用 add() 和 remove() 方法。

5,聚合中刪除聚合實例的正確表達是什么?

有時候,在應用程序設計中,對實例對象的生命周期管理就代表著其業務邏輯的體現,我們一般在設計中刪除對象使用的是 delete,具體表現是從數據庫中直接將數據刪除掉,這是在事務腳本中的實現方式,在領域驅動設計中,其實是不存在對象刪除這一說法的,正確的表達應該是,將聚合實例標記為失活的(disabled),不可用的(unusable),也就是說在倉儲所涵蓋的內容里面,最好不要出現 delete,至于數據庫具體持久化中的 delete,這個就不在倉儲的概念之中了。

6,倉儲在各層中的位置存放

在書中,作者是這樣表述的:我們將倉儲接口定義放在了與聚合相同的包中(書中所有的示例都是用 java 實現的),而將倉儲中的實現類放在了 impl 子包中,這種方式被大量的 java 項目所采用,然而,在協作上下文中,團隊成員們,將實現類放在了基礎設施層中。

這一點我是和作者持相同觀點,比如下面的解決方案:

7,倉儲中的級聯刪除所引出的問題

關于這個問題,其實我也不是很理解,下面引自作者的一段話(P375):

有人可能會依賴于ORM所提供的生命周期事件來完成對象的級聯刪除。我刻意地沒有使用這種方式,因為我強烈反對由聚合來管理持久化,同時我強烈地提倡只使用資源庫來處理持久化。當然,有關這兩者的爭論非常激烈,并且還在繼續。因此,在選擇時,你需要多方權衡。但是請記住,DDD專家是不會首先考慮使用聚合來管理持久化的。

根據我的猜測,大概是這樣的意思,主要是倉儲的持久化管理,一種是使用 ORM 攻擊所提供的持久化機制,這種方式就使得倉儲依賴于這些技術的實現,但是可以為我們在實現倉儲的時候省去很多事,比如我們使用 EntityFramework,你會發現我們在實現倉儲的時候,變得異常簡單。還有一種方式就是作者提到的,建議讓倉儲自身去實現持久化機制,但是這種方式實現起來比較復雜,我也沒具體的找到其實現方法,這邊就不多說。

8,Unit Of Work(工作單元)的使用

只需要記住一點:當 Unit Of Work 中的 commit() 方法執行時,所有發生在對象上的修改都將提交到數據庫中。

9,count() or size()?

我們有時候計算聚合實例的總數,一般會將實現方法命名為 count(),但是因為倉儲應該盡可能的模擬一個集合,因此建議接口定義如下:

int Size();

命名規則是我們在軟件開發過程中,最容易忽略的一點,可能在一般的開發過程中不注意會沒事,但是在領域驅動設計中,就像之前所表述的那樣,代碼代表著一種語言,不光是自己能看懂,還要讓需求人員可以看懂,至少可以從名字上知道其代表的意思,這一點很重要。

10,聚合根下的子聚合正確方式

有時,如果我們要獲取聚合根下的某些子聚合,我們不用先從資源庫中獲取到聚合根,然后再從聚合根中獲取這些子聚合,而是可以直接從資源庫中返回。在有些情況下,這種做法是有好處的。比如,某個聚合根擁有一個很大的實體類型集合,而你需要根據某種查詢條件返回該集合中的一部分實體。當然,只有在聚合根中提供了對該實體集合的導航時,我們才能這么做,否則,我們便違背了聚合的設計原則。我建議不要因為客戶端的方便而提供這種訪問方式。更多的時候,采用這種方式是由于性能上的考慮,比如從聚合根中訪問子聚合將帶來性能瓶頸的時候。此時的查找方法和其他查找方法具有相同的基本特征,只是它直接返回聚合根下的子聚合,而不是聚合根本身。無論如何,請慎重使用這種方式。

以上是書中作者的觀點描述,其實最終也沒有表述出一個正確的方式,只是說直接訪問子聚合,作者不建議這樣做,但是有時候為了一些性能問題,我們又不得不權衡利弊一下。除了這個問題之外,還有一個就是倉儲執行完查詢后,有時候會返回多個聚合的查詢結果對象,這個我們一般會將查詢結果放在一個值對象中。

11,CQRS 模式引入

對于 CQRS 模式,我沒有深入研究過,更沒有實踐應用過,我的想法是先去把經典DDD理解透,然后再去嘗試其他東西,畢竟路要一步一步走,CQRS 模式是對 DDD 的一種很好補充,也就是說它的產生是有一定的理由的,對于領域驅動設計初學者,我個人不建議,一開始就使用 CQRS 模式。

當我們使用用例優化查詢時,有時候我們必須創建多個查詢方法,什么意思?就是跨聚合查詢,這可能意味著你的聚合邊界劃分的有問題,如果你確定你的聚合邊界劃分沒有問題,那你應該考慮使用 CQRS 模式了,它的應用場景就是這樣,凡事都有產生的原因,如果你的應用程序沒有很復雜的查詢操作,我個人覺得,完全沒必要使用 CQRS 模式,有時候不要為了實現而實現。

12,共享倉儲

對于這個概念,我沒有深入研究過,作者也只是提出了一個思考,這邊也不多說,思考如下:

為不同的聚合類型提供單獨的資源庫究竟給我們帶來了什么好處?在聚合子類較少的情況下,為它們使用單獨的資源庫可能是最好的方式。但是,隨著聚合子類數目的增加,而同時它們又具有完全的可互換性時,使用一個共享的資源庫便更合適了。

寫在最后

本來想一篇博文寫完了事,但是看了下內容,寫了還蠻多的,其實都還沒說到重點上,只是大致講述了倉儲的概念,為防止大家看得累,那分為上下篇來進行講解。

下篇主要對:倉儲,你的歸宿究竟在哪?這個問題進行探討,內容主要包含其職責及調用場景的可行性探討,具體用代碼來驗證。

這一篇內容就到這里,歡迎大家拍磚討論。


文章列表




Avast logo

Avast 防毒軟體已檢查此封電子郵件的病毒。
www.avast.com


arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()