Repository 倉儲，你的歸宿究竟在哪？（一）－倉儲的概念 - xishuai－IT工程師數位筆記本

文章出處

寫在前面

寫這篇博文的靈感來自《如何開始DDD(完)》，很感謝young.han兄這幾天的堅持，陸陸續續寫了幾篇有關于領域驅動設計的博文，讓園中再次刮了一陣“DDD探討風”，我現在不像前段時間那樣“瘋狂”了，寫博文需要靈感，就像這篇一樣。那篇博文除去其他的一些問題探討，留給我印象最深的就是：領域服務中使用倉儲，下面摘自文中我的一段評論：

領域服務中去調用倉儲，這一點是我一直所糾結的地方，我現在做的項目是領域服務中是不參雜著倉儲的，這個操作是在應用層中，比如：_userRepository.Add(user);

兄臺接下來說的觀點，首先要明確一點的是：倉儲應不應該在領域服務中進行調用？？？我上次寫了那篇文章，其實到最后也沒討論出個結果，反正我現在所做的是，領域服務不實現倉儲調用。你可以結合測試驅動開發就知道沒什么了，DDD＋TDD，其實領域模型最好的業務體現是在哪？不是在領域模型，而是領域模型的單元測試，它是很好的描述這個業務用例，如果你的領域模型的單元測試出了問題，那就是領域模型出了問題，其實兄臺可以試著寫下你這個業務場景下的領域模型的單元測試，也就是一個業務用例的單元測試，看看會發生什么？還有就是應用層的偽代碼。

文中Luminji兄這樣回復我：“領域服務不用倉儲，那我們怎么單元測試領域服務？僅此一點，就說明領域服務必用倉儲。反之，倒是上層，如控制器這里不應該用倉儲。”其實原本大家的焦點不應該放在倉儲上面的，而應該放在領域驅動設計的核心－領域模型上，為此我還曾寫了幾篇關于領域模型設計的博文，但是一個完整的應用程序不只是包含領域模型，還有其他的東西需要進行探討，雖然它不像領域模型那么重要，但同樣必不可少。

Luminji兄的評論，讓我意識到需要把領域驅動設計中的其他概念明確探討下了，如果對一些概念模糊不清，或者不能很好的明確其職責，這樣就很容易導致我們在領域驅動設計的過程中陷入一些困境，就像我之前所掉進的坑－《設計窘境：來自 Repository 的一絲線索，Domain Model 再重新設計》。

以下內容只是個人對倉儲概念及其問題進行探討，并非是結論總結，僅供各位仁兄參考。

《實現領域驅動設計》

在進行正文探討之前，我先啰嗦幾句。

《實現領域驅動設計》這本書，我在之前覺得沒必要閱讀，因為當時認為學習領域驅動設計，只要精讀下 Eric Evans 的經典著作《領域驅動設計－軟件核心復雜性應對之道》就可以了，但是DDD是需要進行實踐的，Eric Evans 只是提出領域驅動設計這個概念，有關于其實現，書中并沒有花很大的精力去講解，而《實現領域驅動設計》這本書正是彌補了這一點。

這兩本書的閱讀順序，當然是先閱讀《領域驅動設計》，然后再閱讀《實現領域驅動設計》，如果你是第一次讀第一本書，它會顛覆你對軟件設計的一些看法，然后讓你不能自拔的“愛上它”，不知道你有沒有，反正我是這樣，然后你在做一些應用程序設計的時候，會嘗試使用領域驅動設計，雖然有些步履蹣跚，但是走出第一步是很重要的。關于閱讀第二本書，我的建議是，在閱讀之前，先根據第一本書中的指導，自己嘗試去實踐領域驅動設計，最好是做一些實際業務場景的應用，在這個過程中，完全按照自己對領域驅動設計的想法去實現，雖然可能會掉進一些深坑，但是我覺得只有這樣你才會理解的更加深刻。至于為什么自己實踐過領域驅動設計再去閱讀第二本書？因為實踐過后閱讀的話，你會與作者產生一些共鳴，這是很奇妙的感覺，就像譯者－騰云這樣所說：

《實現領域驅動設計》這本書，我現在也只讀了第十二章－資源庫（譯者把 Repository 翻譯為資源庫，和倉儲是一個意思，我更喜歡倉儲這個名詞，后面就用它來表示 Repository 了），閱讀倉儲這一章的時候，我是帶著問題進行閱讀的，也就是倉儲的職責是什么？它的歸宿究竟在哪？但是很可惜，我在這一章節中并沒有找到我要尋找的答案，因為作者主要講解的是倉儲的實現，但是我發現了其他一些有意思的東西，下面希望和各位仁兄分享下（或許有點偏離主題了，但是我覺得應該會蠻有意義的）。

倉儲（Repository） VS 數據訪問對象（DAO）

有關于倉儲的概念，我不止在一篇博文中進行說明，但是這邊既然和數據訪問對象進行比較的話，還是要聲明一下，下面來自《領域驅動設計》書中的定義：

Repository（倉儲）：協調領域和數據映射層，利用類似與集合的接口來訪問領域對象。

也可以像 dudu 這樣進行直白的理解：Repository 是一個獨立的層，介于領域層與數據映射層（數據訪問層）之間。它的存在讓領域層感覺不到數據訪問層的存在，它提供一個類似集合的接口提供給領域層進行領域對象的訪問。Repository 是倉庫管理員，領域層需要什么東西只需告訴倉庫管理員，由倉庫管理員把東西拿給它，并不需要知道東西實際放在哪。

倉儲是領域驅動設計中產生的概念，也就是說，如果你的應用程序不是基于領域驅動設計的，那在設計中使用倉儲是不是有點不倫不類呢？首先，就像 Eric Evans 所定義中明確的那樣：協調領域和數據映射層，兩個關鍵字領域和數據映射層，這里面的領域是指領域模型（實體和值對象），這是橋的一頭，另一頭就是數據映射層，也就是我們常說的 ORM 工具，在 .NET 領域也就是我們常用的 EntityFramework，很多人認為 EntityFramework 就包含倉儲，好像之前有人發表過博文闡述過這個問題，但是你看下倉儲的定義，就會發現這不是一個概念的問題。除了這兩個關鍵詞，還有一個動詞就是協調，倉儲協調的是什么？怎么協調的？這個概念需要明確下，橋的一頭－領域模型（主要是實體對象），這個就不多說了，橋的另一頭－ORM（對象關系映射），因為我們大部分情況下使用的是關系型數據庫，如何對數據進行管理？當然 DAO 是一種（這邊先不多說），還有就是使用 ORM，它可以讓你很方便的進行數據和對象映射轉換，如果你的項目是基于事務腳本模式設計的，那就沒必要使用 ORM 工具了，因為使用簡單的 SQL 更合適，說了這么多，好像都沒說到重點，其實倉儲協調的是 ORM 中的“O”，也就是對象的概念，它是在數據映射層之上的，是一種概念，而不是一種實現，這個概念很重要。

有時候，倉儲和數據訪問對象會當作同義詞來看待，因為他們都提供了對持久化機制的抽象，在 DAO 中比較好理解，倉儲中的持久化機制主要體現在 ORM 中，但是這并不屬于倉儲，更不屬于 DAO，所以有時候我們認為所有的持久化抽象稱為 DAO，并不是很準確，我們需要確定的是這種模式是否得到了真正的實現。

倉儲和 DAO 是不同的，一個 DAO 主要從數據庫表的角度來看待問題，并且提供 CRUD 操作，這種模式適用于事務腳本程序中，這是因為，這些與 DAO 相關的模式通常只是對數據庫表的一層封裝。而另一方面，倉儲和數據影射器（ORM）則更加偏向于對象，因此通常被用于領域模型中。

還有一點內容就是存儲過程的探討，在《實現領域驅動設計》書中，作者也提到了，他不建議我們在基于領域驅動設計的應用中去使用存儲過程，因為我們的建模團隊并不能很好的理解存儲過程所使用的語言，此外，通常來說他們也看不到存儲過程的實現，而這些都是有餑于 DDD 目標的，但是有時候使用存儲過程是為了程序性能，這是一個取舍的問題，就像我們使用 ORM 一樣，我們需要對這個概念進行明確清楚，以防止我們在領域驅動設計的過程中參雜一些其他的東西。

有關倉儲和數據訪問對象的探討，最后的結論是，通常來說，你可以將倉儲當作 DAO 來看待，但是請注意一點，在設計倉儲時，我們應該采用面向集合的方式，而不是面向數據訪問的方式。這有助于你將自己的領域當作模型來看待，而不是 CRUD 操作。

以下幾段話來自netfocus兄：

倉儲是面向領域的，倉儲定義的目的不是db驅動的，倉儲管理的數據的最小粒度是聚合根，這兩點和DAO有很大不同；

倉儲用于實現聚合的生命周期，聚合創建后，如果不用了，會放回倉儲，需要用時，再從倉儲取出來（也就是喚醒聚合的意思）；所以倉儲就是聚合的溫床。按照倉儲的定義，它是一個集合，所以我們只會為倉儲提供類似集合的接口，比如Add，Remove，Get這種操作；因為集合沒有Save的說法，所以倉儲上不需要有Save，更不會有Commit，也不會有Delete等概念。因為是集合，所以可以理解為一個無限大的內存空間，我們不關心集合是否太大，也不關心背后的持久化，這些不是DDD該思考的東西，我們可以用Dapper來實現，也可以用Mongo，也可以用EF。

Save, Delete, Commit這些都是持久化的概念，最多在應用層表達。

關于倉儲（Repository），你必須知道的幾個概念。

1，倉儲的兩種設計方式：面向集合和面向持久化

面向集合和面向持久化，這兩種類型的倉儲設計方式，在《實現領域驅動設計》中有很詳細的講解，作者還附帶了幾個具體的實現，比如 Hibernate 實現、TopLink 實現等等，這個必須贊一個，感興趣的朋友，可以進行閱讀下。這面我簡單說明下，這兩種設計方式的不同之處，舉個最直白的例子。

面向集合方式：

this.UserRepository.Add(user);

面向持久化方式：

this.UserRepository.Save(user);

可能很多朋友看到這，會不以為然，需要明確一點，在領域驅動設計中，不論是變量或是方法的命名規則都非常重要，因為其代碼就是代表著一種通用語言，你要讓人家可以看懂。在面向集合方式中，新對象的添加使用的是 Add，而在面向持久化方式中，不論是新對象的添加或是修改，都是使用的 Save，如果是基于 Unit Of Work（工作單元），會有 Commit。

2，不允許同一聚合實例多次添加到倉儲中

關于這一點其實很多人都知道，因為聚合存在唯一性，倉儲是管理它的集合，所以不可能在集合中存在多個同一聚合。另外在面向集合方式實現中，當從倉儲中獲取一個對象并對其進行修改時，我們并不需要“重新保存”該對象到倉儲中，因為集合維護了對該對象的引用，而修改將直接作用在該對象上。

3，倉儲實現方法返回類型建議為 void

我們在定義倉儲接口的時候，一般會這樣定義：

bool Add(TAggregateRoot aggregateRoot);

比如添加聚合實例的方法返回值為 bool 類型，但是有時候返回 true 并不一定代表著該聚合實例成功添加到倉儲中了，因此，對于倉儲來說，返回 void 可能會是更好的方式。那如何判斷該聚合實例成功添加到倉儲中了呢？我們一般會在倉儲實現中進行異常捕獲，這一點內容，在書中有講解，我們可以自定義異常信息，友好的拋出一個異常。

4，對聚合實例的批量操作，最好不要使用 addAll() 和 removeAll() 方法

有時候我們在單個事務中，對多個聚合實例進行添加或刪除的時候，為了方便，我們會使用 addAll() 和 removeAll() 方法，但是，我們使用這種方式，并不能對單個聚合實例操作進行監控，建議方式是循環調用 add() 和 remove() 方法。

5，聚合中刪除聚合實例的正確表達是什么？

有時候，在應用程序設計中，對實例對象的生命周期管理就代表著其業務邏輯的體現，我們一般在設計中刪除對象使用的是 delete，具體表現是從數據庫中直接將數據刪除掉，這是在事務腳本中的實現方式，在領域驅動設計中，其實是不存在對象刪除這一說法的，正確的表達應該是，將聚合實例標記為失活的（disabled），不可用的（unusable），也就是說在倉儲所涵蓋的內容里面，最好不要出現 delete，至于數據庫具體持久化中的 delete，這個就不在倉儲的概念之中了。

6，倉儲在各層中的位置存放

在書中，作者是這樣表述的：我們將倉儲接口定義放在了與聚合相同的包中（書中所有的示例都是用 java 實現的），而將倉儲中的實現類放在了 impl 子包中，這種方式被大量的 java 項目所采用，然而，在協作上下文中，團隊成員們，將實現類放在了基礎設施層中。

這一點我是和作者持相同觀點，比如下面的解決方案：

7，倉儲中的級聯刪除所引出的問題

關于這個問題，其實我也不是很理解，下面引自作者的一段話（P375）：

有人可能會依賴于ORM所提供的生命周期事件來完成對象的級聯刪除。我刻意地沒有使用這種方式，因為我強烈反對由聚合來管理持久化，同時我強烈地提倡只使用資源庫來處理持久化。當然，有關這兩者的爭論非常激烈，并且還在繼續。因此，在選擇時，你需要多方權衡。但是請記住，DDD專家是不會首先考慮使用聚合來管理持久化的。

根據我的猜測，大概是這樣的意思，主要是倉儲的持久化管理，一種是使用 ORM 攻擊所提供的持久化機制，這種方式就使得倉儲依賴于這些技術的實現，但是可以為我們在實現倉儲的時候省去很多事，比如我們使用 EntityFramework，你會發現我們在實現倉儲的時候，變得異常簡單。還有一種方式就是作者提到的，建議讓倉儲自身去實現持久化機制，但是這種方式實現起來比較復雜，我也沒具體的找到其實現方法，這邊就不多說。

8，Unit Of Work（工作單元）的使用

只需要記住一點：當 Unit Of Work 中的 commit() 方法執行時，所有發生在對象上的修改都將提交到數據庫中。

9，count() or size()?

我們有時候計算聚合實例的總數，一般會將實現方法命名為 count()，但是因為倉儲應該盡可能的模擬一個集合，因此建議接口定義如下：

int Size();

命名規則是我們在軟件開發過程中，最容易忽略的一點，可能在一般的開發過程中不注意會沒事，但是在領域驅動設計中，就像之前所表述的那樣，代碼代表著一種語言，不光是自己能看懂，還要讓需求人員可以看懂，至少可以從名字上知道其代表的意思，這一點很重要。

10，聚合根下的子聚合正確方式

有時，如果我們要獲取聚合根下的某些子聚合，我們不用先從資源庫中獲取到聚合根，然后再從聚合根中獲取這些子聚合，而是可以直接從資源庫中返回。在有些情況下，這種做法是有好處的。比如，某個聚合根擁有一個很大的實體類型集合，而你需要根據某種查詢條件返回該集合中的一部分實體。當然，只有在聚合根中提供了對該實體集合的導航時，我們才能這么做，否則，我們便違背了聚合的設計原則。我建議不要因為客戶端的方便而提供這種訪問方式。更多的時候，采用這種方式是由于性能上的考慮，比如從聚合根中訪問子聚合將帶來性能瓶頸的時候。此時的查找方法和其他查找方法具有相同的基本特征，只是它直接返回聚合根下的子聚合，而不是聚合根本身。無論如何，請慎重使用這種方式。

以上是書中作者的觀點描述，其實最終也沒有表述出一個正確的方式，只是說直接訪問子聚合，作者不建議這樣做，但是有時候為了一些性能問題，我們又不得不權衡利弊一下。除了這個問題之外，還有一個就是倉儲執行完查詢后，有時候會返回多個聚合的查詢結果對象，這個我們一般會將查詢結果放在一個值對象中。

11，CQRS 模式引入

對于 CQRS 模式，我沒有深入研究過，更沒有實踐應用過，我的想法是先去把經典DDD理解透，然后再去嘗試其他東西，畢竟路要一步一步走，CQRS 模式是對 DDD 的一種很好補充，也就是說它的產生是有一定的理由的，對于領域驅動設計初學者，我個人不建議，一開始就使用 CQRS 模式。

當我們使用用例優化查詢時，有時候我們必須創建多個查詢方法，什么意思？就是跨聚合查詢，這可能意味著你的聚合邊界劃分的有問題，如果你確定你的聚合邊界劃分沒有問題，那你應該考慮使用 CQRS 模式了，它的應用場景就是這樣，凡事都有產生的原因，如果你的應用程序沒有很復雜的查詢操作，我個人覺得，完全沒必要使用 CQRS 模式，有時候不要為了實現而實現。

12，共享倉儲

對于這個概念，我沒有深入研究過，作者也只是提出了一個思考，這邊也不多說，思考如下：

為不同的聚合類型提供單獨的資源庫究竟給我們帶來了什么好處？在聚合子類較少的情況下，為它們使用單獨的資源庫可能是最好的方式。但是，隨著聚合子類數目的增加，而同時它們又具有完全的可互換性時，使用一個共享的資源庫便更合適了。

寫在最后

本來想一篇博文寫完了事，但是看了下內容，寫了還蠻多的，其實都還沒說到重點上，只是大致講述了倉儲的概念，為防止大家看得累，那分為上下篇來進行講解。

下篇主要對：倉儲，你的歸宿究竟在哪？這個問題進行探討，內容主要包含其職責及調用場景的可行性探討，具體用代碼來驗證。

這一篇內容就到這里，歡迎大家拍磚討論。

文章列表

Avast 防毒軟體已檢查此封電子郵件的病毒。
www.avast.com

大師兄

IT工程師數位筆記本

大師兄發表在痞客邦留言(0) 人氣()

E-mail轉寄

IT工程師數位筆記本

If you give someone a program , you will frustrate them for a day; if you teach them how to program, you will frustrate them for a lifetime.IT 這段話的意思是，如果你交給某人一隻程式，你將折磨他一整天;如果你教會某人如何寫程式，你將折磨他一輩子。

BloggerAds