理解.NET程序集的執行過程
對于一個已編譯好的.NET程序集,Windows操作系統是如何啟動執行的呢?日常使用中我們發現對于托管的和非托管的程序集編譯器都會吧程序集編譯成以.exe或.dll等為擴展名的文件,可見Windows加載器并沒有區分是托管還是非托管的程序集,而且我們也知道對非托管的程序集是在編譯器直接編譯成了機器碼,自然可以由CPU直接執行,而托管的.NET 程序集是包含復雜結構的MSIL代碼,執行時會使用JIT即時編譯器將IL代碼編譯成機器碼,再由CPU執行,當然這期間還需要執行其它許多的工作,如加載CLR、執行初始化等工作,那么這些是怎么自動實現的呢?
理解這些問題是我們深入.NET的關鍵,由于日常的開發工作并不涉及這些知識(編譯器已經給我們做了),結果是很多的.NET 書忽略了這一點,也很少有人研究者方面的內容,所以在閱讀了《.NET 高級調試》這本書給了我非常清晰地認識,把里面的這方面精彩的內容做了一個總結以供那些還沒有清楚.NET 程序集如何執行的學者們一個簡單的參考。
首先我們要清楚的是對于托管還是非托管程序集,他們在編譯器執行編譯時都會編譯成一個特殊的文件格式,即PE文件(可移植可執行文件格式),操作系統加載器通過加載這樣的PE文件來執行程序集的。可以這么說吧,無論是托管程序還是非托管程序他們實際上都是編譯成這樣的PE文件(只是有部分內容不一樣而已)。
然后這個PE文件會指示如何執行托管程序集和非托管程序集,加載器首先會查找到PE頭中的AddressOfEntryPoint域,這個域指示PE文件的入口點位置,在.NET程序集中是指向.text段中的CLR頭--〉包含一個結構IMAGE_COR20_HEADER—包含許多信息如托管代碼應用程序的入口點,目標CLR的主版本號和從版本號,以及程序集的強名稱簽名等--〉Windows加載器根據這個數據結構決定加載哪個版本的CLR以及一些基本的程序集信息。在.text段中還包含了程序集的元數據表,MSIL以及非托管啟動存根代碼,而非托管啟動存根代碼包好了由Windows加載器執行役啟動PE文件執行的代碼,結構如圖所示。
這樣.NET 程序集的加載算法包括:
1、用戶執行一個.NET程序集;
2、Windows加載器查看AddressOfEntryPoint域,并找到PE映像文件的.text段;
3、位于AddressOfEntryPoint位置上的字節只是一個JMP(跳轉)指令,這個指令跳轉到mscoree.dll中的一個導入函數;
4、將執行控制轉移到mscoree.dll中的_CorExeMain中,這個函數將啟動CLR并把執行控制轉移到程序集的入口點。