MS SQL Server 2005 物理查詢處理中的各個階段(二)

作者: Sai~  來源: 博客園  發布時間: 2008-12-16 17:01  閱讀: 1990 次  推薦: 0   原文鏈接   [收藏]  

你真的了解T-SQL邏輯查詢嗎?提到的這種搜索方式,,也許很多人不明白(包括我,我看之前簡直感到詫異),很多都想 如果表的記錄有10000000~!#@條,那每次的CROSS JOIN 將會長生 m*n的記錄,我們就假設是1W 1w的平方還是有點點恐怖的,所以實際存儲引擎并不是如此查詢的,但是講清楚 邏輯查詢很重要,因為那是物理查詢的基礎,我覺得 理解數據庫引擎的查詢處理方式有助于 開發人員在生產過程中做出正確的選擇。PS:(有朋友說文章很多都“借鑒“別人的例子,我想是好東西用什么例子都不重要吧,只要能分享給大家,我抄都抄過來,再說是我對書的一些總結,呵呵~,這里要感謝作者Lubor Kollar,他是書中該章節的作者,是MS SQL SERVER 2005開發人員)。

那么開始吧,當一個查詢你到達數據庫引擎的時候 SQL SERVER 執行兩個主要的步驟來產生結果,一步就是 “查詢編譯”,一個是“生成查詢計劃”。首先提一下為什么存儲過程的效率總是比應用程序級別的T-SQL語句來的更迅速,首先拋開網絡傳輸T-SQL語句的時間不管,我們利用應用程序發送的T-SQL語句,交個數據庫執行,他首先就要對T-SQL語句進行編譯,在SQL中編譯的概念,和我們寫應用程序理解應該是一致的,包括語法的檢查,代數化以及查詢優化,就像我們的應用程序(我是搞.NET的),編譯器對你的C#代碼進行編譯,先檢查語法的錯誤,然后生成dlldll 中就包括對整個類庫的描述類似于SQL中的執行計劃,回到SQL中,這個編譯過程當然是需要時間的,所以應用程序級別的T-SQL 交給數據庫編譯以后才執行,更可惡的是,竟然對外部傳輸來的T-SQL語句不會進行 “過程緩存”,因為他在編譯后就立即執行了,而存儲過程他就已經預先編譯了,也進行了查詢的優化了,還會保存在“過程緩存”中,所以推薦使用存儲過程。

下面就來展示一個例子:

USE Northwind;

SELECT C.CustomerId,COUNT(o.OrderId) AS NumOrders

FROM dbo.Customers AS C

LEFT OUTER JOIN dbo.Orders AS o ON c.CustomerId=o.CustomerId

WHERE c.City='London'

GROUP BY C.CustomerId

HAVING COUNT(o.OrderId)>5

ORDER BY NumOrders;

返回結果:

EASTC       8

SEVES       9

BSBEV      10

AROUT     13

上次 就有朋友在留言中提到這個問題 ,下面我們來看看他的執行計劃,到底 邏輯處理 和物理處理 有什么不同.我們點擊 顯示估計的執行計劃” ,然后找到 最右邊的 Index seek 索引查找,下圖

2.bmp

這是我切下來的圖片,

我們看到 他的Seek 謂詞 [Northwind].[dbo].[Customers].City=N’London’

再看看 我們的查詢 語句的WHERE 部分

WHERE c.City='London'

完全 符合我在 你真的了解T-SQL邏輯查詢嗎? 一問中先說到的 第一個階段 找到FROM 的表,但是又有一點不同,物理查詢 他會等到執行CROSS 鏈接以后的 記錄,他會先直接 篩選WHERE 中的記錄 等于  3 邏輯 處理階段 連接和 4個階段WHERE 合并了.至于 這樣有什么好處呢?

我們繼續,首先我們分析 WHERE ,我們先考慮一種情況  如果 是按照 邏輯 執行階段的順序,CROSS JOIN 下來的 虛擬表 將是非常恐怖的 .可是 MS 的員工 在邏輯階段 到物理階段的過程中,肯定會采取一些列手段來優化T-SQL 語句,所以 我們聯想到 先執行WHERE 中的 邏輯處理階段 左表中的 結果 返回

相當于 執行:

USE Northwind;

SELECT C.CustomerId

FROM dbo.Customers AS C

WHERE c.City='London'

 

他返回的結果是:

 

AROUT

BSBEV

CONSH

EASTC

NORTS

SEVES

果然和我們 預想的一樣返回的 行數 完全和執行計劃中的 估計行數 : 6 行 吻合,

這樣執行的結果的好處 ,我們自然可以聯想到,6行的結果集 再來 CROSS JOIN 就小多了

,下面我們繼續剛才的分析,接著 自然是 Orders 表的鏈接,

自然 1.bmp啟用它的ON  條件, (看看Seek 謂詞)

我們再回過來看看 之前說的  物理處理階段,是不是 完全吻合. 之所以要說明白 邏輯階段,(說個題外話,有興趣的朋友可以去看看Algebrizer,他是T-SQL中的 新組件是 綁定的重要功能,我想對高數有研究的朋友可能會喜歡里面的研究和分析.他取代了2000中的Normalizer組件,在物理 邏輯 級別提高了T-SQL 效率.)

對于 后面文章的  優化查詢語句 起到了 舉足輕重的作用, 講明了 物理 處理階段和 邏輯處理階段 對于 存儲引擎是 怎么執行T-SQL 有了一定的了解,才能從原理級別去提高T-SQL ,這也是國內很多同行不曾重視的.當然本文的下一篇將繼續我們的研究 -子查詢的精要

0
0
 
 
 

文章列表

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()