文章出處

SQL Server2014 哈希索引原理

翻譯自：http://www.sqlservercentral.com/blogs/sql-and-sql-only/2015/09/08/hekaton-part-6-hash-indexes-intro/

跟哈希 join，哈希聚合的原理一樣，了解哈希索引的原理也會同時明白哈希 join和哈希聚合的原理

SQL Server 2014推出的的新索引類型叫做 hash index。介紹hash index之前一定要介紹哈希函數這樣會讓大家更明白哈希索引的原理

當一個key-value鍵值對傳遞給一個哈希函數的時候，經過哈希函數的計算之后，根據結果會把key-value鍵值對放在合適的hash buckets（哈希存儲桶）里

舉個栗子

我們假設對10取模（ % 10 ）就是哈希函數。如果key-value鍵值對的key是1525 ，傳遞到哈希函數，那么1525 會存放在第五個bucket里

因為5 as 1525 % 10 = 5。

同樣，537 會存放在第七個bucket ，2982 會存放在第二個bucket ，依次類推

同樣，在hash index里面，哈希索引列會被傳遞給哈希函數做匹配（類似于java里面的HashMap的Map操作），匹配成功之后，

索引列會被存儲在匹配到的hash bucket里面的表里，這個表里會有實際的數據行指針，再根據實際的數據行指針查找對應的數據行。

概括來說，要查找一行數據或者處理一個where子句，SQL Server引擎需要做下面幾件事

1、根據where條件里面的參數生成合適的哈希函數

2、索引列進行匹配，匹配到對應hash bucket，找到對應hash bucket意味著也找到了對應的數據行指針（row pointer）

3、讀取數據

哈希索引比起B樹索引簡單，因為它不需要遍歷B樹，所以訪問速度會更快

哈希函數和相應語法的例子

CREATE TABLE dbo.HK_tbl
    (
      [ID] INT IDENTITY(1, 1)
               NOT NULL
               PRIMARY KEY NONCLUSTERED HASH WITH ( BUCKET_COUNT = 100000 ) ,
      [Data] char(32) COLLATE Latin1_General_100_BIN2
                      NULL ,
      [dt] datetime NOT NULL,
    )
    WITH (
         MEMORY_OPTIMIZED =
         ON,
         DURABILITY =
         SCHEMA_AND_DATA);