Linq學習筆記
寫在前面
其實在09年就已經學習過Linq了,并被她那優美的語法所吸引,只是現在所在的公司還在使用VS2005在.Net2.0的框架下面的開發,所以Linq也很久沒有用過了,最近看部門的同事對這個有些興趣,所以打算整理點東西出來跟大家一起做個分享。
什么是Linq
LINQ是Language Integrated Query的簡稱,它是集成在.NET編程語言中的一種特性。已成為編程語言的一個組成部分,在編寫程序時可以得到很好的編譯時語法檢查,豐富的元數據,智能感知、靜態類型等強類型語言的好處。并且它同時還使得查詢可以方便地對內存中的信息進行查詢而不僅僅只是外部數據源。
Linq包括Linq to Objects, Linq to SQL,Linq to XML, Linq to DataSet等,本篇從Linq to Objects開始了解Linq的皮毛。
開始Linq前你要知道的
擴展方法
顧名思義就是對現有類進行擴展的的方法,擴展方法可以在不修改現有類的情況下,為現有類增加公共的接口(不是C#中的interface)。
擴展方法本質上是一個靜態方法,不同之處在于它的第一個參數必須有this關鍵字聲明,并且第一個參數的類型即為要擴展的類型。如
public static double ToDouble(this string source) { double res = 0d; double.TryParse(source, out res); return res; } public static void SimpleExtesionMethod() { double d = "12345.54321".ToDouble(); Console.WriteLine(d); }
這里是個簡單的將字符串轉為double類型的擴展方法,只要引用了該方法的命名空間,則都可以直接用string類型來調用ToDouble方法。
擴展方法是后文的基礎,C#3.0中的Linq的實現都是基于擴展方法,通過對IEnumerable<T>接口(Linq to Objects)的擴展和對IQueryable<T>的擴展來實現Linq的相關功能,而Linq的相關關鍵字最終都是轉化為對IEnumerable<T>(IQueryable<T>)的調用。
Lambda表達式
lambda表達式其實就是.net2.0中的匿名方法,然后再3.0中以一種更優美的姿態呈現出來。
lambda表達式的基本語法為
(參數列表) =>{語句塊;} 或者
( 參數列表) =>表達式
當參數列表中只有一個參數的時候,圓括號可以省略
Func<string, string> func = x => x + x; Console.WriteLine(func("a"));
Var:隱式類型化變量
使用與可以由編譯器推導出的變量的聲明,不需要顯式指定對象的類型。
var container = new List<string> { "張三", "李四", "王五" }; IEnumerable<string> query = from name in container select name;
上例中由于定義中已經指明了對象的類型,聲明中已經完全沒有必要使用顯示的類型定義,所以可以使用var關鍵字。
對于匿名對象
var test = new { Name = "Sth.", Type = "UnKnown" };
由于無法用一個類型類聲明匿名對象,此時可以用var是聲明。
注意var只是省下了顯式聲明的過程,而C#本身就是靜態語言,所以var所聲明的變量的類型已經確定任然是不能改變的,亦即,var并非是變體類型。
Linq對誰適用
linq的語法通過System.Linq下面的Enumerable類提供支持,通過觀察他的簽名,你就會發現他為IEnumerable<T>實現了一系列的擴展方法,也就是說,只要是實現了IEnumerable<T>的對象都可以使用Linq的語法來查詢。
而對于只實現了IEnumerable接口而沒有實現IEnumerable<T>的對象可以通過
來將IEnumerable接口轉為IEnumerable<T>(例如ArrayList)。
Linq中的關鍵字
在C#3.0中,為Linq引入了一些新的關鍵字,他們是:
from join where group into let orderby select
熟悉Sql的同學看著是不是有些眼熟呢,其實在Linq中他們的涵義和在SQL中類似的,所以會很容易理解的。接下來的時間,簡單介紹下這些關鍵字的使用。
from
from子句是一個Linq查詢的開始,任何一個Linq語句都是以from開始,from子句指定查詢的容器,和在此語句有效的局部變量(用來指定容器中的一項,from子句的效果很類似于foreach)。from子句的語法為
from local in container
local就是在此Linq語句中的局部變量,由于container必須為IEnumerable<T>,他的類型可以由container推導出來(即T)。上一段簡單的例子:
var container = new List<string> { "張三", "李四", "王五" }; var query = from name in container select name; foreach (string name in query) { Console.WriteLine(name); }
輸出
張三
李四
王五
如果container僅僅實現IEnumerable而沒有實現IEnumerable<T>,則需要顯式指定局部變量的類型,或者是使用Cast轉為IEnumerable<T>
var container = new ArrayList { "張三", "李四", "王五" }; var query = from name in container.Cast<string>() select name;
//或者 var query1 = from string name in container select name;
select
對查詢的結果進行投影,在子句中指定要選擇的列,如上例。
有的時候,我們只需要投影某一列,我們可以這樣
private static void TestSelectSingleProperty() { var persons = GetPersons(); var query = from p in persons select p.Name; foreach (var item in query) { Console.WriteLine(item); } }
我們還可以指定要投影的列的集合,這個時候我們要用到匿名類型
var query = from p in persons select new { p.ID, p.Name }; foreach (var item in query) { Console.WriteLine("No:{0},Name:{1}",item.ID,item.Name); }
query中的每一項都時候一個擁有ID屬性和Name屬性的對象,當然有的時候實體的屬性名不是我們想要的,或者是通過對屬性計算得來的,那么我們可以顯式指定屬性名,就像下面這樣:
var query = from p in persons select new { UserID = p.ID, FriendName = p.Gender == "男" ? "Mr" : "Ms" + p.Name }; foreach (var item in query) { Console.WriteLine("No:{0},Friendly Name:{1}", item.UserID, item.FriendName); }
where
對容器內的數據進行篩選。
var query = from p in persons where p.DepartmentID == 1 select p.Name;
join
類似SQL里的join,Linq中的join子句用于將兩個容器的數據以某種關系進行關聯。
var departments = GetDepartments(); var persons = GetPersons(); var query = from d in departments join p in persons on d.ID equals p.DepartmentID select new { d, p };
值得注意的是join子句只能使用equals或者是not equal而不能用其他運算符(==都不行)。而equals運算符左邊必須聯接的左部,右邊為右部,不能調換的,否則編譯不能通過。
into
into子句用于將join或者是group子句的結果進一步持續化,包裝成為一個
System.Linq.IGrouping<TKey, TElement>
對象,而且IGrouping繼承自IEnumerable<TElement>,可以看出,IGrouping接口提供分組的鍵和,該鍵下所包含的集合。例子見group
group
對結果按照指定的條件進行分組
var container = new List<string> { "ZhangSan", "LiSi", "Wangwu", "ZhaoLiu", "Deng" }; var query = from name in container group name by name.Length into g select new { g.Key, Values = g };
例子演示了通過姓名的長度對一個姓名列表進行分組,并將分組的結果保持到局部變量g中,可以通過下面的代碼將query的結果輸出
foreach (var group in query) { Console.WriteLine("{0}:", group.Key); foreach (var item in group.Values) { Console.WriteLine(item); } }
let
let子句用于在查詢中添加一個新的局部變量,使其在后面的查詢中可見
var query = from p in persons let friendlyName = p.Gender == "男" ? "Mr" : "Ms" + p.Name select new { UserID = p.ID, FriendName = friendlyName }; foreach (var item in query) { Console.WriteLine("No:{0},Friendly Name:{1}", item.UserID, item.FriendName); }
在IEnumerable<T>上的其他擴展
Take Skip
用于選取前XX個或者和跳過前XX個,如選擇第11到20個則可以
query.Skip(10).Take(10);
OrderBy OrderByDescending
排序而已
query.OrderBy(c => c.Length);
Distinct Union Intersect Except 這些單詞都見過吧,分別就是取不重復,并集,交集,差集(這個貌似看看參數就明白了)
其他擴展都在Enumerable類下面了。
Linq的延遲加載特性
Linq查詢的執行結果是IEnumerable<T>類型,而對IEnumerable<T>,在內部,C#通過yield關鍵字實現迭代器達到延遲加載的目的。從而使Linq查詢只是在需要的時候才會被執行。
但是,某一些擴展方法在執行時會試圖遍歷整個容器,從而使延遲加載無效,如排序,聚合函數(Count,Sum,Average等。)
static IEnumerable<int> InfinityInts() { int count = 0; while (true) yield return count++; } public static void LazyLoad() { var query = from i in InfinityInts() select i; foreach (var i in query.Take(20)) { Console.WriteLine(i); } } public static void CantDoLazyLoad() { var query = from i in InfinityInts() select i; foreach (var i in query.OrderBy(i => i).Take(20)) { Console.WriteLine(i); } }
這里有個簡單的例子來證明,當使用Take時候,Linq語句能正常的執行,而當我們再Linq上使用一個Order By之后,程序就卡死了,當然,這是理所應當的,在失去延遲加載的特性之后,試圖對一個無窮序列排序的結果一定是outOfMemory。
最后
這都只是皮毛,感興趣的同學可以自己去MSDN查看更詳細的資料,最后,推薦一個工具和一個網站:
LINQPAd(http://www.linqpad.net/) 一個非常有用的Linq學習工具
Linq 101 微軟官方的Linq樣例代碼