DB(BDB)與SQLite對比

作者: Skyzi  來源: 博客園  發布時間: 2011-04-23 22:28  閱讀: 7420 次  推薦: 0   原文鏈接   [收藏]  
摘要:嵌入式數據庫無需安裝,體積小巧,速度又很快,在很多場合可以替代目前流行的MySQL, SQLServer等大中型數據庫。本文介紹兩種嵌入式數據庫產品:Berkeley DB和SQLite,并著重討論它們與Java之間的接口。

  嵌入式數據庫無需安裝,體積小巧,速度又快,在很多場合可以替代目前流行的MySQL,SQL Server等大中型數據庫。本文介紹兩種嵌入式數據庫產品:Berkeley DB和SQLite,并著重討論它們與Java之間的接口。

  通常我們采用各種數據庫產品來實現對數據的存儲、檢索等功能,例如,Oracle,SQL Server,MySQL等。這些產品除提供基本的查詢,刪除,添加等功能外,也提供了很多高級特性,如觸發器,存儲過程,數據備份恢復,全文檢索功能 等。但實際上,很多的應用,僅僅利用到了這些數據庫產品的基本特性而已。而且在一些小型應用上,或者某些特殊場合的應用,比如桌面程序,這些數據庫產品就 明顯有一些臃腫。在這些情況下,嵌入式數據庫的優勢就特別明顯了。

  嵌入式數據庫無須獨立運行的數據庫引擎,它是由程序直接調用相應的 API去實現對數據的存取操作。更直白的講,嵌入式數據庫是一種具備了基本數據庫特性的數據文件。嵌入式數據庫與其它數據庫產品的區別是,前者是程序驅動 式, 而后者是引擎響應式。嵌入式數據庫的一個很重要的特點是它們的體積非常小,編譯后的產品也不過幾十K。這不但對桌面程序的數據存儲方案是一個很好的選擇, 也使得它們可以應用到一些移動設備上。同時,很多嵌入式數據庫在性能上也優于其它數據庫,所以在高性能的應用上也常見嵌入式數據庫的身影。

  下面介紹的是兩個開放源代碼的嵌入式數據庫,Berkeley DB和SQLite。同時側重介紹如何應用Java連接這兩種嵌入式數據庫。

  一. Berkeley DB

  1. 簡介

  Berkeley DB是一款健壯的,高速的工業級嵌入式數據庫產品,你可以在它的官方主頁(見參考鏈接一)上發現很多知名的公司都采用了這款嵌入式數據庫。 Berkeley DB的一個很重要的特點是就是高速存儲。在高流量,高并發的情況下,Berkeley DB要比非嵌入式的數據庫表現得更加出色。所以在一些技術實現上,Berkeley DB被作為大型關系數據庫的中間數據緩沖層,用來快速的保存數據,可能會在適當的時刻再導入到大型數據庫中,進而應用大型數據庫所提供的更為高級的特性。

  Berkeley DB雖然是開源的產品,但對某些條件下的商業性應用,卻不是免費的,而且價格頗為昂貴。這些商業條件排除了開源的情況,不發放分布版本的情況,等等。比 如,如果你的程序是開放源代碼的或者僅僅應用到單一的網站上,在這種情況下,Berkeley DB是免費的。

  2. 獲得Java與Berkeley DB的接口

  Berkeley DB目前的版本是4.1.25,自帶了Java接口。下載的壓縮包中包含C和Java語言的源代碼和編譯配置文件。在Windows平臺,可以用MS Visual C++ 6.0或MS VC.Net編譯。用VC6編譯的操作如下介紹:在源代碼的build_win32路徑下打開VC的工程文件,之后在Build菜單中的Set Active Configuration選擇db_java win32 release編譯選項。在VC的Tools菜單Options選項中指定JNI.H等Java本地化接口編譯時所需要頭文件的位置。

  你會在JDK的 include路徑下找到這些頭文件, 例如加入的路徑可能會是這樣的:C:\jdk1.4\include和C:\jdk1.4\include\ win32。最后在Tools菜單中Options選項還要設置Javac.exe和Jar.exe的執行路徑,這個設置會使VC開發環境也能調用 Java編譯器,從而在VC環境下直接完成對Java接口類的編譯和打包。在編譯后,在release路徑下的文件中找到db.jar, libdb41.dll, libdb_java41.dll,這三個文件組成了Berkeley DB的Java接口程序包。

  3. 應用Java與Berkeley DB的接口

  Berkeley DB并不是一個關系型的數據庫。不能應用標準的SQL語句對數據庫操作,對它的操作要調用專用的API實現。這些API提供了查詢、插入、刪除等功能。比 如com.sleepycat.db.Db類代表數據庫對象。Db類的put()方法完成的是插入功能,get()方法完成的是讀出數據的功能。 com.sleepycat.db.Dbc是Berkeley DB的游標類,提供了遍歷數據庫記錄的功能。

  Berkeley DB每一個記錄都有一個鍵值和對應的數據值,而鍵值和數據必須是類com.sleepycat.db.Dbt的對象或其子類的對象。Dbt提供了一些方法 可以將byte數組或Object對象保存到Dbt的對象中去。比如,Dbt類中的set_data(byte[])或set_object (Object)方法。注意到目前Berkeley DB中的Java API命名方法并不符合Java的命名規范,比如set_data()方法應該命名為setData()方法。Berkeley DB許諾在下一個版本中會提供符合命名規范的Java API。

  Berkeley DB對任何存入的數據都是直接原樣存儲到數據文件中去,無論其是二進制數據還是ASCII或Unicode等編碼的文本。通常可以利用這一特性和Java串行化的概念方便的進行數據的存取。例如聲明一個類

 
1. public class AccountInfo implements Serializable{
2. //帳戶信息
3. public String loginName;
4. public String password;
5. public boolean auotLogin;
6. }

  在 這個 AccountInfo類中僅僅包含了數據項的定義。我們完全可以將這個類看作數據庫的表中字段定義。可以用Berkeley DB保存AccountInfo對象的串行化二進制數據,以此來保存這個對象中的變量值。在操作中,先對Dbt的對象調用set_object (AccountInfo)方法,而后把這個Dbt對象作為一條紀錄保存到表中。當然,我們也可以應用繼承Dbt類的方法來完成對數據的保存。

  下面這段簡單代碼演示如何將數據存入到數據庫中,然后再用游標對象瀏覽全部數據。

 
1. //注意,下面的程序的忽略了對異常處理,寫入數據初始化等等一些代碼,請在適當修改后再編
2. //譯運行它
3. Db dbFile = null;
4. //生成Db對象
5. dbFile = new Db(null, 0);
6. //用BTree方式打開數據庫,庫文件是在c:/temp下的mydata.db文件,表名是employee
7. //如果數據庫不存在,則自動生成一個新的數據庫。
8. dbFile.open(null,"c:\\temp\\mydata.db","employee",Db.DB_BTREE,
9. Db.DB_CREATE,0);
10. Dbt key = new Dbt();
11. Dbt data = new Dbt();
12. //向庫文件中插入一條數據,如果已經存在,打印出錯信息
13. if (dbFile.put(null,key, data, Db.DB_APPEND) == Db.DB_KEYEXIST) {
14. System.out.println("Key already exists.");
15. }
16. //關閉數據文件
17. dbFile.close(0);
18. //重新打開數據文件
19. dbFile = new Db(null, 0);
20. dbFile.open(null, "c:\\temp\\mydata.db", "employee", Db.DB_UNKNOWN,
21. 0, 0644);
22. // 聲明一個數據庫游標Dbc對象iterator
23. Dbc iterator = dbFile.cursor(null, 0);
24. // 遍歷整個表
25. Dbt key = new Dbt();
26. while (iterator.get(key, data, Db.DB_NEXT) == 0)
27. {
28. System.out.println("reading");
29. }
30. //關閉游標和數據文件
31. iterator.close();
32. dbFile.close(0);

  在運行Berkeley DB的程序時勿必在系統環境變量PATH中設置libdb41.dll和 libdb_java41.dll所在的路徑。

  4. Berkeley DB的存儲模式

  Berkeley DB提供了四種存儲數據的模式:Btree,Hash,Queue和Recno。在打開數據庫的時候要指定一種存儲模式,比如上例中open()方法中的參數Db.DB_BTREE就是指定以Btree模式打開數據庫。

  Btree 模式是以排序的二叉樹的方式存儲,Hash是以線性哈希表的方式存儲。Queue用邏輯記錄號做為鍵值,以定長的數據為記錄值。Recno方式也以邏輯記 錄號做為鍵值,但可以保存定長或變長的記錄值。這里提到的邏輯記錄號有兩種,可變的和固定的。可變邏輯記錄號會根據數據記錄的增加與刪除做相應的變化。比 如在數據庫中共有100條記錄,如果刪除第80條記錄,那么第81條記錄的邏輯記錄號會自動變成80,以此類推,第100條記錄邏輯記錄號會變成99。固 定的邏輯記錄號則無論數據庫如何操作都不會有變化。Queue模式下,邏輯記錄號只能是固定方式。 Recno模式則可通過配置來選擇是采用那種類型的記錄號作為鍵值。Btree模式也可以通過設置,將可變的邏輯記錄號做為鍵值。

  這幾種 存儲模式各有優缺點,要根據具體的需求來選擇。當鍵值不想用邏輯記錄號時Btree或Hash是必須的選擇。 Btree方式比較適合連續的順序讀取,比如,當鍵值是時間值,如果經常有從某一時間點開始連續讀取后繼的記錄的操作,Btree是一種很好的選擇。對隨 機的跳躍式讀取,Hash模式則更為恰當。Queue和Recno都以記錄號為鍵值,但前者適合先進先出的讀取方式。Recno則通常是存取變長文本記錄 的理想存儲模式。

  5. Berkeley DB Environment的概念

  Berkeley DB Environment為一組數據庫同時提供參數設置。更為重要的是,如果要應用更高級的特性,必須要使用Environment功能,比如在想要對保存的數據進行加密存儲時。

  6. 更多特點

  除了最基本的插入、查詢、刪除功能以外,Berkeley DB還提供了一些特性,比如Transaction,數據加密,同步加鎖控制,錯誤日志等功能。下面的圖片是Berkeley DB功能示意圖。

  二. SQLite

  1. 簡介

  相信PHP的開發人員一定不會對SQLite感到陌生,因為在PHP5中已經集成了這個輕巧的內嵌式數據庫產品。SQLite與Berkeley DB相比,在操作語句上更類似關系型數據庫的產品。絕大多數標準的SQL92語句SQLite都能支持。

  SQLite 的版權允許無任何限制的應用,包括商業性的產品。在參考鏈接二上提供的SQLite官方主站上可以下載到編譯后的SQLite程序。但推薦應用CVS工具 下載最新版本的SQLite源代碼。如果在*nux平臺下,可直接用make編譯。如果在Windows 平臺,常用的有兩種方法,一是應用在Windows平臺下的Linux仿真程序,如MingW或Cygwin提供的make來編譯。

  二是應用MS VC平臺編譯。后者設置略有麻煩,但可仿照參考鏈接五上提供的MS VC6工程文件的樣例。應用到這個樣例的時候,要注意的是由于SQLite源代碼在不斷更新,如果直接應用樣例所提供的VC6工程文件編譯會出現一些問 題,讀者要根據具體的情況稍微調整一下編譯的設置。

  2. 編譯第三方Java接口

  SQLite 源代碼是C,而且官方網站上只提供了C和Tcl語言的接口。為了應用Java接口,要采用第三方的接口驅程,可在參考鏈接三中找到這個Java接口程序。 這個接口提供了兩種連接SQLite的方式:一是直接用JNI技術調用SQLite的C語言接口,這種方式要求開發人員要對SQLite本身的API也有 一定的了解。在第二種方式中,接口程序實現了Java標準規范的JDBC接口,這樣開發人員只要對JDBC有了解就可以了。

  下面介紹在Windows系統MS VC6環境中編譯SQLite Java接口(同時包括JNI和JDBC兩個接口)的過程。如果你對C語言編譯的設置很熟悉,可以跳這這段介紹。

  第 一步先把SQLite源代碼編譯成Lib靜態庫文件。具體的步驟可以直接應用下面參考鏈接中提供的MS VC6工作區文件,其中有一個編譯SQLite到靜態庫的設置。編譯成功后得到SQLite.lib文件。

  第二步要建立一個新的VC DLL項目,然后和上面介紹的Berkeley DB在編譯Java本地化接口的設置一樣,在VC的Tools菜單Options選項中指定JNI.H等JNI編譯所要的頭文件位置。同時還要指定 sqlite.h頭文件位置,這個文件是在生成SQLite靜態庫的時候自動生成的,可以在SQLite.lib文件所在的工作區目錄下面找到它,例如加 入的路徑為C:\sqlite\msvc6。然后在Project菜單的setting選項設置Link到SQLite.lib庫文件,并再次在 Tools菜單中Options指定SQLite.lib的查找路徑。注意有些情況下可能要設置予編譯選項HAVE_SQLITE_COMPILE以便使 用SQLite中VM的一些功能。編譯成功后可得到Sqlite_jni.dll文件。

  第三方接口庫中的Java代碼包含JNI接口和多個版本的JDBC接口程序,可根據你的JRE的版本選擇相應的JDBC程序。編譯這些Java代碼的過程這里就不做敘述了。

  編譯后的Java類包加上前面得到的Sqlite_jni.dll文件,組成了SQLite的Java接口庫,在應用Java語言調用JDBC或JNI接口時,都是通過應用Java的本地化技術調用Sqlite_jni.dll文件,完成對SQLite數據庫的操作。

  3. 應用JNI直接調用SQLite功能

  下面這段代碼演示如何應用JNI接口操作SQLite。可以看到Database類的exec()方法是執行SQL語句的關鍵:

 
1. Database db = new Database();
2. try {
3. //打開數據庫
4. db.open("c:\\temp\\mydata.slt", 0666);
5. db.interrupt();
6. db.busy_timeout(1000);
7. db.busy_handler(null);
8. db.exec("create table account (name varchar(10),gale boolean)"
9. ,result);
10. db.exec("insert into account values('steve','m')", result);
11. db.exec("select * from account",result);
12. //關閉數據庫
13. db.close();
14. } catch (Exception e) {
15. e.printStackTrace();
16. }

  4. 應用JDBC連接SQLite

  用"SQLite.JDBCDriver"作為JDBC的驅動程序類名。連接JDBC的URL格式為jdbc:sqlite:/path。這里的path為指定到SQLite數據庫文件的路徑,例如:

  jdbc:sqlite://dirA/dirB/dbfile
  jdbc:sqlite://DRIVE:/dirA/dirB/dbfile
  jdbc:sqlite://COMPUTERNAME/shareA/dirB/dbfile

  參考下面的應用JDBC連接SQLite的例程:

 
1. //聲明JDBC驅動程序
2. Class clz = Class.forName("SQLite.JDBCDriver");
3. //連接數據庫
4. Connection conn = DriverManager.getConnection("jdbc:sqlite:/c:/temp/e2.db");
5. Statement stmt = conn.createStatement();
6. //生成person表,包含名子和年齡字段
7. stmt.execute("create table person (name varchar(100),age int)");
8. //插入數據
9. stmt.execute("insert into person values('steve',25)");
10. //用SQL語句讀出數據
11. result = stmt.executeQuery("select * from person");
12. while(result.next()){
13. System.out.println(result.getString(1));
14. System.out.println(result.getInt(2));
15. }

  運行程序時要在 Java.exe命令行加入選項java.library.path指定到Sqlite_jni.dll所在的路徑。例如,如果 Sqlite_jni.dll放在c:\sqliteNative 路徑下面,運行類com.e2one.MyClass 的命令行將會是這樣:java -Djava.library.path=c:\sqliteNative com.e2one.MyClass。

  5. SQLite的特點

  SQLite 是無數據類型的數據庫。雖然在生成表結構的時候,要聲明每個域的數據類型,但SQLite并不做任何檢查。開發人員要靠自己的程序控制輸入與讀出數據的類 型是正確的。這里有一個例外,就是當主鍵為整型值時,如果要插入一個非整型值時會產生異常。另外,雖然在插入或讀出數據的時候是不區分類型的,但在比較的 時候,不同數據類型是有區別的。比如:

 
1. CREATE TABLE MyTable(a INTEGER, b TEXT);
2. INSERT INTO MyTable VALUES(0,0);

  當執行下面的查詢:

 
1. SELECT count(*) FROM MyTable WHERE a=='00';

  會返回一條記錄,因為字段a的類型是整型,而數字00與0是相等的。

  而執行下面的查詢則不會返回記錄:

 
1. SELECT count(*) FROM MyTable WHERE b=='00';

  因為字段b是字符類型,字符"00"與"0"是不相等的。

  SQLite提供了對Transaction的支持。應用Transaction即保證了數據的完整性,也會提高運行速度,因為多條語句一起提交給數據庫的速度會比一條一條的提交方式更快。

  對 二進制數據,SQLite不能直接保存。但可以先將二進制的數據轉換成ASCII編碼,然后再保存。Base64編碼機制是最常見的把二進制數據轉換成 ASCII編碼的手段。在SQLite的C語言代碼encode.c中提供了Base64編碼的功能。對Java而言,在參考鏈接六中提供的Apache 的XML RPC項目中可以找到一個Base64編碼的例子。

  上面介紹了兩個比較常見的嵌入式數據庫,Berkeley DB速度極快,可靠性高,但學習起來有一定難度。SQLite則簡單易用,速度也很快,又可以應用標準的JDBC連接,但它功能卻照Berkeley略有遜色,比如二進制數據的處理等。

0
0
 
標簽:BDB SQLite
 
 

文章列表

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()