表驅動法是一種編程模式,從表里面查找信息而不是使用邏輯語句(if…else…switch),當是很簡單的情況時,用邏輯語句很簡單,但如果邏輯很復雜,再使用邏輯語句就很麻煩了。
比如查找一年中每個月份的天數,如果用表驅動法,完全不需要寫一堆if…else…語句,直接把每個月份的天數存到一個數組里就行了,取值的時候直接下標訪問,最多針對二月判斷一下閏年。這么算的話,平時用的的HashMap,SparseArray也可以算是表驅動
表里可以存數據,也可以存指令,或函數指針等都可以。
示例
看一個例子,計算保險的保險費率,不同年齡的人費率是不同的,當判斷費率時就要寫很長的if…else…來判斷不同的年齡段對應的費率,如果要區分性別,那么判斷語句就會增加一倍,如果再判斷是否吸煙,是否已結婚,每一個條件都會使判斷增加一倍。雖然可以通過給是否已結婚,是否吸煙等設置一個比例系數,這樣就不用使判斷加倍,但這個系數可不能保證對不同年齡段或不同性別的人是相同的,而且如果要改變,就要很麻煩地改程序。
如果用表驅動法解決這個問題,直接拋棄邏輯判斷,使用一個表保存各個條件的費率,比如只考慮是性別,是否吸煙和年齡,就可以定義一個三維數組保存各個條件的費率
double[][][] rate = { {{1,2,3}, {1,2,3}}, {{1,2,3}, {1,2,3}} }; for (int gender = 0; gender < rate.length; gender++) { System.out.println("Gender:" + gender); double[][] genderRate = rate[gender]; for (int smoke = 0; smoke < genderRate.length; smoke++) { System.out.println("\tSmoke:" + smoke); double[] ageRate = genderRate[smoke]; System.out.print("\t\tAge:"); for (int age = 0; age < ageRate.length; age++) { System.out.print(ageRate[age] + " "); } System.out.println(); } } // Output Gender:0 Smoke:0 Age:1.0 2.0 3.0 Smoke:1 Age:1.0 2.0 3.0 Gender:1 Smoke:0 Age:1.0 2.0 3.0 Smoke:1 Age:1.0 2.0 3.0
當想取一種情況的費率時直接訪問數組就行了,比如封裝成下面的方法
private static double getRate(int gender, int smoke, int age) { return rate[gender][smoke][age]; }
使用表驅動法的好處是,當費率改變的時候,我們用不著依次改每個條件,直接修改這個費率表就行了,即使是新加條件,也只需要把這個費率表再加一維,修改一下根據條件獲取費率的函數就行了
還有另一個好處就是,完全可以把這個數據表保存到文件中,在程序運行的時候讀取這個文件,這樣如果條件不變只是各個條件對應的數據變化時,直接修改這個文件就行了,甚至不用修改程序。
另一個復雜的例子是打印文件中存儲的信息
一個文件中存儲了很多信息,這些信息可以分為幾十種,每個信息通過首部的一個信息ID分區
如果用傳統的邏輯方法,步驟大概是:
- 讀取每條消息的ID
- 然后大量的if…else…或switch判斷消息類型
- 針對每種消息調用相應的處理函數
即使是面向對象的方法,也會為每種消息定義一個類,這樣每添加一種消息都需要添加一個條件條件判斷或添加一個類。
那么用表驅動法怎么解決呢?
每條消息都由一些字段組成,這些字段是有限的,比如數字,字符串,布爾類型,日期等。我們可以用另外一個文件記錄每個消息對應的字段,如下所示
“Message Description”
Field1 Float “Prompt”
Field2 Date “Created Date”
每一種消息都通過上面的方式描述,所有消息類型被組織成一張表,這樣讀取消息的步驟就變為了:
- 讀取消息ID
- 找到消息ID定義的消息描述
- 讀取描述中的每一個字段,根據字段的類型調用相應的打印方法
這樣就只需要為每個字段類型定義一個打印方法,所有的消息打印方法都是一樣的,除非增加字段的種類,否則即使添加消息類型也不需要修改代碼
表數據的訪問
表數據的訪問方法我不打算按《代碼大全》中的分類方法劃分為:直接訪問、索引訪問與階梯訪問,這些只是針對特定的表的較優的訪問方法,像費率計算中的年齡條件,由于年齡是分段的,但也只需要進行一個轉換,可以說是直接訪問,根據年齡的區間可以把年齡分為不同的段,也可以說是階段訪問。(可以把各段的端點也保存到文件中增加靈活性)
像前面的計算每月的天數的問題,直接以月份為下標就能訪問需要的數據,或者像費率計算中的年齡條件,通過一個轉換就可以取到需要的數據
還有的情況是不方便直接訪問到數據的問的情況是,比如你有100個商品,編號為0-9999,這些編號是無規律的,你無法根據商品編號獲取表鍵,如果直接用商品編號為鍵,那就需要建立一個10000項的表,而其中只有100項有意義,如果商品相關的數據項很大會浪費很多空間,此時可以使用索引技術,建立一個100項的表存儲商品,然后建立一個10000項的索引表存儲商品編號到商品表的表鍵的映射。這樣會浪費一個索引表,但所幸是索引表的表項一般很小,問題不大。
即使應用索引沒有節約空間而是浪費了空間,應用索引也可能會節約時間,比如查詢數據庫。
當然,上面的例子只是為了說明情況,如果數據不是存儲在文件中而是在內存中,HashMap就行了,不過如果數據結構很復雜,計算HashCode也需要時間,當然可以優化HashCode的計算,如進行緩存等。還有稀疏矩陣等方法。
實際應用
表驅動法有沒有實際的應用?平時我們肯定或多或少想到了這個方法,只是就像設計模式一樣,大多數時候的思考只停留在當下的問題中,而沒有形成一個思想。當看到這個方法時我第一個想到的是Android啟動init時的init.rc。
以下是init.rc中zygote相關配置項:
service zygote /system/bin/app_process -Xzygote/system/bin --zygote --start-system-server class main socket zygote stream 660 root system onrestart write /sys/android_power/request_state wake onrestart write /sys/power/state on onrestart restart media onrestart restart netd
像這段代碼中的write和restart關鍵字,我們很容易看出這是一些指令,但是系統是怎么將這些關鍵字對應到相應的指令上的?這就要看一個有意思的文件:keywords.h
#ifndef KEYWORD int do_chroot(int nargs, char **args); int do_chdir(int nargs, char **args); ... int do_restart(int nargs, char **args); ... int do_write(int nargs, char **args); int do_copy(int nargs, char **args); ... int do_wait(int nargs, char **args); #define __MAKE_KEYWORD_ENUM__ #define KEYWORD(symbol, flags, nargs, func) K_##symbol, enum { K_UNKNOWN, #endif KEYWORD(capability, OPTION, 0, 0) KEYWORD(chdir, COMMAND, 1, do_chdir) ... KEYWORD(restart, COMMAND, 1, do_restart) ... KEYWORD(write, COMMAND, 2, do_write) KEYWORD(copy, COMMAND, 2, do_copy) ... KEYWORD(ioprio, OPTION, 0, 0) #ifdef __MAKE_KEYWORD_ENUM__ KEYWORD_COUNT, }; #undef __MAKE_KEYWORD_ENUM__ #undef KEYWORD #endif
使用keywords.h的地方在init_parser.c
#include "keywords.h" #define KEYWORD(symbol, flags, nargs, func) \ [ K_##symbol ] = { #symbol, func, nargs + 1, flags, }, static struct { const char *name; int (*func)(int nargs, char **args); unsigned char nargs; unsigned char flags; } keyword_info[KEYWORD_COUNT] = { [ K_UNKNOWN ] = { "unknown", 0, 0, 0 }, #include "keywords.h" }; #undef KEYWORD
在init_parser.c中include了兩次keywords.h
第一次時還沒有#defile KEYWORD
,所以會定義do_restart
、do_write
等函數,并且在內部字義KEYWORD
#define KEYWORD(symbol, flags, nargs, func) K_##symbol,
enum { K_UNKNOWN,
KEYWORD(restart, COMMAND, 1, do_restart) -> K_restart,
enum { K_UNKNOWN, ... K_restart, ... K_write, ... KEYWORD_COUNT, }
#include "keywords.h"
后,init_parser.c中DEFINE了KEYWORD,并聲明了一個結構數組#define KEYWORD(symbol, flags, nargs, func) \ [ K_##symbol ] = { #symbol, func, nargs + 1, flags, }, static struct { const char *name; int (*func)(int nargs, char **args); unsigned char nargs; unsigned char flags; } keyword_info[KEYWORD_COUNT] = { [ K_UNKNOWN ] = { "unknown", 0, 0, 0 }, #include "keywords.h" }; #undef KEYWORD
#include "keywords.h"
時#ifndef KEYWORD
內的語句就不會走,這一串KEYWORD宏被被這樣轉化:KEYWORD(restart, COMMAND, 1, do_restart) -> [ K_restart ] = { "restart", do_restart, 2, COMMAND },
#define SECTION 0x01 #define COMMAND 0x02 #define OPTION 0x04
這樣第二次include之后,就聲明了一個結構數組keyword_info,結構的成員分別是操作名、操作對應的處理函數、參數個數、操作類型。
通過對keywords.h的兩次include,init進程成功定義了一個枚舉和一張表,并且以枚舉為鍵查找表可以找到相應的處理函數,這樣就不用每次獲得操作類型后查收處理函數了,直接讀表就行了,這就是前面說的,表中不只可以存數據,還可以存指令、函數指針等。雖然從init.rc的命令名找到對應的枚舉名也需要查找,但從枚舉名到處理函數的查找方便多了。
文章列表