文章出處

回想過往,我意識到讓我痛恨微積分課的不是數學,而是從來就沒有人想到要告訴我數學的意義是什么。

相信我,技術細節十分重要(也十分有趣),但是如果你不知道它們的出發點是什么,那么擺在你面前的將會是一堆天書般的符號。如果連你自己都不相信學習統計學是一件有意義的事情,那么你或許根本不會去關心所謂的出發點。

用數據說謊容易,但是用數據說出真相卻很難。

這對于概括場上進行的比賽非常有用。傳球效績指數是否起到了簡化問題的作用?是的,但這同時也反映了描述統計學的優勢和劣勢。僅憑一個數字,你就可以知道杰·卡特勒在與格林灣的那場比賽中敗給了亞倫•羅杰斯;但你卻無法從這個數字中讀出運動員在比賽中的運氣是好是壞;不知道他是否傳出了一個漂亮的過人球卻被愚蠢的隊友錯過了,導致這個球最終被對方截獲;不知道他是否在比賽的某些關鍵時刻頂住壓力發揮出色(因為每一次的成功發球在統計時都被同等對待,不論是決定性的三次觸地還是比賽接近尾聲時那些毫無意義的發球);不知道那一場的防守是否糟糕透頂……讀不出來的信息還有很多。

在美國,衡量一個學生的高中和大學學業表現的方法是計算平均成績點數(GPA),通俗點兒說就是學生在校的平均成績。如果一門課的成績為A,那么就可以獲得4點,B是3點,C是2點,以此類推。當高中畢業生申請大學、大學畢業生找工作時,GPA就是評價他們學術潛力的一個方便快捷的指標。一個GPA為3.7的學生顯然要比另一個GPA只有2_5的學生的實力強,這就使得GPA成為一個受人歡迎的描述性數據,不僅計算容易、理解容易,而且對不同學生進行比較也很容易。         但這一衡量指標并不完美。GPA沒有反映不同學生所選課程的難易程度,假設一個GPA為3.4的學生選的都是相對沒有挑戰性的課,而另一名GPA只有2.9的學生的課程表里盡是微積分、物理這類難學的課,我們能一口判定孰優孰劣嗎?我以前所在的高中就試圖解決這一問題,學校規定比較難學的課程會有額外的加分,這些課程如果期末成績為A,那么就會有5點的獎勵,而非原來的4點。但這也帶來了新的問題,我的母親很快就反應過來,在新的GPA計算方法下,對于一個選了很多加分課程的學生來說(比如說我),其他普通課程就算做到最好,也就是拿到了A,最終的平均分也會被拉下來。

概率在有些情況下甚至可以被用來判斷考試作弊。一家由美國學術能力評估考試(SAT)的一位開發者創辦的考試安全公司,專注于提供“數據取證”服務,為客戶尋找考試作弊的蛛絲馬跡。舉個例子,在學校或考點進行的考試,多名考生以同樣的答案答錯同一道題的情況是極少見的,通常發生的概率只有不到百萬分之一,如果有類似的情況出現,該公司就會予以標記。其數學邏輯源自一個事實,即當大部分考生對某道題都給出了正確答案時,我們并不會感到大驚小怪,因為這是他們應該做的事情。這些考生有作弊的可能,但他們憑一己之力做對題的可能性更大。但是當這一群考生答錯題的時候,他們的錯誤答案不應該是完全一樣的,如果錯誤答案完全一樣,那么他們就有可能是相互抄襲(或者通過短信息分享答案)。此外,還有幾種情況會引起該公司的注意,比如在一場考試中,考生在難題上的正確率大大高于容易的題(這意味著他們有可能提前就知道答案);又或者在一場考試中,收上來的答題卡上“錯改對”的涂改痕跡要明顯多于“對改錯”(這意味著有可能是老師或監考人員在考試結束后對答題卡動了手腳)。

人均收入僅僅是將整個國家所有人的收入加起來再除以總人口數,我們無法從這個計算結果中得知各階級收入所占的比例,無論是1980年還是2010年。正如“占領華爾街”運動的示威者所指出的,處于收入排行榜頂端的那1%的人,他們收入的爆炸性增長能夠顯著地拉動人均收入水平的整體提升,但同時不需要往剩下的那99%的人的口袋里多放一分錢。也就是說,在普通美國人的生活陷入水深火熱的同時,美國的人均收入依然能夠節節攀升。

現在讓我們回到那個更加重要的問題上來,談談美國中產階級的經濟健康狀況。當然如果我們能夠找到類似于擊球率這樣言簡意賅的,甚至更好的經濟衡量指標,那是最理想的,我們需要一個簡單且準確的數字,來說明一個典型的美國工人最近幾年的經濟狀況,那些我們稱之為“中產階級”的人到底是更富了、更窮了,還是在原地踏步?一個合理的答案——肯定不會有“正確”的答案——就是,計算一代美國人(大約為30年)的人均收入,觀察其變化趨勢。人均收入是一個簡單的平均數:總收入除以人口數,這樣得出的結果就是美國的人均年收入從1980年的7787美元上升到2010年的26487美元。你看,真是一個值得慶祝的成就!         但只有一個小問題,我的計算方法在技術上是正確的,但是對于我一開始提出的那個問題來說,卻是完全錯誤的。首先,上面的數據沒有考慮通貨膨脹因素,1980年的7787美元相當于2010年的約19600美元。但僅進行通貨膨脹因素的處理還不夠,更大的問題是,我們需要知道的是普通美國人的收入,而不是泛泛的人均收入,這兩者有本質上的區別。

在西雅圖的一家中檔酒吧的吧臺前,坐著10個人,他們每年的平均收入都是3.5萬美元,也就是說,這組人的人均年收入為3.5萬美元。這時候,比爾•蓋茨走進了這家酒吧,肩膀上立著一只會說話的鸚鵡(其實這只鸚鵡與這個事例一點兒關系都沒有,之所以要提一下鸚鵡是想給這個案例增加點兒樂趣),假設他在這個案例中的年收入為10億美元。當比爾·蓋茨在吧臺前的第11把発子上坐下后,這組人的平均年收入便迅速上升到了將近9100萬美元。很顯然,之前的那10個人絲毫沒有變得更富有(盡管比爾•蓋茨很有可能會幫他們付一兩次酒賬,但僅此而已)。如果我說吧臺前的這群人平均年收入為9100萬美元,這句話在數據上是正確的,但同時也相當具有誤導性。這里不是一個億萬富翁會經常光顧的酒吧,只不過正好有一群收入不高的普通人坐在了比爾•蓋茨和他的會說話的鸚鵡旁邊。平均數必須對“異常值”有足夠的敏感性,這也是為什么我們不應該用人均收入來衡量美國中產階級的經濟健康狀況。因為在收入分配的頂端,有著一群收入暴漲的美國人——公司高管、對沖基金經理,以及像德瑞克•基特這樣的運動員,普通美國人的收入會被這些巨富們的光環掩蓋,就像一群失意的普通人坐在比爾·蓋茨身邊一樣。         出于這個原因,我們還有一個數據可以用來表示分配的“中間位置”,但與平均數有所不同,這個中間位置就是中位數。中位數正好將一組數字一分為二,1/2位于中位數之前,另外1/2位于中位數之后(如果遇上一組數字的數量為偶數,那么中位數就是中間兩個數的平均值)。回到剛剛酒吧的那個例子,原先坐在吧臺前的10個人的年均收入中位數為3.5萬美元,當比爾•蓋茨和他的鸚鵡入座之后,這11個人的年收入中位數依然為3.5萬美元。如果你將他們按照收入多少來排座的話,那么坐在第6把発子上的人的收入就代表了整組人收入的中位數。假如此時沃倫•巴菲特走了進來并坐在了比爾·蓋茨的身邊,他們的中位數還是不會改變。

無論是中位數還是平均數,要求出它們并不難,關鍵在于根據具體情況確定哪一個“中間位置”能夠更準確地反映問題的實質。與此同時,中位數還有一些有用的“親戚”,正如我們之前已經討論過的,中位數將一組數據從中間分為兩部分,這組數據其實還可以繼續分為4部分,我們稱之為“四分位數”。第一四分位數由處于底部的25%的數據構成,往后的25%的數據構成了第二四分位數,以此類推。同樣的,收入分配數據還可以分為“十分位數”,每組包含10%的數據。如果你的收入屬于美國人均收入分配頂層的那10%,那么這意味著你要比90%的美國人掙得都多。我們還可以細分下去,將收入數據分為100份,也就是“百分位數”,每個百分位數都代表1%的數據,也就是說,第一百分位數表示位于底部的1%的人的收入,第99百分位數代表收入分配數據中收入最高的那1%的人。

正態分布的“美”好比邁克爾·喬丹在球場上的力量、靈巧和優雅,它來自于一個事實,那就是我們通過定義就能夠清楚地知道,有多少數值位于平均值一個標準差的范圍之內(68.2%),有多少數值位于兩個標準差的范圍以內(95.4%),還有多少數值位于3個標準差的范圍以內(99.7%),以此類推。

描述統計學經常會比較兩個數據或數量。例如,我比我的哥哥高1英寸,今天的氣溫比歷史平均值高9攝氏度等。這些比較之所以易于理解,是因為我們大部分人都對其中所包含的數量單位并不陌生。當形容身高時,1英寸并不是很多,因此你可以推測我和我的哥哥的身高看上去其實差不多;相反的,無論是在一年中的哪個季節哪個時刻,9攝氏度都是一個非常引人注目的溫差,因此我們可以說那一天比平時要熱很多。但如果我告訴你,某品牌麥片中A配方的鈉含量要比B配方高31毫克,除非你恰好懂得很多關于鈉的知識(以及該品牌麥片的食用分量),否則上面這句話并不能給你帶來特別具體的信息。又或者我對你說,我的外甥阿爾在2013年比2012年少掙了5.3萬美元,我是不是應該對他表示擔心呢?阿爾也許是一位對沖基金經理,5.3萬美元只不過是他年薪的一個零頭。         在鈉含量和收入這兩個例子里,我們都缺少背景資料。賦予這些比較型數據意義的最簡單的方法就是使用百分比。如果我跟你說,某品牌麥片A配方的鈉含量比B配方高了50%,我的外甥阿爾在2013年的收入與2012年相比減少了47%,是不是就更容易理解了?用百分比來表示變化,可以讓我們有一種用刻度測量的感覺

當連衣裙的價格為75美元時,新來的副經理將價格上調25%,這里就是許多人容易犯錯的地方。上浮的25%參照的是連衣裙的新價格,而非最開始的價格,所以上漲的價格應該是25%x75美元=18.75美元,最后的售價為75美元+18.75美元=93.75美元(而不是很多人認為的100美元)。這個例子的關鍵在于,百分數變動表示的是某個數字相對于其他事物的變化值,因此我們最好先弄清楚其他事物到底是什么。

我曾投資過大學室友開的一家公司。由于這是一家私營公司,因此在向股東披露信息方面并沒有什么硬性要求。轉眼幾年過去了,我的這筆投資的命運如何,我毫不知情,我的這位前室友對于這個話題也是只字不提。最后,我終于收到了一封信,信上說公司的利潤相比前一年提高了46%。但到底提高了多少美元,信上沒寫,也就是說我還是完全不知道自己的投資到底表現如何。假設上一年公司贏利27美分——基本等同于沒有,那么這一年公司的贏利就為39美分——還是基本等同于零,但就從27美分到39美分來說,公司的利潤的確上漲了46%,這一點沒有問題。如果告訴你公司兩年的累計贏利還不夠買一杯星巴克咖啡,那么收到這樣的股東信件可真夠晦氣的。         但是,我的室友是這樣的人嗎?顯然不是。他最終把公司賣掉了,換回了數億美元的資金,我的那份投資的回報率也高達100%。但你還是不知道我最后賺了多少錢,因為我并沒有告訴你我最初投了多少錢,這不是更加能證明我的觀點嗎?讀到這里,你是不是對什么是“其他事物”有點兒感覺了?

首先,我們應該弄明白“精確”和“準確”這兩個詞之間至關重要的區別。這兩個詞不可以相互替代。“精確”反映的是我們描述事物的精度,比如在描述你從家到公司的距離時,“41.6英里”就比“大約40英里”更精確,當然比“相當長的一段路”更精確一些。如果你問我最近的加油站在哪里,我會告訴你往東1.265英里,這就是一個精確的回答。但問題也隨之而來:如果加油站在西邊,那么這樣的一個回答就是完全不準確的。也就是說,如果我告訴你:駕車大約10分鐘,當你看到一家熱狗售賣攤點時,加油站就在你的車右前方幾百碼的地方,如果你經過貓頭鷹餐廳,就說明你的車開過了。這樣的一個回答雖然沒有“往東1.265英里”那么精確,但顯然更好,因為我為你指明了前往加油站的正確方向。一個數據的準確與否表明了其與真相是否一致,因此將“精確”和“準確”混為一談是要付出代價的。如果一個答案是準確的,那么在這個基礎上當然是越精確越好;但如果答案從一開始就是不準確的,那么再精確也毫無意義。

無論是平均數還是中位數,都是衡量一組數據的“中間位置”或“中心趨勢”。平均數就是所有數據求和之后再除以個數(3、4、5、6、102的平均數是24)。中位數就是一組數據最中間的那個點,有一半數據位于這個點之前,有一半數據位于這個點之后(3、4、5、6、102的中位數是5)。現在,聰明的讀者一定會注意到24和5之間存在著巨大的差異。所以,如果出于某種考慮,想要讓這組數據在描述時顯得數值大一些,那么我會選擇求它們的平均數;但如果我想讓數值看上去小一些,我肯定會將關注點放在中位數上。

中位數的決定性特征——不考慮數據距離中間位置有多遠或是多近,而是關注它們是高于中間位置還是低于中間位置——反而成為它的弱點。與之相反,平均數恰恰是由數據分布決定的。從準確性的角度來看,平均數和中位數孰取孰舍,關鍵就在于這個數據分布里的異常值對事實的真相是起到扭曲的作用,還是其重要的組成部分。再次強調,判斷比數學更重要。當然,沒有人強制你一定得選中位數或平均數,任何一個復雜綜合的數據分析都會包含這兩個數據。所以,當只有其中一個數據出現的時候,你就要注意了,有可能只是出于言簡意賅的考慮,但也有可能是某些人別有用心地想用數據“說服”你。

通貨膨脹。今天的1美元和60年前的1美元的價值是不一樣的:今天的1美元能買到的東西更少。由于通貨膨脹的存在,1950年花1美元能買到的東西在2011年可能要花9.37美元。因此,在沒有考慮通貨膨脹因素的情況下,任何有關1950年與2011年的金錢比較都是不準確的,而且比歐元與英鎊的比較更加離譜兒,因為歐元和英鎊的價差比1950年的美元與2011年的美元的價差還小。

談到學校的質量,這是一個必須予以衡量的關鍵問題,因為我們都希望獎勵并效仿“好”學校,懲罰或整頓“差”學校(具體到學校內部,我們在衡量教師的教學水平問題上也面臨類似的難題)。考核學校和教師最常用的方法就是看學生的考試分數,統考結束后,學生的優異成績就是教師和學校最好的金字招牌;與之相反的,糟糕的成績無疑會釋放出一個清晰的信號:相關教師應該被辭退,而且越早辭退越好。這樣看來,僅憑考試分數我們就能徹底改善公共教育系統了,對嗎?         錯。在評價教師和學校時,如果只看考試分數是會鑄成大錯的。不同學校的學生,他們的背景和能力是很不一樣的,比如說,學生父母的教育程度和收入會對孩子的成績產生不可忽視的影響,不論孩子上的是哪所學校。在這里,我們所缺少的那個數據恰好就是解答這個問題唯一需要的:學生的學業表現有好有差,但其中有多少比例要歸功或歸咎于學校(或所在的班級)呢?         從小就生活在衣食無憂、書香門第家庭里的孩子,一般來說從進入幼兒園的第一天起就有可能會比別的孩子的成績好。相反的情況同樣成立,有些學校的學生天資平平,雖然教師教得很好,但是學生的成績還是處在一個低水平上,如果沒有這些老師的付出,那些學生的成績會更加慘不忍睹。

紐約州就因為類似的統計陷阱而栽了大跟頭,付出了慘痛的代價。州政府之前出臺了“記分卡”制度,對接受心臟搭橋手術的病人的死亡率進行統計,以便讓公眾在選擇心臟科醫生時有一個參考。這似乎是一個完全合情合理,而且有所幫助的描述統計學在政策制定過程中的應用。心臟搭橋手術是治療心臟病最常用和有效的方法,心臟病人在搭橋手術過程中的死亡比例當然是一個非常重要的數據,而作為個人根本沒有辦法了解到確切數據,因此政府出面收集并向公眾公開這一數據是合乎情理的。但就是這么一個“好”政策,卻導致了更多病人的死亡。         心臟科醫生肯定會在意他們的“記分卡”。但是對于一個外科醫生來說,降低病人死亡率最簡單的方法并不是降低病患死亡人數,因為大部分醫生在救死扶傷方面已經竭盡全力了。降低死亡率最簡單易行的方法是拒絕為那些病況最嚴重的病人動手術。羅徹斯特大學醫學與牙醫學院的一項調查表明,以服務病人為初衷的記分卡,到頭來反而會給病人造成傷害:在參與調查的心臟科醫生中,有83%的醫生表示正是由于公開了死亡率數據,一些本來可以從搭橋手術中獲益的病人最終沒能被安排進行手術;79%的醫生表示收集并公開死亡率數據或多或少地影響了他們的治療決策。這一看似有用的描述性數據存在一個可悲的矛盾,而心臟科醫生也只能理性地接受并釆取自己的對策,就是讓那些最需要心臟搭橋的病人遠離手術臺

面對《美國新聞與世界報道》收集的所有數據,我們不知道這些排名到底是想給那些即將跨入大學校門的高中畢業生們哪方面的指導。站在學生的立場,最值得關注的方面應該是學業本身:如果我申請了這所大學,我能在學業上獲得怎樣的幫助?橄欖球迷聚在一起時經常會抱怨傳球效績指數的構成,但卻沒有人否認其組成部分——完成率、碼數、觸地得分和截球——同樣是評估一名四分衛的整體表現不可或缺的重要參考。但回到大學排名上來,情況就完全不同了。《美國新聞與世界報道》過于強調“輸人”(例如,錄取了哪些學生、教職員工的薪資待遇、全職教授所占的比例等),反而忽略了教學“輸出”,除了僅有的兩個例外——新生留級率和畢業率,但實際上就連這兩個指標也不是衡量教學質量的。正如邁克爾·麥弗遜所指出的:“從這份排名中,我們無從知曉進入某所大學經過4年的學習之后,學生的能力是否提高了,他們的知識是否增長了。”

例如,身高特別高或矮的人的體重一般也會特別重或輕)

找幾個跟你有相同趣味的人并讓他們向你推薦一些電影。既然你那么愛看我喜歡的電影,厭惡我認為不好看的電影,那么你覺得喬治•克魯尼的新片怎么樣?         這就是相關性的真諦。

概率并不是確定的。你不應該購買彩票,但你依然有可能通過購買彩票發財。是的,概率學能夠幫助我們揪出作弊者、追蹤大壞蛋,但若使用不當,我們就有可能把無辜的人送進監獄。

沒有辦法告訴你假如那1%的情況發生,事態會有多嚴重。很少有人會關注“尾部風險”(位于分布曲線末尾的小概率事件),以及這些小概率風險所帶來的災難性后果。(如果你從酒吧出來打算回家,雖然你的血液中酒精含量只有0.15,撞車死亡的概率還不到1%,但酒后駕車依然是一個不明智的決定。)更甚的是,許多公司還天真地以為自己對那些小概率風險已經作了充足的準備,這無疑是雪上加霜。美國財政部前部長鮑爾森解釋說,許多公司覺得只要出售資產,就能在很短的時間內籌集到現金。但危急關頭,幾乎所有公司都需要現金,這些公司全都在想辦法出售相同類型的資產,從風險管理的角度看,這就像一個人說:“有災難降臨?那也沒必要事先儲備凈水,到時候只需要去超市買幾瓶礦泉水就行了。”可是當小行星真的撞上了你所在的小鎮,生活在這里的其他5萬名居民也想著要去超市買水,那么等你趕到超市的時候你會發現,超市的玻璃已經被砸了,貨架上什么東西都沒有。

獨立的事件渾然不覺,甚至還將它們作為相關事件進行處理。假設你正在一家賭場里(雖然從統計學的角度看,你根本就不應該出現在這種地方),你會看到賭客們紅著眼睛盯著骰子或撲克牌,嘴里念念有詞“總該輪到我贏了吧”。如果輪盤球已經連續5次停在黑色區域了,有人就會想當然地認為下一次肯定會停在紅色區域,大錯特錯!輪盤球停在紅色區域的概率一直都沒變,應該是16/38,這就是“賭徒謬論”。事實上,就算你連續拋1000000次硬幣,并且結果全都是正面朝上,第1000001次拋硬幣出現反面的概率依然為1/2。兩個事件的統計獨立性的定義正是其中一個事件的結果對另一個事件的結果不存在任何影響。就算你覺得從統計學的角度來解釋不夠有說服力,你也可以從物理的角度問問自己:一枚硬幣連續拋幾次的結果都是反面朝上,怎么做才能使它下一次拋出的結果是正面朝上?

有91%的籃球迷認為,當球員連續兩三次投籃成功后再次投中的概率要高于他連續投失兩三次球后投籃命中的概率。這篇關于“手感”的論文告訴我們,人們腦海里的觀念和事實往往存在差異,論文作者寫道:“人們對于隨機性的直觀感受與概率的相關定律之間存在著鴻溝。”我們自認為看到了規律,可實際上或許根本不存在規律。

為了證明這一相同的論點,我還和我的學生進行過一個實驗。班級的人數越多,效果越好。我讓班上所有人都拿出一枚硬幣,并從座位上站起來,我們一起拋硬幣,硬幣正面朝上的學生必須坐下。假設我們一開始有100位學生,在第一次拋硬幣結束之后,有大約50人坐下;然后我們開始第二次拋硬幣,之后還剩下約25位學生站著;然后是第三次、第四次……通常最后總是會剩下一位學生在連續5次或6次得到硬幣反面朝上的結果后,依然站在那里,我會在這個時候走到這位同學的身邊問他“你是怎么做到的?”、“你平時都做些什么特殊訓練,可以連續這么多次都做到反面朝上?”、“你是不是吃了什么特別的東西?”等,這些問題惹得全班同學哈哈大笑,因為他們目睹了整個過程,他們知道這位拋硬幣得到6次都是反面結果的同學并沒有什么特殊的技能,一切只是巧合。但如果脫離了這樣一個環境,當我們目睹一些異常的事件發生時,我們總是會想:“沒那么巧吧?背后肯定有什么原因。”但事情偏偏就是這么巧。

同樣的現象還可以用來解釋為什么有些學生在考試中會超常發揮,有時候又會不盡如人意;有些學生明明考得沒有平時好,但重考的成績卻又稍稍提升了。要解釋這一回歸現象,一種思路是學生的考試成績(無論是文化課還是體育課)基本上是由個人的努力和運氣(統計學家稱之為“隨機誤差”)構成的。也就是說,那些在某次考試中超常發揮的學生只不過是交好運了,而那些考試成績與平時相比大失水準的考生只是運氣差了一些。當好運或厄運終于結束時(總有結束的那一天),隨之而來的表現就會更加接近平均值。

從統計學教材中,你將會讀到有關隨機抽樣法更為詳細的介紹。民意調查和市場分析公司的員工更是不遺余力地投入了大量的時間來研究如何更為經濟有效地抽取更有代表性的人口樣本。到目前為止,你應該意識到了如下幾個重要的點:(1)沒有比代表性樣本更有用的統計學工具了,統計學要是離了它,馬上會黯然失色;(2)獲得一個好樣本比想象得難,(3)那些聳人聽聞的夸張結論,其中有許多都是由于正確的統計方法被應用在了糟糕的樣本上,但如果一開始統計方法就是錯的,不管樣本質量如何,都不會得到應有的結論;(4)樣本容量很重要,而且容量越大越好。關于這一點,將會在接下來的章節中具體講到,直覺可以告訴我們,樣本容量越大,那些極端的變量對結果的影響就會越小(一碗湯要比一勺湯更能體現整鍋湯的味道)。必須引起注意的是,如果人口組成本身存在問題,即所謂的“偏見”,那么無論樣本容量有多大,都無法改變這一“偏見”情況。假設現在你要對美國總統的支持率作一個電話調查,假如你的調查對象只局限于華盛頓的居民,那么他們的意見會跟美國人民的意見有出人,無論你給1000人打電話,還是給10萬人打電話,都無法解決這一基礎性的問題。事實上,一個存在偏見的大容量樣本甚至要比一個存在偏見的小容量樣本更具有誤導性,因為人們會因為前者包含的樣本數量多而盲目“崇拜”其結論。

統計學無法確鑿地證明任何東西。與之相反,統計推斷的力量在于:先發現一些規律和結果,然后再利用概率來證明這些結果的背后最有可能的原因。


文章列表


不含病毒。www.avast.com
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()