概率論12 矩與矩生成函數 - vamei－IT工程師數位筆記本

文章出處

作者：Vamei 出處：http://www.cnblogs.com/vamei 歡迎轉載，也請保留這段聲明。謝謝！

我們重新回到對單隨機變量分布的研究。描述量是從分布中提取出的一個數值，用來表示分布的某個特征。之前使用了兩個描述量，即期望和方差。在期望和方差之外，還有其它的描述量嗎？

斜度

值得思考的是，期望和方差足以用來描述一個分布嗎？如果答案是可以，那么我們就沒有必要尋找其它描述量的。事實上，這兩個描述量并不足以完整的描述一個分布。

我們來看兩個分布，一個是指數分布:

$$f(x) = \left\{ \begin{array}{rcl} e^{x} & if & x \ge 0 \\ 0 & if & x < 0 \end{array} \right.$$

它的期望為[$E(x) = 1$]，方差為[$Var(x) = 1$]。

我們用Y = 2-X來獲得一個新的隨機變量，及其分布:

$$f(y) = \left\{ \begin{array}{rcl} e^{2-y} & if & y \le 2 \\ 0 & if & y > 2 \end{array} \right.$$
該密度曲線與原來的密度曲線關于直線X=1對稱，與原來的分布有相同的期望值和方差。期望為[$E(x) = 1$]，方差為[$Var(x) = 1$]

我們繪制兩個分布的密度曲線，如下圖:

可以看到，即使期望值和方差保持不變，兩個分布曲線明顯不同。第一條曲線下的面積偏向左，而第二條曲線則向右側傾斜。為了表達分布的這一特征，我們引入一個新的描述量，斜度(skewness)。它的定義如下:
$$Skew(X) = E[(X - \mu)^3]$$
上面兩個分布，第一條曲線向左偏斜，斜度分別為2。另一條曲線的斜度為-2。很明顯，斜度的不同可以帶來差別巨大的分布(即使期望和方差都相同)。

繪制程序如下

from scipy.stats import expon
import numpy as np
import matplotlib.pyplot as plt

rv = expon(scale = 1)
x1  = np.linspace(0, 20, 100)
x2  = np.linspace(-18, 2, 100)
y1 =  rv.pdf(x1)
y2 =  rv.pdf(2 - x2)

plt.fill_between(x1, y1, 0.0, color = "green")
plt.fill_between(x2, y2, 0.0, color = "coral", alpha = 0.5)

plt.xlim([-6, 8])
plt.title("two distribution")
plt.xlabel("RV")
plt.ylabel("f(x)")

plt.show()

矩

觀察方差和斜度的定義，
$$Var(X) = E[(X - \mu)^2]$$
$$Skew(X) = E[(X - \mu)^3]$$
都是X的函數的期望。它們的區別只在于函數的形式，即[$(X - \mu)$]的乘方次數不同。方差為2次方，斜度為3次方。

上面的描述量都可以歸為“矩”(moment)的一族描述量。類似于方差和斜度這樣的，它們都是[$(X - \mu)$]乘方的期望，稱為中心矩(central moment)。[$E[(x - \mu)^k]$]稱為k階中心矩，表示為[$\mu_k$]，其中k = 2, 3, 4, ...

還有另一種是原點矩(moment about the origin)，是[$X$]乘方的期望。 [$E[X^k]$]稱為k階原點矩，表示為[$\mu_k^\prime$]，其中k = 1, 2, 3, ...

期望是一階原點矩:
$$E(X) = E(X^1)$$

矩生成函數

除了表示中心、離散程序、斜度這些特性外，更高階的矩可以描述分布的其它特性。矩統計中有重要的地位，比如參數估計的一種重要方法就是利用了矩。然而，根據矩的定義，我們需要對不同階的X冪求期望，這個過程包含復雜的積分過程，并不容易。矩同樣催生了矩生成函數(moment generating function)，它是求解矩的一樣有力武器。

在了解矩生成函數之前，先來回顧冪級數(power series)。冪級數是不同階數的乘方(比如[$1, x, x^2, x^3...$])的加權總和：

$$\sum_{i=1}^{+\infty} a_ix^i$$

[$a_i$]是一個常數。

冪級數是數學中的重要工具，它的美妙之處在于，解析函數都可以寫成冪級數的形式，比如三角函數[$\sin(x)$]可以寫成：

$$\sin(x) = x - \frac{x^3}{3!} + \frac{x^5}{5!} - \frac{x^7}{7!} + ...$$

將解析函數分解為冪級數的過程，就是泰勒分解(Taylor）。我們不再深入其具體過程。[$x^n$]是很簡單的一種函數形式，它可以無限次求導，求導也很容易。這一特性讓冪級數變得很容易處理。將解析函數寫成冪級數，就起到化繁為簡的效果。

(冪級數這一工具在數學上的用途極其廣泛，它用于數學分析、微分方程、復變函數…… 不能不說，數學家很會活用一種研究透了的工具)

如果我們將冪級數的x看作隨機變量X，并求期望。根據期望可以線性相加的特征，有:

$$E(f(X)) = a_0 + a_1E(X) + a_2E(X^2) + a_3E(X^3) + ... $$

我們可以通過矩，來計算f(X)的期望。

另一方面，我們可否通過解析函數來獲得矩呢？我們觀察下面一個指數函數，寫成冪級數的形式：

$$e^{tx} = 1 + tx + \frac{(tx)^2}{2!} + \frac{(tx)^3}{3!} + \frac{(tx)^4}{4!} ... $$

我們再次將x看作隨機變量X，并對兩側求期望，即

$$E(e^{tX}) = 1 + tE(X) + \frac{t^2E(X^2)}{2!} + \frac{t^3E(X^3)}{3!} + \frac{t^4E(X^4)}{4!} ...$$

即使隨機變量的分布確定，[$E(e^{tX})$]的值還是會隨t的變化而變化，因此這是一個關于t的函數。我們將它記為[$M(t)$]，這就是矩生成函數(moment generating function)。對[$M(t)$]的級數形式求導，并讓t等于0，可以讓高階的t的乘方消失，只留下[$E(X)$]，即

$$M'(0) = E(X)$$

即一階矩。如果繼續求高階導，并讓t等于0，可以獲得高階的矩。

$$M^{\left( r \right)}(0) = E(X^r)$$

有趣的是，多次求導系數正好等于冪級數系數中的階乘，所以可以得到上面優美的形式。我們通過冪級數的形式證明了，對矩生成函數求導，可以獲得各階的矩。相對于積分，求導是一個容易進行的操作。

矩生成函數的性質

矩生成函數的一面是冪級數，我們已經說了很多。矩生成函數的另一面，是它的指數函數的解析形式。即

$$M(t) = E[e^{tX}]= \int_{- \infty}^{\infty}e^{tx}f(x)dx$$

在我們獲知了f(x)的具體形式之后，我們可以利用該積分獲得矩生成函數，然后求得各階的矩。當然，你也可以通過矩的定義來求矩。但許多情況下，上面指數形式的積分可以使用一些已有的結果，所以很容易獲得矩生成函數。矩生成函數的求解矩的方式會便利許多。

矩生成函數的這一定義基于期望，因此可以使用期望的一些性質，產生有趣的結果。

性質1 如果X的矩生成函數為[$$M_X(t)]，且[$Y = aX + b$]，那么

$$M_Y(t) = e^{at}M_X(bt)$$

(將Y寫成指數形式的期望，很容易證明該結論)

性質2 如果X和Y是獨立隨機變量，分別有矩生成函數[$M_X, M_Y$]。那么對于隨機變量[$Z = X + Y$]，有

$$M_Z(t) = M_X(t)M_Y(t)$$

(基于獨立隨機變量乘積的期望，等于隨機變量期望的乘積)

練習:

推導Poisson分布的矩生成函數

總結

矩

矩生成函數

文章列表

不含病毒。www.avast.com

大師兄

IT工程師數位筆記本

大師兄發表在痞客邦留言(0) 人氣()

E-mail轉寄

IT工程師數位筆記本

If you give someone a program , you will frustrate them for a day; if you teach them how to program, you will frustrate them for a lifetime.IT 這段話的意思是，如果你交給某人一隻程式，你將折磨他一整天;如果你教會某人如何寫程式，你將折磨他一輩子。

BloggerAds

概率論12 矩與矩生成函數 - vamei

斜度

矩

矩生成函數

矩生成函數的性質

總結

歷史上的今天

留言列表

參觀人氣

文章搜尋

最新文章

文章精選

誰來我家

熱門文章

文章分類

最新留言

QR Code

POWERED BY