概率密度函數 (PDF)

什麼是概率密度函數 (PDF)?

概率密度函數 (PDF) 是一種統計表達式,用於定義離散隨機變量(例如股票或 ETF)與連續隨機變量相對的概率分佈(結果的可能性)。離散隨機變量之間的區別在於您可以識別變量的確切值。

正態分佈是 PDF 的一個常見示例,形成眾所周知的鐘形曲線形狀。

在金融領域,交易者和投資者使用 PDF 來了解價格回報的分佈情況,以評估他們的風險和預期回報情況。

關鍵要點

  • 概率密度函數是一種統計度量,用於衡量離散值(例如股票或 ETF 的價格)的可能結果。
  • PDF 繪製在通常類似於鍾形曲線的圖表上,結果的概率位於曲線下方。
  • 離散變量可以精確測量,而連續變量可以具有無限值。
  • PDF 可用於衡量投資組合中特定證券或基金的潛在風險/回報。
  • 常引用正態分佈,形成鐘形曲線。

了解概率密度函數 (PDF)

PDF 在金融中用於衡量特定證券的風險,例如個股或 ETF。

它們通常在圖表上描繪,正常的鐘形曲線表示中性市場風險,兩端的鐘形表示更大或更少的風險/回報。當 PDF 以圖形方式描繪時,曲線下的面積將指示變量將下降的區間。圖的這個區間的總面積等於離散隨機變量出現的概率。

更準確地說,由於可用的可能值的無限集合,連續隨機變量取任何特定值的絕對似然為零,因此 PDF 的值可用於確定隨機變量落在特定範圍內的似然性的價值觀。

圖片來自 Julie Bang © Investopedia2020

向曲線右側傾斜的分佈表明更大的上行回報,而向左傾斜的分佈表明交易者面臨更大的下行風險。

概率分佈也可用於創建累積分佈函數 (CDF),它將累積發生的概率相加,並且始終從零開始並以 100% 結束。

投資者應使用 PDF 作為計算其投資組合中整體風險/回報的眾多工具之一。

離散與連續概率分佈函數

PDF 可以描述離散或連續數據。不同之處在於離散變量只能採用特定值,例如整數、是與否、一天中的時間等等。相反,連續變量包含曲線上的所有值,包括非常小的分數或小數,理論上無限位。

離散與連續PDF。

圖片來自 Julie Bang © Investopedia2020

計算概率分佈函數

PDF 通常以均值、標準差、峰度和偏度為特徵。

  • 平均值:算術平均值
  • 標準偏差:關於平均值的數據的分散
  • 峰度:描述 PDF 尾部的“胖”
  • 偏度:指 PDF 對稱性的偏差

計算 PDF 並以圖形方式繪製它可能涉及使用微分方程或積分的複雜計算。在實踐中,需要圖形計算器或統計軟件包來計算概率分佈函數。

正態分佈

例如,正態分佈的 PDF 計算如下:

正態分佈公式。

在哪裡:

  • x= 被檢查的變量或數據的值和 f(x) 概率函數
  • μ = 平均值
  • σ = 標準差

正態分佈始終具有偏度 = 0 和峰度 = 3.0。

其他概率分佈函數

雖然正態分佈通常是最常被引用和廣為人知的,但也存在其他幾個 PDF。

均勻分佈

最簡單和最流行的分佈是均勻分佈,其中所有結果發生的機會均等。六面模具具有均勻分佈。每個結果的概率約為 16.67% (1/6)。

圖片來自 Julie Bang © Investopedia2020

二項分佈

二項分佈表示只能取兩個值之一的數據,例如硬幣的翻轉(正面與反面)或採用是/否、開/關等形式的邏輯表達式。

二項分佈的直方圖。C.K.泰勒

對數正態分佈

對數正態分佈在金融中很重要,因為它比標準正態分佈更能描述實際資產價格回報。此 PDF 具有正(右)偏度和較高的峰度。

對數正態分佈。

圖片來自 Julie Bang © Investopedia2020

泊松分佈

泊松分佈是一個 PDF,用於描述計數變量,或發生一定次數的概率。例如,在蘋果樹上發現了多少蘋果,隨著時間的推移,有多少蜜蜂在蜂箱中存活,或者投資組合在多少個交易日內將損失 5% 或更多。

圖片來自 Julie Bang © Investopedia2020

Beta分佈

beta 分佈是一種通用類型的 PDF,它可以呈現出各種形狀和特徵,僅由兩個參數定義:alpha 和 beta。它通常在金融中用於估計債券違約回收率或保險死亡率。

Beta 分佈變化。

概率密度函數示例

作為概率分佈的一個簡單示例,讓我們看一下滾動兩個標準六面骰子時觀察到的數字。每個骰子有 1/6 的概率擲出任何單個數字,從 1 到 6,但兩個骰子的總和將形成下圖所示的概率分佈。

七是最常見的結果(1+6、6+1、5+2、2+5、3+4、4+3)。另一方面,2 和 12 的可能性要小得多(1+1 和 6+6)。

圖片來源:Sabrina Jiang © Investopedia2020

概率密度函數 (PDF) 告訴我們什麼?

概率密度函數 (PDF) 描述了觀察數據生成過程產生的某些結果的可能性。例如,一個公平的硬幣翻轉出現正面的可能性有多大(50%)。或者一個骰子的角色要上來6個(1/6=16.7%)。 PDF 可以告訴我們哪些值最有可能出現與不太可能出現的結果。這將根據 PDF 的形狀和特性而改變。

什麼是中心極限定理 (CLT),它與 PDF 有什麼關係?

中心極限定理 (CLT) 指出,隨著樣本量變大,樣本中隨機變量的分佈將開始接近正態分佈,而不管分佈的真實形狀如何。因此,我們知道拋硬幣是一個二元過程,由二項分佈(正面或反面)描述。然而,如果我們考慮幾次拋硬幣,得到正面和反面的任何特定組合的機率開始不同。例如,如果我們拋硬幣 10 次,每次獲得 5 次的可能性最大,但連續獲得 10 次正面朝上的機率極為罕見。想像一下拋硬幣 1000 次,分佈接近正態鐘形曲線。

什麼是 PDF 與 CDF?

概率密度函數 (PDF) 解釋了在任何給定時間或任何給定抽籤的數據生成過程中可能出現的值。

相反,累積分佈函數 (CDF) 描述了這些邊際概率如何相加,最終達到 100%(或 1.0)的可能結果。使用 CDF,我們可以看到變量的結果小於或等於某個預測值的可能性有多大。

例如,下圖顯示了正態分佈的 CDF。

CDF。

圖片來自 Julie Bang © Investopedia2020

底線

概率分佈函數 (PDF) 描述了從樣本中抽取的隨機變量的期望值。PDF 的形狀解釋了觀察值發生的可能性。正態分佈是一個常用的例子,可以只描述它的均值和標準差。其他 PDF 更加複雜和細緻入微。股票價格回報往往遵循對數正態分佈而不是正態分佈,這表明相對於正態分佈的預測,下行損失比非常大的收益更頻繁。