確率密度関数 (PDF)

確率密度関数 (PDF) とは?

確率密度関数 (PDF) は、連続確率変数ではなく離散確率変数 (株式や ETF など) の確率分布 (結果の可能性) を定義する統計式です。離散確率変数との違いは、変数の正確な値を識別できることです。

正規分布は PDF の一般的な例であり、よく知られているベル カーブ形状を形成します。

金融では、トレーダーと投資家は PDF を使用して価格リターンがどのように分布しているかを理解し、リスクと期待リターンのプロファイルを評価します。

重要ポイント

  • 確率密度関数は、離散値 (株式や ETF の価格など) の可能性の高い結果を測定するために使用される統計的尺度です。
  • PDF は、一般に釣鐘曲線に似たグラフにプロットされ、結果が曲線の下にある確率が示されます。
  • 離散変数は正確に測定できますが、連続変数は無限の値を持つことができます。
  • PDF は、ポートフォリオ内の特定の証券またはファンドの潜在的なリスク/報酬を測定するために使用できます。
  • 正規分布はよく引き合いに出され、釣鐘型の曲線を形成します。

確率密度関数 (PDF) を理解する

PDF は金融で使用され、個々の株式や ETF などの特定の証券のリスクを測定します。

それらは通常、中立的な市場リスクを示す通常のベル カーブと、どちらかの端にあるベルがリスク/報酬の高低を示すグラフで表されます。PDF をグラフで表すと、曲線の下の領域は、変数が収まる間隔を示します。グラフのこの区間の合計面積は、離散確率変数が発生する確率に等しくなります。

より正確には、連続確率変数が特定の値をとる絶対尤度は、可能な値が無限にあるためゼロであるため、PDF の値を使用して、確率変数が特定の範囲内に入る尤度を決定できます。値の。

ジュリー・バンによる画像 © Investopedia2020

分布が曲線の右側に偏っている場合は上昇報酬が大きいことを示し、分布が左側に偏っている場合はトレーダーにとって下落リスクが大きいことを示しています。

確率分布を使用して、累積分布関数 (CDF) を作成することもできます。CDF は、発生確率を累積的に加算し、常にゼロから開始して 100% で終了します。

投資家は、ポートフォリオの全体的なリスク/報酬を計算するための多くのツールの 1 つとして PDF を使用する必要があります。

ディスクリート vs.連続確率分布関数

PDF は、離散データまたは連続データのいずれかを記述できます。違いは、離散変数は、整数、はい、いいえ、時刻など、特定の値しかとれないことです。対照的に、連続変数には、曲線に沿ったすべての値が含まれます。これには、非常に小さな分数や、理論的に無限の桁数までの小数が含まれます。

ディスクリート vs.連続PDF。

ジュリー・バンによる画像 © Investopedia2020

確率分布関数の計算

PDF は、多くの場合、平均、標準偏差、尖度、歪度によって特徴付けられます。

  • 平均: 算術平均値
  • 標準偏差: 平均に関するデータの分散
  • 尖度: PDF の尾部の「太さ」を表します
  • 歪度: PDF の対称性の偏差を指します。

PDF を計算してグラフィカルにプロットするには、微分方程式または積分計算を使用する複雑な計算が必要になる場合があります。実際には、確率分布関数を計算するには、グラフ計算機または統計ソフトウェア パッケージが必要です。

正規分布

例として、正規分布の PDF の計算は次のとおりです。

正規分布式。

どこ:

  • x= 検査対象の変数またはデータの値、および f(x) 確率関数
  • μ = 平均
  • σ = 標準偏差

正規分布の歪度は常に 0 で、尖度は 3.0 です。

その他の確率分布関数

多くの場合、正規分布が最もよく引用され、よく知られていますが、他にもいくつかの PDF が存在します。

一様分布

最も単純で最も一般的な分布は、すべての結果が発生する可能性が等しい一様分布です。六面体のサイコロの分布は一様です。各結果の確率は約 16.67% (1/6) です。

ジュリー・バンによる画像 © Investopedia2020

二項分布

二項分布は、コイン投げ (表と裏) や、はい/いいえ、オン/オフなどの形式をとる論理式など、2 つの値のうちの 1 つしか取り得ないデータを表します。

二項分布のヒストグラム。C.K.テイラー

対数正規分布

対数正規分布は、標準の正規分布よりも実際の資産価格のリターンをより適切に表すため、金融において重要です。この PDF は正 (右) の歪度と高い尖度を持っています。

対数正規分布。

ジュリー・バンによる画像 © Investopedia2020

ポアソン分布

ポアソン分布は、カウント変数、または特定の数の発生確率を記述するために使用される PDF です。たとえば、リンゴの木に何個のリンゴがあるか、蜂の巣の中で生きているミツバチの数、またはポートフォリオが 5% 以上を失う取引日数などです。

ジュリー・バンによる画像 © Investopedia2020

ベータ配布

ベータ分布は、アルファとベータの 2 つのパラメータだけで定義されるように、さまざまな形状と特性を持つことができる PDF の一般的なタイプです。金融では、債券のデフォルト回収率や保険の死亡率を推定するためによく使用されます。

ベータ配布のバリエーション。

確率密度関数の例

確率分布の簡単な例として、2 つの標準的な 6 面サイコロを振ったときに観察される数字を見てみましょう。各サイコロは、1 から 6 までの任意の数字を 1/6 の確率で転がしますが、2 つのサイコロの合計は、下の画像に示す確率分布を形成します。

7 が最も一般的な結果です (1+6、6+1、5+2、2+5、3+4、4+3)。一方、2 と 12 の可能性ははるかに低くなります (1+1 と 6+6)。

サブリナ・ジャンによる画像 © Investopedia2020

確率密度関数 (PDF) からわかること

確率密度関数 (PDF) は、データ生成プロセスから生じる何らかの結果を観察する可能性を表します。たとえば、公正なコインを投げて表が出る可能性はどのくらいですか (50%)。またはサイコロの役割は 6 (1/6 = 16.7%) を出します。 PDF は、どの値が表示される可能性が最も高いか、可能性が低い結果かを示します。PDFの形状や特性によって変わります。

中心極限定理 (CLT) とは何ですか? PDF との関係は?

中心極限定理 (CLT) は、分布の真の形状に関係なく、サンプル サイズが大きくなるにつれて、サンプル内の確率変数の分布が正規分布に近づき始めることを示しています。したがって、コインを投げることは、二項分布 (表または裏) によって記述されるバイナリ プロセスであることがわかります。しかし、コイントスを何回か考えると、表と裏の特定の組み合わせを得る確率は異なり始めます。たとえば、コインを 10 回投げた場合、それぞれ 5 回出る確率が最も高くなりますが、10 回続けて表が出ることは非常にまれです。1,000 回のコイン投げを想像してみてください。分布は通常のベル カーブに近づきます。

PDF と CDF とは?

確率密度関数 (PDF) は、特定の時点または特定の抽選でデータ生成プロセスに現れる可能性が高い値を説明します。

代わりに、累積分布関数 (CDF) は、これらの限界確率がどのように加算され、最終的に可能な結果の 100% (または 1.0) に達するかを示します。CDF を使用すると、変数の結果が予測値以下になる可能性を確認できます。

たとえば、次の図は、正規分布の CDF を示しています。

CDF。

ジュリー・バンによる画像 © Investopedia2020

結論

確率分布関数 (PDF) は、サンプルから抽出された確率変数の期待値を表します。PDF の形状は、観測値が発生する可能性を説明します。正規分布は、その平均値と標準偏差だけで説明できる一般的に使用される例です。他の PDF は、より複雑でニュアンスがあります。株価リターンは、正規分布ではなく対数正規分布に従う傾向があり、正規分布が予測するものと比較して、非常に大きな利益よりも下落損失の方が頻繁に発生することを示しています。