概率密度函数 (PDF)

什么是概率密度函数 (PDF)?

概率密度函数 (PDF) 是一种统计表达式,用于定义离散随机变量(例如股票或 ETF)与连续随机变量相对的概率分布(结果的可能性)。离散随机变量之间的区别在于您可以识别变量的确切值。

正态分布是 PDF 的一个常见示例,形成众所周知的钟形曲线形状。

在金融领域,交易者和投资者使用 PDF 来了解价格回报的分布情况,以评估他们的风险和预期回报情况。

关键要点

  • 概率密度函数是一种统计度量,用于衡量离散值(例如股票或 ETF 的价格)的可能结果。
  • PDF 绘制在通常类似于钟形曲线的图表上,结果的概率位于曲线下方。
  • 离散变量可以精确测量,而连续变量可以具有无限值。
  • PDF 可用于衡量投资组合中特定证券或基金的潜在风险/回报。
  • 常引用正态分布,形成钟形曲线。

了解概率密度函数 (PDF)

PDF 在金融中用于衡量特定证券的风险,例如个股或 ETF。

它们通常在图表上描绘,正常的钟形曲线表示中性市场风险,两端的钟形表示更大或更少的风险/回报。当 PDF 以图形方式描绘时,曲线下的面积将指示变量将下降的区间。图的这个区间的总面积等于离散随机变量出现的概率。

更准确地说,由于可用的可能值的无限集合,连续随机变量取任何特定值的绝对似然为零,因此 PDF 的值可用于确定随机变量落在特定范围内的似然性的价值观。

图片来自 Julie Bang © Investopedia2020

向曲线右侧倾斜的分布表明更大的上行回报,而向左倾斜的分布表明交易者面临更大的下行风险。

概率分布也可用于创建累积分布函数 (CDF),它将累积发生的概率相加,并且始终从零开始并以 100% 结束。

投资者应使用 PDF 作为计算其投资组合中整体风险/回报的众多工具之一。

离散与连续概率分布函数

PDF 可以描述离散或连续数据。不同之处在于离散变量只能采用特定值,例如整数、是与否、一天中的时间等。相反,连续变量包含曲线上的所有值,包括非常小的分数或小数,理论上无限位。

离散与连续PDF。

图片来自 Julie Bang © Investopedia2020

计算概率分布函数

PDF 通常以均值、标准差、峰度和偏度为特征。

  • 平均值:算术平均值
  • 标准偏差:关于平均值的数据的分散
  • 峰度:描述 PDF 尾部的“胖”
  • 偏度:指 PDF 对称性的偏差

计算 PDF 并以图形方式绘制它可能涉及使用微分方程或积分的复杂计算。在实践中,需要图形计算器或统计软件包来计算概率分布函数。

正态分布

例如,正态分布的 PDF 计算如下:

正态分布公式。

在哪里:

  • x= 被检查的变量或数据的值和 f(x) 概率函数
  • μ = 平均值
  • σ = 标准差

正态分布始终具有偏度 = 0 和峰度 = 3.0。

其他概率分布函数

虽然正态分布通常是最常被引用和广为人知的,但也存在其他几个 PDF。

均匀分布

最简单和最流行的分布是均匀分布,其中所有结果发生的机会均等。六面模具具有均匀分布。每个结果的概率约为 16.67% (1/6)。

图片来自 Julie Bang © Investopedia2020

二项分布

二项分布表示只能取两个值之一的数据,例如硬币的翻转(正面与反面)或采用是/否、开/关等形式的逻辑表达式。

二项分布的直方图。C.K.泰勒

对数正态分布

对数正态分布在金融中很重要,因为它比标准正态分布更能描述实际资产价格回报。此 PDF 具有正(右)偏度和较高的峰度。

对数正态分布。

图片来自 Julie Bang © Investopedia2020

泊松分布

泊松分布是一个 PDF,用于描述计数变量,或发生一定次数的概率。例如,在苹果树上发现了多少苹果,随着时间的推移,有多少蜜蜂在蜂箱中存活,或者投资组合在多少个交易日内将损失 5% 或更多。

图片来自 Julie Bang © Investopedia2020

Beta分布

beta 分布是一种通用类型的 PDF,它可以呈现出各种形状和特征,仅由两个参数定义:alpha 和 beta。它通常在金融中用于估计债券违约回收率或保险死亡率。

Beta 分布变化。

概率密度函数示例

作为概率分布的一个简单示例,让我们看一下滚动两个标准六面骰子时观察到的数字。每个骰子有 1/6 的概率掷出任何单个数字,从 1 到 6,但两个骰子的总和将形成下图所示的概率分布。

七是最常见的结果(1+6、6+1、5+2、2+5、3+4、4+3)。另一方面,2 和 12 的可能性要小得多(1+1 和 6+6)。

图片来源:Sabrina Jiang © Investopedia2020

概率密度函数 (PDF) 告诉我们什么?

概率密度函数 (PDF) 描述了观察数据生成过程产生的某些结果的可能性。例如,一个公平的硬币翻转出现正面的可能性有多大(50%)。或者一个骰子的角色要上来6个(1/6=16.7%)。 PDF 可以告诉我们哪些值最有可能出现与不太可能出现的结果。这将根据 PDF 的形状和特性而改变。

什么是中心极限定理 (CLT),它与 ​​PDF 有什么关系?

中心极限定理 (CLT) 指出,随着样本量变大,样本中随机变量的分布将开始接近正态分布,而不管分布的真实形状如何。因此,我们知道抛硬币是一个二元过程,由二项分布(正面或反面)描述。然而,如果我们考虑几次抛硬币,得到正面和反面的任何特定组合的几率开始不同。例如,如果我们抛硬币 10 次,每次获得 5 次的可能性最大,但连续获得 10 次正面朝上的几率极为罕见。想象一下抛硬币 1000 次,分布接近正态钟形曲线。

什么是 PDF 与 CDF?

概率密度函数 (PDF) 解释了在任何给定时间或任何给定抽签的数据生成过程中可能出现的值。

相反,累积分布函数 (CDF) 描述了这些边际概率如何相加,最终达到 100%(或 1.0)的可能结果。使用 CDF,我们可以看到变量的结果小于或等于某个预测值的可能性有多大。

例如,下图显示了正态分布的 CDF。

CDF。

图片来自 Julie Bang © Investopedia2020

底线

概率分布函数 (PDF) 描述了从样本中抽取的随机变量的期望值。PDF 的形状解释了观察值发生的可能性。正态分布是一个常用的例子,可以只描述它的均值和标准差。其他 PDF 更加复杂和细致入微。股票价格回报往往遵循对数正态分布而不是正态分布,这表明相对于正态分布的预测,下行损失比非常大的收益更频繁。