10、常见的概率分布

10.1 均匀分布&二项式分布 UNIFORM AND BINOMIAL DISTRIBUTIONS

  • 定义概率分布
  • 离散分布
    • 0 ≤ p(x) ≤ 1.
    • ∑p(x) = 1
  • 连续随机变量
  • 概率分布函数
  • 指定离散随机分布的结果集
  • 累积分布函数cumulative distribution function (cdf)
    • F(x) = P(X ≤ x)
    • P(x1≤ x ≤ x2) = F(x2) – F(x1)
  • 离散均匀随机变量、伯努利随机变量和二项式随机变量
    • 离散均匀随机变量 discrete uniform random variable,(投骰子,抛硬币)
    • 伯努利随机变量binomial random variable (开抢,中靶概率p,不中概率1-p)
    • 二项式随机变量Binomial Random Variable(开n枪,中x次靶,单次中概率p)p(x) = P(X = x) = (n!/((n-x)!x!))p^x(1 − p)^(n–x)
    • 二项式随机分布的期望值 E(X) = np,方差,variance = np(1 − p)
  • 连续均匀分布
    • 对于所有a ≤ x1 < x2 ≤ b
    • P(X < a or X > b) = 0
    • P(x1 ≤ X ≤ x2) = (x2 − x1)/(b − a)

10.2 正态分布 NORMAL DISTRIBUTIONS

  • 正态分布的性质
    • 可以被平均数 μ,方差σ^2来表示,X ~ N(μ, σ^2)
    • Skewness = 0
    • Kurtosis = 3
    • 多个正态分布的线形组合,仍是正态分布
    • 远离均值的“尾巴”无限延展,概率永远趋向于0而不等于0
  • 一元正态分布&多元正态分布&相关系数在多元正太分布中的运用
    • 一元正态分布 univariate distributions
    • 多元正态分布 multivariate distribution
    • 多元正态分布的表示:
      • n 个平均数 (μ1, μ2, …, μn)
      • n 个方差 ( σ1^2,σ2^2,…σ1n^2 )
      • n(n − 1)/2 对的 相关系数.
  • 正态分布随机变量落在在指定区间内的概率计算
    • 置信区间 confidence interval
    • 均值左右一个标准差的置信区间为68%,3个标准差的置信区间为95%
    • 关于置信区间,几组需要记忆的数字:
      • 90%置信区间,均值左右1.65标准差
      • 95%置信区间,均值左右1.96标准差
      • 99%置信区间,均值左右2.58标准差
  • 标准正态分布
    • 均值为0,标准差为1的正态分布为标准正态分布N~(0,1)
    • z=(x-μ)/σ
    • z值怎么理解,距离均值多少个标准差

10.3 对数正态分布 LOGNORMAL DISTRIBUTION

  • 定义短缺风险shortfall risk,计算安全第一系数safety-first ratio,并使用罗伊的安全第一准则选择最佳投资组合
  • Roy’s safety-first criterion:最小化 P(Rp < RL)
    • Rp = portfolio return
    • RL = threshold level return
  • 如果满足正态分布,罗伊的安全第一准则可以描述为:最大化SFRatio
    • SFRatio = (E(Rp)-RL)/σp
    • 联合记忆,上述公式与Sharpe ratio很相近。ShapreRatio = (E(Rp)-Rf)/σp,一个对比的是RL,一个是Rf,当 threshold level return 和 risk-free rate 相等的时候,SFRatio = ShapreRatio
  • 正态分布与对数正态分布的关系
    • 如果x满足正态分布,e^x满足对数正态分布
    • 对数正态分布是正偏态的
    • 对数正态分布的区间最小值为0,所以多用于资产价格模型,因为资产价格永远不会是负数
  • 离散复利&连续复利
    • 我们通常熟知的是离散复利,对于名义利率10%,如果半年复利计算EAY=(1+5%)^2-1=10.25%,按月计复利为(1+0.1/12)^12=10.47%
    • 继续延伸,如果安小时计,按分钟计,按秒计,这个值会越来越大,如果颗粒度趋向无限小,那么就称为连续复利 continuous compounding,此时的EAY被计为e^Rcc-1。
    • 还是以之前的名义年利率10%举例,如果是连续复利,则EAY=e^0.1-1=10.517%
    • Rcc=ln(S1/S0)=ln(1+HPR)
    • 举例,年初买股票价格100,年末涨到120,基于连续复利计算的年化收益率为 Rcc=ln(120/100)=18.232%
    • 举例, 年Rcc = 10%,两年的HPR=e^0.2 − 1 = 22.14%,两年的Rcc=ln(1+HPR)-1=20%,直接除以2就是1年的Rcc=10%
  • 蒙特卡罗模拟 Monte Carlo simulation
    • 主要用于:
      • 估值复杂的证券
      • 模拟交易策略的涨跌
      • 计算和模拟风险价值
      • 模拟养老金资产和负债随时间的变化
      • 非正态分布的资产组合
    • 局限性:
      • 相当复杂
      • 效果一般
      • 是统计方法,而不是分析方法
  • 历史模拟Historical simulation
    • 优势:使用历史数据,不用猜风险因子带来的变化分布
    • 局限性:
      • 过去发生的不能代表未来也一定如此
      • 可能存在很少发生的风险因子,未在所取的历史样本中
      • 不能解决蒙特卡罗模拟的“what if”问题