10、常见的概率分布
- 定义概率分布
- 离散分布
- 连续随机变量
- 概率分布函数
- 指定离散随机分布的结果集
- 累积分布函数cumulative distribution function (cdf)
- F(x) = P(X ≤ x)
- P(x1≤ x ≤ x2) = F(x2) – F(x1)
- 离散均匀随机变量、伯努利随机变量和二项式随机变量
- 离散均匀随机变量 discrete uniform random variable,(投骰子,抛硬币)
- 伯努利随机变量binomial random variable (开抢,中靶概率p,不中概率1-p)
- 二项式随机变量Binomial Random Variable(开n枪,中x次靶,单次中概率p)p(x) = P(X = x) = (n!/((n-x)!x!))p^x(1 − p)^(n–x)
- 二项式随机分布的期望值 E(X) = np,方差,variance = np(1 − p)
- 连续均匀分布
- 对于所有a ≤ x1 < x2 ≤ b
- P(X < a or X > b) = 0
- P(x1 ≤ X ≤ x2) = (x2 − x1)/(b − a)
10.2 正态分布 NORMAL DISTRIBUTIONS
- 正态分布的性质
- 可以被平均数 μ,方差σ^2来表示,X ~ N(μ, σ^2)
- Skewness = 0
- Kurtosis = 3
- 多个正态分布的线形组合,仍是正态分布
- 远离均值的“尾巴”无限延展,概率永远趋向于0而不等于0
- 一元正态分布&多元正态分布&相关系数在多元正太分布中的运用
- 一元正态分布 univariate distributions
- 多元正态分布 multivariate distribution
- 多元正态分布的表示:
- n 个平均数 (μ1, μ2, …, μn)
- n 个方差 ( σ1^2,σ2^2,…σ1n^2 )
- n(n − 1)/2 对的 相关系数.
- 正态分布随机变量落在在指定区间内的概率计算
- 置信区间 confidence interval
- 均值左右一个标准差的置信区间为68%,3个标准差的置信区间为95%
- 关于置信区间,几组需要记忆的数字:
- 90%置信区间,均值左右1.65标准差
- 95%置信区间,均值左右1.96标准差
- 99%置信区间,均值左右2.58标准差
- 标准正态分布
- 均值为0,标准差为1的正态分布为标准正态分布N~(0,1)
- z=(x-μ)/σ
- z值怎么理解,距离均值多少个标准差
10.3 对数正态分布 LOGNORMAL DISTRIBUTION
- 定义短缺风险shortfall risk,计算安全第一系数safety-first ratio,并使用罗伊的安全第一准则选择最佳投资组合
- Roy’s safety-first criterion:最小化 P(Rp < RL)
- Rp = portfolio return
- RL = threshold level return
- 如果满足正态分布,罗伊的安全第一准则可以描述为:最大化SFRatio
- SFRatio = (E(Rp)-RL)/σp
- 联合记忆,上述公式与Sharpe ratio很相近。ShapreRatio = (E(Rp)-Rf)/σp,一个对比的是RL,一个是Rf,当 threshold level return 和 risk-free rate 相等的时候,SFRatio = ShapreRatio
- 正态分布与对数正态分布的关系
- 如果x满足正态分布,e^x满足对数正态分布
- 对数正态分布是正偏态的
- 对数正态分布的区间最小值为0,所以多用于资产价格模型,因为资产价格永远不会是负数
- 离散复利&连续复利
- 我们通常熟知的是离散复利,对于名义利率10%,如果半年复利计算EAY=(1+5%)^2-1=10.25%,按月计复利为(1+0.1/12)^12=10.47%
- 继续延伸,如果安小时计,按分钟计,按秒计,这个值会越来越大,如果颗粒度趋向无限小,那么就称为连续复利 continuous compounding,此时的EAY被计为e^Rcc-1。
- 还是以之前的名义年利率10%举例,如果是连续复利,则EAY=e^0.1-1=10.517%
- Rcc=ln(S1/S0)=ln(1+HPR)
- 举例,年初买股票价格100,年末涨到120,基于连续复利计算的年化收益率为 Rcc=ln(120/100)=18.232%
- 举例, 年Rcc = 10%,两年的HPR=e^0.2 − 1 = 22.14%,两年的Rcc=ln(1+HPR)-1=20%,直接除以2就是1年的Rcc=10%
- 蒙特卡罗模拟 Monte Carlo simulation
- 主要用于:
- 估值复杂的证券
- 模拟交易策略的涨跌
- 计算和模拟风险价值
- 模拟养老金资产和负债随时间的变化
- 非正态分布的资产组合
- 局限性:
- 历史模拟Historical simulation
- 优势:使用历史数据,不用猜风险因子带来的变化分布
- 局限性:
- 过去发生的不能代表未来也一定如此
- 可能存在很少发生的风险因子,未在所取的历史样本中
- 不能解决蒙特卡罗模拟的“what if”问题