12、假设检验
12.1 假设检验&错误类型 HYPOTHESIS TESTS AND TYPES OF ERRORS
看到这里,感觉和机器学习殊途同归了,学科之间其实还是有千丝万缕的关联的。
- 假设检验的步骤
- 陈述假设
- 选择检验方法
- 确定显著性水平
- 陈述关于假设的结论
- 取样并计算样本值
- 关于假设作出结论
- 基于检验结果给出结论
-
无效假设&替代假设 Null Hypothesis and Alternative Hypothesis
- 无效假设通常包含等于”equal to“的条件
- 替代假设Ha,是如果有足够的证据可以否定无效假设
- 通常我们更多的要去得到的结论是Ha,因为相比证伪,用统计的方法很难真正的去证实。
-
单尾检验&双尾检验
- 单尾检验通常用于检验“是否大于”,双尾检验通常用于检验“是否等于”
- 双尾检验,H0: μ = μ0 ; Ha: μ ≠ μ0
-
1类错误&2类错误Type I and Type II errors
- 1类错误:把真的误判成假的
- 2类错误:把假的误判成真的
-
显著性水平 significance level
- 把真的误判成假的概率
- P(Type I error)
-
检验能力 The Power of a Test
- 把假的揪出来的能力
- 1 – P(Type II error)
-
置信区间
- 置信区间通常描述为,样本统计值-关键值个标准差<=全局参数<=样本统计值+关键值个标准差
- 置信区间的置信度为95%,也就意味着,真实的全局参数落在这个区间内的概率为95%
12.2 均值检验&P值
- 统计意义不一定表示有经济学意义
- P值就是导致拒绝无效假设的概率值
- 对于双尾检验,即落在置信区间右侧和左侧的概率和
- 对于上单尾检验,即落在置信区间右侧的
- 对于下单尾检验,即落在置信区间左侧的
- t检验
- 满足如下条件可以用t检验:
- 样本量足够大,n>=30
- 样本量比较小,n<30,但是总体满足或接近正态分布
- t(n-1) = (x’ -μ0)/(s/n^0.5)
- 满足如下条件可以用t检验:
- z检验
- 总体满足正态分布,切已知方差
- z-statistic = (x’ -μ0)/(σ/n^0.5)
12.3 平均差
- 两个满足正态分布的全局空间,方差未知,但假设其相等:
- t=(x1’-x2’)/(sp^2/n1+sp^2/n2)^0.5
- 其中sp=((n1-1)s1^2+(n2-1)s2^2)/(n1+n2-2)
- 自由度df=n1+n2-2
- 两个满足正态分布的全局空间,方差未知,但假设其不相等:
- t=(x1’-x2’)/(s1^2/n1+s2^2/n2)^0.5
- 自由度df=(s1^2/n1+s2^2/n2)^2/((s1^2/n1)^2/n1+(s2^2/n2)^2/n2)
- 两个总体正态分布的平均差
- 像天书,没看懂,TODO:待后续继续硬啃