12、假设检验

12.1 假设检验&错误类型 HYPOTHESIS TESTS AND TYPES OF ERRORS

看到这里,感觉和机器学习殊途同归了,学科之间其实还是有千丝万缕的关联的。

  • 假设检验的步骤
    • 陈述假设
    • 选择检验方法
    • 确定显著性水平
    • 陈述关于假设的结论
    • 取样并计算样本值
    • 关于假设作出结论
    • 基于检验结果给出结论
  • 无效假设&替代假设 Null Hypothesis and Alternative Hypothesis

    • 无效假设通常包含等于”equal to“的条件
    • 替代假设Ha,是如果有足够的证据可以否定无效假设
    • 通常我们更多的要去得到的结论是Ha,因为相比证伪,用统计的方法很难真正的去证实。
  • 单尾检验&双尾检验

    • 单尾检验通常用于检验“是否大于”,双尾检验通常用于检验“是否等于”
    • 双尾检验,H0: μ = μ0 ; Ha: μ ≠ μ0
  • 1类错误&2类错误Type I and Type II errors

    • 1类错误:把真的误判成假的
    • 2类错误:把假的误判成真的
  • 显著性水平 significance level

    • 把真的误判成假的概率
    • P(Type I error)
  • 检验能力 The Power of a Test

    • 把假的揪出来的能力
    • 1 – P(Type II error)
  • 置信区间

    • 置信区间通常描述为,样本统计值-关键值个标准差<=全局参数<=样本统计值+关键值个标准差
    • 置信区间的置信度为95%,也就意味着,真实的全局参数落在这个区间内的概率为95%

12.2 均值检验&P值

  • 统计意义不一定表示有经济学意义
  • P值就是导致拒绝无效假设的概率值
    • 对于双尾检验,即落在置信区间右侧和左侧的概率和
    • 对于上单尾检验,即落在置信区间右侧的
    • 对于下单尾检验,即落在置信区间左侧的
  • t检验
    • 满足如下条件可以用t检验:
      • 样本量足够大,n>=30
      • 样本量比较小,n<30,但是总体满足或接近正态分布
    • t(n-1) = (x’ -μ0)/(s/n^0.5)
  • z检验
    • 总体满足正态分布,切已知方差
    • z-statistic = (x’ -μ0)/(σ/n^0.5)

12.3 平均差

  • 两个满足正态分布的全局空间,方差未知,但假设其相等:
    • t=(x1’-x2’)/(sp^2/n1+sp^2/n2)^0.5
    • 其中sp=((n1-1)s1^2+(n2-1)s2^2)/(n1+n2-2)
    • 自由度df=n1+n2-2
  • 两个满足正态分布的全局空间,方差未知,但假设其不相等:
    • t=(x1’-x2’)/(s1^2/n1+s2^2/n2)^0.5
    • 自由度df=(s1^2/n1+s2^2/n2)^2/((s1^2/n1)^2/n1+(s2^2/n2)^2/n2)
  • 两个总体正态分布的平均差
    • 像天书,没看懂,TODO:待后续继续硬啃