0. 标准正态分布表与常用值
Z-score 是非标准正态分布标准化后的 x即
z
=
x
−
μ
σ
z = \frac{x-\mu}{\sigma}
z=σx−μ
表头的横向表示小数点后第二位,表头的纵向则为整数部分以及小数点后第一位;两者联合作为完整的 x,坐标轴的横轴
表中的值为图中红色区域的面积,也即 cdf,连续分布的累积概率函数,记为
Φ
(
x
)
\Phi(x)
Φ(x)
cdf 的逆,记为
Φ
−
1
(
x
)
\Phi^{-1}(x)
Φ−1(x),如
Φ
−
1
(
3
/
4
)
\Phi^{-1}(3/4)
Φ−1(3/4),表示 x 取何值时,阴影部分的面积为 0.75,查表可知,x 介于 0.67 和 0.68 之间;
>> from scipy.stats import norm
>> norm.ppf(3/4)
0.6744897501960817
1. cdf 与 ppf(分位函数)
from scipy.stats import norm
覆盖的概率范围:
>> norm.cdf(1) - norm.cdf(-1)
0.6826894921370859
>> norm.cdf(2) - norm.cdf(-2)
0.9544997361036416
>> norm.cdf(3) - norm.cdf(-3)
0.9973002039367398
Φ
(
x
)
\Phi(x)
Φ(x) 为 累积概率密度函数,也即 cdf:
>> from scipy.stats import norm
>> norm.cdf(0)
0.5
Φ
−
1
(
x
)
\Phi^{-1}(x)
Φ−1(x),通过 norm(x) 进行计算:
>> from scipy.stats import norm
# Q3 分位点;
>> norm.ppf(3/4)
0.6744897501960817
# Q1 分位点
>> norm.ppf(1/4)
-0.6744897501960817
标准正态分布表