上一回我们讲到当本身很小的时候,容易被5%(绝对误差)给淹没掉,导致结果的不可信。我们可以引入相对误差,把(1)式转换为如下的不等式
同理,我们可以用
代替(建议先看上一篇博客),转换为
类似的,,,所以(4)式等价为
这个时候,因为不等号右边和均值有关,不能再用切比雪夫不等式了,我们需要另外一个武器:Chernoff bound。它有两种形式:
Chernoff bound的证明需要用到马尔可夫不等式,有一点技巧。以上两种形式可以统一成
也是一个很漂亮的不等式。
利用Chernoff bound求解(5)式:
解得
这个结果看起来就很复杂了。也就是说,如果要设计调查问卷使满足(2)式的精度,抽样的样本数必须满足(10)式。从(10)式可知,当要求的精度越高(即和越小),所需的样本数越大。并且结果还和真实值有关。