2016统计学原理作业4?
统计推断,是利用样本的信息来对参数进行估计和预测,并以此做出决策和制定规划,这个过程叫做统计推断。 由于数据是从总体中抽取的,因而存在三种误差来源:抽样误差、模型误差和数据误差。 其中前两种属于系统误差,可以通过选择合适的模型和抽取方法加以避免或减少;后者属于随机误差,无法消除但可以通过增加样本量来缩小其影响。因此统计推断的过程也就是误差不断抵消、最终可忽略的过程。
举个例子: 假设我想了解我国网民的性别比例,在网上搜集了这样一组数据:(男性17158439人,女性17149373人)经过简单的计算可以得到P(X=女)=0.492,而通过抽样验证得到的一个准确数值应该是0.500。现在的问题是我的样本只能代表整体的一部分(100万网民中有一半是男性,另外一半是女性),即样本不是整体的全部,由此得出结论会有一定偏差,这个偏差就是由上述三种误差来源引起的。为了减小误差,可以增大样本量,比如再抽取100万个用户的数据再进行同样的计算。这样就可以使误差尽可能的小,最后达到可以忽略的地步。