快速导航 ×

我们什么时候该使用置信区间,预测区间以及公差区间 2015-01-01 22:05:47

我将涉及到置信区间,预测区间以及公差区间。因为公差区间是最鲜为人知的,我将用额外的时间去解释它们是如何工作的以及你何时需要用它们。

  什么是置信区间?


  
  置信区间是一个范围值,由样本统计量所构造的对总体参数的估计区间。因为它的随机性,不可能从一个给定总体的两个样本产生相同的置信区间。但是如果你重复构造置信区间很多次,得到的置信区间中有一定比例将包含总体参数真值。置信区间中包含总体参数真值的次数所占的比率称为置信水平。

  最常见的,你会用置信区间来约束均差或标准差,但你也可以得到它们的回归系数,比例,发生某种现象的概率,以及两个总体间的差异。

  假设你随机抽样灯泡且测量其燃烧时间。Minitab计算出95%的置信区间下灯泡可以燃烧1230-1265个小时。置信区间表明,你有95%的把握全部灯泡的使用时长的平均值会在这个区间里。

  置信区间只估计兴趣参数的抽样误差。(抽样误差是试图从样本估计总体特征时的固有误差。)因此,你应该知道这些重要的注意事项。

  当你扩大了样本容量,抽样误差减少,区间变窄。如果你将样本区间扩大到总体,就不会再有抽样误差。在这种情况下,置信区间宽度为0,等于真实的总体参数。

  置信区间只显示总体参数可能的范围,不显示每个数值的分布。

  在灯泡例子中,我们知道了均值可能在这个范围内,但是95%的置信区间并不表示将来观察值的95%将在这个范围内。我们需要使用不同的区间来得出那样的结论。

  什么是预测区间?

  预测区间是置信区间的一种,你可以用在线性和非线性模型的预测中。有两种使用模型方程的预测值的预测区间。

  预测的置信区间

  预测的置信区间是一个可能含有给定模型中对预测变量的指定设置做出平均反应的范围。和常规的置信区间一样,预测的置信区间显示了均值的范围的而不是每个数据点的分布。

  回到我们灯泡的例子中,假设我们设计了一个实验来测试不同生产方法(快或慢)和灯丝材料(A或B)影响燃烧时间的情况。我们拟合模型后,像Minitab这样的统计软件可以预测特定设置下的反应。我们要预测在快的生产方法和灯丝A型的情况下的平均燃烧时间。

  Minitab计算出预测的置信区间为1400-1450个小时。我们有95%的把握这个范围包括用这些设置制造的灯泡的平均使用时长。但是,这并没告诉我们每个灯泡燃烧时间的分布。

  预测区间

  预测区间是可能含有给定模型中针对预测量的给定设定中单个新的观察响应值的范围。

  我们将使用如上文的相同设定,Minitab计算出预测区间为1350-1500个小时。我们有95%信心,这个范围包含在这些设定情况下生产的下一个灯泡的燃烧时间。

  预测区间总是比相应的置信区间更宽,因为加入了关于单个响应而不是均值响应的不确定性。

  我们已经确认了哪里单个观察值可能会停止燃烧,但是我们需要一个模型来计算它。

  什么是公差区间?

  公差区间是可能含有指定比例的总体的范围。要得到公差区间,你必须指定总体的比例和置信水平。置信水平是区间实际涵盖总体比率的可能性。让我们看一个例子,因为这是最容易理解公差区间的方法。

  公差区间的例子

  灯泡制造商对他们的灯泡能使用多长时间感兴趣。分析师随机选取了100个灯泡,并在工作表中记录了燃烧时间。

  在Minitab软件中,转到统计>质量工具>公差区间。在数据下,选择在列样本。在文本框中输入时间。单击确定。(如果你还没使用它,请下载Minitab的30天免费试用,并一起操作!)

  
  正态检验表明我们的数据是正态分布的。因此,我们可以使用正态区间(1060 1435)。制造商有95%的把握至少95%的灯泡的使用寿命将在1060到1435个小时内。如果这个范围比其客户的要求宽,生产过程可能产生过多缺陷。

  比起置信区间,公差区间该如何工作

  置信区间的宽度完全是由抽样误差决定的。随着样本接近总体参数,置信区间的宽度接近0.
与此相反,公差区间的宽度是由抽样误差和总体的方差两方面决定的。随着样本规模接近整个总体,抽样误差减少并且估计百分比接近真实的总体百分比。

  为了确定95%的总体的使用寿命,Minitab计算了符合第2.5和第97.5的百分点(97.5-2.5)对应的数值。阅读这里获取关于百分比和总体比例的更多信息。

  不幸的是,因为我们是用的样本,估算百分比也会有错误。我们不能100%确定公差区间包含了特定比例。因此,公差区间也有置信水平。

  公差区间的使用
  
  总的来说,当你有一个样本数据并且想要预测一定范围内的可能结果时,你可以使用公差区间。

  在质量改善领域,六西格玛分析需要一段流程在特定限制下的测量数据结果(像使用时长,长度等)。在这个背景下,公差分析可以通过将客户的需求和总体特定比例的公差范围进行比较来观察更多的不合格。如果公差范围比客户需求要宽,就可能有更多的不合格产品。

  在Minitba统计软件的帮助下,会很容易为你的数据获得这些区间。你只需要知道每个区间提供了什么信息。