现在,我们想要测试线性回归函数的系数是否对因变量 (Calorie_Burnage) 有显着影响。
这意味着我们要使用统计测试来证明 Average_Pulse 和 Calorie_Burnage 之间存在关系。
有四个部分解释了系数的统计数据:
我们将重点了解本模块中的"P-value"。
P 值是一个统计数字,用于推断 Average_Pulse 和 Calorie_Burnage 之间是否存在关系。
我们测试系数的真实值是否等于零(没有关系)。对此的统计检验称为假设检验。
假设检验是一种统计程序,用于测试结果是否有效。
在我们的示例中,我们正在测试 Average_Pulse 和截距的真实系数是否等于 0。
假设检验有两个陈述。原假设和备择假设。
用数学的方式写成:
H0: Average_Pulse = 0
HA: Average_Pulse ≠ 0
H0: Intercept = 0
HA: Intercept ≠ 0
符号 ≠ 表示"not equal to"
原假设可以被拒绝,也可以不被拒绝。
如果我们拒绝原假设,我们就得出结论,Average_Pulse 和 Calorie_Burnage 之间存在关系。该结论使用 P 值。
P 值的常见阈值是 0.05。
笔记:P 值为 0.05 意味着有 5% 的时间我们会错误地拒绝原假设。这意味着我们承认,有 5% 的情况下,我们可能错误地缔结了一段关系。
如果 P 值低于 0.05,我们可以拒绝原假设并得出变量之间存在关系的结论。
然而,Average_Pulse 的 P 值为 0.824。因此,我们无法得出 Average_Pulse 和 Calorie_Burnage 之间的关系。
这意味着 Average_Pulse 的真实系数为零的可能性为 82.4%。
截距用于调整回归函数更精确地预测的能力。因此,解释截距的 P 值并不常见。
截取页面反馈部分,让我们更快修复内容!也可以直接跳过填写反馈内容!