拟合优度R2是通过计算回归平方和在总平方和中的占比来衡量回归线对观测值拟合程度的统计量。其计算公式为R2=1-(回归平方和/总平方和)。R2值越接近1,表明回归线对数据的拟合程度越高,而R2值越小,则表示拟合效果越差,线性模型的解释能力越弱。
R2的含义不仅限于单个自变量,而是整体衡量因变量与所有自变量的综合关系。在MATLAB中,R2的计算公式为R=1-(回归平方和/总平方和),即回归模型能解释的因变量变异性的百分比。R的最大值为1,这表明回归模型能够完美地解释数据的变异。
在实际应用中,R2与回归误差和剩余误差有关。回归误差代表模型对数据的拟合质量,而剩余误差则衡量未被模型解释的变异。统计上,剩余误差与自由度n-2的商的平方根定义为估计标准误,虽然它也能反映拟合优度,但R2以其无量纲、范围明确(0-1)的优势,更常用于比较不同模型的拟合效果。
因此,R2作为评估线性模型拟合优度的重要指标,其直观性和可比性使其在数据分析中占据核心地位,而估计标准误作为补充,提供了更为详细的误差分析信息。
下载本文