AI・機械学習ナレッジセンター
データ
特徴量エンジニアリング
解釈性
モデル
ハイパーパラメータ
バリアンス
このページの内容
バリアンス
機械学習(および統計学)におけるバリアンスとは、モデル予測の広がりを示す値のことです。
以下図においてバリアンスだけに着目すると、Low-VarianceとHigh-Varianceでは分布の広がりに変化があることがわかります。
__この広がりをバリアンス__と言います。
バリアンスの高いモデルは、訓練データのノイズまで学習してしまっている状態で、訓練データに含まれるデータは高い精度で予測できますが、訓練データに含まれない未知のデータについては正しく予測することができず実用的とは言えません。
この状態のことを 過学習( over-fitting )と言います。
バイアスとバリアンスの関係
前述の通りバリアンスが高すぎると、出来上がったモデルは過学習状態です。
そこで、バリアンスを下げようとすると、今度はバイアスが上がってしまいます。
この関係のことをバイアスとバリアンスはトレードオフといいます。
バイアスとバリアンスのトレードオフについて詳しくはこちらのブログを参照してください。
バイアスとバリアンスのトレードオフ