特徴量

特徴量とは?

特徴量とは、特徴 を数値化したものです。

例えば住宅価格を予測したいと考えた場合には、建物自体の特徴(建物の階数、床面積、築年数など)や建物以外の都道府県や市区町村、最寄駅の情報や最寄駅からの距離、築年数なども重要な 特徴 になります。

そして、最寄駅からの距離徒歩3分や築年数15年などを数値化したデータが 特徴量 です。

実際のデータを見てみましょう。
以下の画像において 価格 以外は 特徴量 です。これらの特徴量を 説明変数 といいます。
また、価格は予測したい変数ですので、この変数のことを 目的変数 といいます。
VARISTA Document Feature 001

もし、賃貸住宅の賃料などを人間が予測する場合には、不動産業界以外の方でも「駅から遠いと価格が落ちる」「築年数が古いと価格が落ちる」など感覚的に理解できることもあります。
そして、一般的には予測する人間が不動産業界の方の場合は、そうでない方よりもより広く深い知識を持っているケースが多いと考えられます。
広く深い知識を持っていると、予測する価格もより高い精度であるケースが多いことが想像できると思います。

このような知識のことをドメイン知識といい、機械学習モデルを作る上では非常に重要です。


VARISTAは機械学習モデルの開発、管理をノーコードで効率的に行うことができる新しいプラットフォームです。
データをお持ちでしたらすぐに始められますので、是非ともお試しください。

または

Made with
by VARISTA Team.
© COLLESTA, Inc. 2021. All rights reserved.