記事: 「なぜ深層学習は表形式データでツリーモデルに勝てないのか」を公開しました

画像認識や自然言語処理で圧倒的な成果を出してきた深層学習ですが、顧客データや売上データといったビジネスでよく使われる「表形式データ」では、XGBoostやLightGBMといったツリーモデルの方が高い精度を出すケースが多いのが現実です。

なぜこの逆転現象が起きているのか。その答えは「データの構造」にあります。深層学習は画像の空間的パターンや言語の文法的パターンのような内部構造を持つデータで真価を発揮しますが、表形式データにはそういった構造は存在しません。一方でツリーモデルは、多様な変数が混在する表形式データから条件付きルールを発見するのが得意なのです。

この「なぜ」を、データの構造の違いやXGBoost・LightGBMのアルゴリズムの仕組みを交えながら解説する記事を公開しました。

ぜひご覧ください。