【機械学習】バタイユゲームデータで史実の勝敗を予想(6)

つづき

11.色々なアルゴリズム

 機械学習には色々なアルゴリズムがある。主なものは、下記のWEBページに記載がある。

機械学習に知るべき10のアルゴリズム

その中から4つと、最近使われているLightGBMで勝敗を予想した。以下に結果を示す。

(1)モデルの性能評価

   最も性能が良いのは、サポートベクターマシンである。

  適合率再現率
モデル名称正解率勝ち引分負け勝ち引分負け
ロジスティク回帰0.85420.823510.91670.333310.7857
K近傍法0.72920.81480.428610.784710.5
サポートベクターマシン0.91670.8751110.66670.8571
決定木0.83330.77781110.16670.7857
LightGBM0.89580.8710.7510.96430.50.9286

(2)予想結果(ノーヴィ、シェンカーバン、キャトルブラ、モンサンジャン)

   最も予想結果が良いのは、サポートベクターマシン、決定木、LightGBMの3つである。

モデル名称ノーヴィ
(負け)
シェンカーバン
(引分)
キャトルブラ
(負け)
モンサンジャン
(負け)
ロジスティク回帰勝ち勝ち負け負け
K近傍法勝ち引分負け勝ち
サポートベクターマシン負け勝ち負け負け
決定木負け勝ち負け負け
LightGBM負け勝ち負け負け

(3)アルゴリズムの補足

 (A)ロジスティク回帰で、3分類の方法が分かったので、上記で使用した。

 (B)K近傍法は、Kの値を適切に決めるのが難しい。K=1なら過学習になり、Kが大きいと正解率が下がる。(上記ではK=2)

 (C)サポートベクターマシンは、特にパラメータを決める必要がなく、使い易い。

 (D)決定木は、木の深さを適切に決めるのが難しい。深いと過学習になり、浅いと正解率が下がる。(上記では深さ=3)

 (E)LightGBMは、色々なパラメータがあり、値を適切に決めるのが難しい。上記のモデルでは、ほぼ全て

   初期値を使い、イテレーションの回数=500だけ設定した。

 

次回へつづく

 

<個人的な感想>

 使い易く正解率の高いサポートベクターマシンが、今回の勝敗予想には適している。他は、パラメータの

設定が自分のような初心者には分かり難い。

 

<リンク>

ブログのトップページは、こちら

バタイユゲーム情報班のホームページは、こちら