【機械学習】バタイユゲームデータで史実の勝敗を予想(4)

つづき

8.特徴量の追加

 予想精度を上げる為に、戦いの年月日、戦場の位置(緯度、経度)を

追加してみた。位置はbattle of XXXX(戦いの名前)のwikiを参照し、

位置が明記されていない場合は、近くの都市位置を参照した。

(1)年と月だけの場合(日付は省略)

 ・入力データ例(機械学習には数値データに変換する必要があり、今回はEXCELにて変換した)

 ・フランス軍の勝ち予想

  特徴量の追加前に比べて混同行列、正解率とも良くなった。

   史実が勝ち以外の場合(20)> 予想が勝ち以外となったが14→15、 予想が勝ちとなったのが6→5

   史実が勝ちの場合(28)> 予想が勝ち以外となったのが3→1、 予想が勝ちとなったのが25→27

   正解率は81.25→87.5%、適合率は80.85→84.38%、再現率は89.29→96.43%と良くなった。

 ・フランス軍の負け予想

  特徴量の追加前に比べて混同行列、正解率とも良くなった。

   史実が負け以外の場合(20)> 予想が負け以外となったが32→33、 予想が負けとなったのが2→1

   史実が負けの場合(28)> 予想が負け以外となったのが5→4、 予想が負けとなったのが9→10

   正解率は85.42→89.58%、適合率は81.82→90.91%、再現率は64.29→71.43%と良くなった。

(2)年月日を全て入力した場合(日付を追加)

 ・入力データ例

 ・フランス軍の勝ち予想

  日付追加前と同じである。

 ・フランス軍の負け予想

  日付の追加前に比べて混同行列、正解率とも良くなった。

   史実が負け以外の場合(20)> 予想が負け以外となったが33→34、 予想が負けとなったのが1→0

   史実が負けの場合(28)> 予想が負け以外となったのが4→3、 予想が負けとなったのが10→11

   正解率は89.58→93.75%、適合率は90.91→100%、再現率は71.43→78.57%と良くなった。

次回へつづく

 

<個人的な感想>

 追加した特徴量の中で、次の2つは効果があると予想したが、日付も効果があるとは意外であった。

年 : 各国の軍隊の質(フランス軍ならロシア戦役の前と後で違う)を反映

月 : 戦いの季節(春夏秋冬)を反映

 

<リンク>

ブログのトップページは、こちら

バタイユゲーム情報班のホームページは、こちら