【機械学習】画像認識の試行錯誤(4)

つづき

5.CNN構造の変更

5.1 基本形

   基本形は、下図のように入力層、畳込み層(conv)×1、プーリング層(maxpool)×1、

 全結合層(dense)×2、出力層から構成されている。

5.2 畳込み層とプーリング層の追加

  基本形に畳込み層とプーリング層を追加した場合の正解率を調べることにする。

 なお、フィルタサイズ3×3、プールサイズ2×2は基本形と同じで、フィルタ数と

 プーリング層のドロップアウト率を変えてみた。

5.2.1 追加層が1つの場合

   フィルタ数は基本形の2倍の192とした。理由は、プーリング層によるデータ圧縮でデータサイズが

  半分(64画素から31画素)になったので、それを補う為である(データ量では1/4だが・・・)。

   ドロップアウト率に比例している訳ではない。以降はドロップアウト率0.2で試してみる。 

ドロップアウト率0.250.20.1
正解率0.80920.81570.7355

 

5.2.2 追加層が2つの場合

   フィルタ数は上記の2倍の384とした。理由は、プーリング層によるデータ圧縮でデータサイズが

 半分(31画素から14画素)になったので、それを補う為である。

 ドロップアウト率に比例している訳ではない。畳込み層とプーリング層を追加しない方が正解率が良い。

ドロップアウト率0.250.1667追加なし
正解率0.75960.77080.8157

 

次回へつづく

 

<個人的な感想>

 5.2.2のように、畳込み層とプーリング層を追加したら正解率が下がる事は予想外であった。

ディープラーニングと呼ばれるように、層が多いほど正解率が上がるものと思っていた。

 

<リンク>

ブログのトップページは、こちら

バタイユゲーム情報班のホームページは、こちら