【機械学習】画像認識の試行錯誤（４）

2019年8月6日2019年8月10日 by sberjisan66

つづき

５．CNN構造の変更

５．１　基本形

　　　基本形は、下図のように入力層、畳込み層（conv）×１、プーリング層（maxpool）×１、

全結合層（dense）×２、出力層から構成されている。

５．２　畳込み層とプーリング層の追加

　　基本形に畳込み層とプーリング層を追加した場合の正解率を調べることにする。

　なお、フィルタサイズ３×３、プールサイズ２×２は基本形と同じで、フィルタ数と

　プーリング層のドロップアウト率を変えてみた。

５．２．１　追加層が１つの場合

　　　フィルタ数は基本形の２倍の１９２とした。理由は、プーリング層によるデータ圧縮でデータサイズが

　　半分（６４画素から３１画素）になったので、それを補う為である（データ量では１／４だが・・・）。

ドロップアウト率に比例している訳ではない。以降はドロップアウト率０．２で試してみる。　

ドロップアウト率	０．２５	０．２	０．１
正解率	０．８０９２	０．８１５７	０．７３５５

５．２．２　追加層が２つの場合

　　　フィルタ数は上記の２倍の３８４とした。理由は、プーリング層によるデータ圧縮でデータサイズが

　半分（３１画素から１４画素）になったので、それを補う為である。

　ドロップアウト率に比例している訳ではない。畳込み層とプーリング層を追加しない方が正解率が良い。

ドロップアウト率	０．２５	０．１６６７	追加なし
正解率	０．７５９６	０．７７０８	０．８１５７

次回へつづく

＜個人的な感想＞

５．２．２のように、畳込み層とプーリング層を追加したら正解率が下がる事は予想外であった。

ディープラーニングと呼ばれるように、層が多いほど正解率が上がるものと思っていた。

＜リンク＞

ブログのトップページは、こちら

バタイユゲーム情報班のホームページは、こちら